F5 NGINX Gateway Fabric 2.4.0 新功能发布

news2026/4/30 15:47:35
原文作者Sean Moloney - F5 Product Manager原文链接 F5 NGINX Gateway Fabric 2.4.0 新功能发布转载来源NGINX 中文社区NGINX 唯一中文官方社区 尽在nginx.org.cn我们很高兴地宣布 F5 NGINX Gateway Fabric 2.4.0 已经发布。此次发布标志着 Gateway API 发展历程中的一个重要里程碑新增了关键的生产级特性如 TCP/UDP 路由支持、限流、会话保持等功能。这些新功能将帮助运维人员更高效、安全地交付 AI 和现代应用。本次发布的变更摘要2.4.0 版本包含许多新功能和改进概括来说包括•支持限流•支持 NGINX OSS 和 NGINX Plus 的会话保持Sticky Cookie包括更改负载均衡方法的能力•通过新的 ProxySettingsPolicy 支持代理缓冲未来将增加更多 NGINX 指令•TCP 路由和 UDP 路由•强化的 TLS Listener配置密码套件•支持 Multiple Inference Pool backends作为 Gateway API Inference Extension 的一部分附加功能•命名空间过滤只监视特定命名空间而不是整个集群减少大型集群中的资源消耗•自定义日志转义格式在自定义数据平面访问日志时指定转义格式•上游 Keep-Alive 默认启用配置为 16 个连接以减少连接开销可通过 UpstreamSettingsPolicy CRD 进行配置•CRD 发现改善了与运行较旧 Gateway API 版本的集群的兼容性Bug修复•数据平面稳定性修复了当控制平面重启时导致数据平面不必要重启的问题•内存优化代理收集器日志现在写入 stdout 而不是磁盘从而解决了内存消耗问题接下来将深入探讨这些重要功能并解释它们为何对我们的用户至关重要。限流限流对于 API 网关场景至关重要通常是开发者在构建和部署 API 时实施的首个保护措施。通过新的 RateLimitPolicy API您可以将限流以 Kubernetes 策略的形式声明并直接应用到您的路由上。这将 NGINX 强大的限流能力引入 Gateway API 工作流中避免了手动配置 NGINX 或使用自定义 annotation 的麻烦。通过简单的版本控制策略保护您的服务免受流量激增的影响防止滥用并确保资源的公平分配。为什么重要限流对于部署 API 网关的团队至关重要。它确保了在流量激增时服务的稳定性有助于缓解 DDoS 攻击并保护后端系统免于过载。通过控制请求量组织能够保持可预测的性能并为用户提供可靠的体验。此外GPU 配额昂贵且常常稀缺。与可以弹性扩展的 CPU 工作负载不同推理能力受限于硬件的可用性和成本。限流通过防止任何单个客户端独占高性能计算资源并确保最重要的工作负载获得足够的 GPU算力从而保护该投资。适用对象· 需要强制执行使用配额的多租户环境管理的平台团队· 保护服务免受恶意或异常客户端访问的 API 开发人员· 为体量攻击添加防御的安全工程师· 设计需要保证资源交付的高性能推理应用的 MLOps/AI 工程师· 管理 GPU 成本的基础设施团队需要防止来自单个客户端或服务的无限制消耗会话保持 — 通过 UpstreamSettingsPolicy CRD 支持 OSS 与 Plus尽管 NGINX Gateway Fabric 已经支持基本的会话保持功能但您现在可以配置更精细的基于 Cookie 的会话保持。这是此次发布中新增的另一个重要功能。我们再次利用 NGINX 在 Kubernetes 部署中的强大功能以确保不会出现会话丢失问题。此次发布为 NGINX OSS 和 NGINX Plus 用户引入了灵活的会话保持选项•IP HashOSS Plus通过 UpstreamSettingsPolicy 配置 ip_hash将客户端根据其 IP 地址被路由到相同的后端•基于 Cookie 的会话保持仅限 Plus在 HTTPRoute 和 GRPCRoute 规则中启用 sessionPersistence以获得更精确的基于 Cookie 的会话亲和性实验性功能为什么重要会话保持通常称为“粘性会话”确保来自同一客户端的请求始终被路由到相同的后端服务器。这对于那些将会话状态存储在本地的应用程序至关重要例如购物车、身份验证流程或多步骤表单。如果没有会话保持当请求落在不同后端时用户可能会遇到数据丢失或工作流中断。对于 AI 工作负载会话亲和性还可以减少浪费的 GPU 计算周期。当请求分散到不同的后端时每个实例可能需要重建上下文或重新加载模型状态。保持会话的粘性可以避免这种冗余计算更有效地利用昂贵的 GPU 时间。这对于减少“上下文膨胀”或因频繁重新加载工具描述或其他元数据而导致的令牌过度消耗也起着至关重要的作用这些操作通常在新会话开始时发生。适用对象· 确保购物车内容在用户会话期间保持不变的电商团队· 构建依赖本地会话存储的有状态服务的应用开发人员· 将传统有状态应用迁移到 Kubernetes 的平台工程师· 运行对话式 AI 或其他需要在多轮交互中维持上下文的长上下文窗口应用的团队身份验证过滤器Basic Auth版本 2.4.0 标志着 NGINX Gateway Fabric 身份验证功能的开始。新的 AuthenticationFilter 引入了对 HTTP Basic Auth 的支持使您能够使用用户名和密码凭证保护路由无需外部身份提供者。尽管 Basic Auth 是最简单的身份验证方法之一但它在内部工具、开发环境以及需要轻量级保护的场景中仍然具有价值。这仅仅是一个开始未来的版本将扩展 AuthenticationFilter加入 NGINX 提供的其他身份验证方法。为什么重要Basic Auth 提供了一种快速、低摩擦的方式来保护路由当简洁性比高级安全功能更重要时尤其有用。将此功能内置于 Gateway API 意味着少了一个需要部署和管理的工具。适用对象· 保护内部仪表盘和管理端点的 DevOps 团队· 在不使用复杂身份验证设置的情况下保护预发布环境和测试环境的开发人员· 在实施企业单点登录之前需要轻量级方案的平台工程师TCP 路由和 UDP 路由NGINX Gateway Fabric 现在支持 TCPRoute 和 UDPRoute resource将 Gateway API 的能力从 HTTP/HTTPS 扩展到第 4 层流量。这使您可以通过同一个网关代理非 HTTP 工作负载例如数据库PostgreSQL、MySQL、Redis、DNS 服务器、消息队列以及 IoT 协议。为什么重要现代平台通常同时运行 HTTP API 和非 HTTP 服务。如果没有第 4 层支持团队就必须为 TCP/UDP 工作负载部署独立的负载均衡器或 Ingress 解决方案。有了 TCPRoute 和 UDPRoute您可以将流量管理整合到统一的 Gateway API 工作流中从而简化运维并减少基础设施分散。适用对象· 通过网关暴露 PostgreSQL、MySQL 或 Redis 的团队· 路由流量到 IoT 设备的平台团队· 路由流量到向量数据库、模型注册表或自定义推理协议的团队Gateway API Inference Extension本次发布新增对多个 Inference Pool 后端的支持作为 Gateway API Inference Extension 的一部分。借助此功能单个 HTTPRoute 现在可以在其 backendRefs 中引用多个 InferencePool从而实现模型变体的流量拆分、新模型版本的分阶段发布以及跨 Pool 的路由以进行容量管理。为什么重要实际推理部署很少只涉及单一同质化 Pool。团队通常需要在不同模型版本之间路由、在微调的 LoRA adapter 之间拆分流量或在不同容量等级之间分配负载。在单条路由支持多个 Pool 不仅消除了繁琐的变通做法也使 NGF 更贴合生产环境的推理模式。由于 GPU 成本在 AI 基础设施预算中占比极高跨推理池的智能路由对于提升利用率和控制开销变得至关重要。适用对象· 在生产环境中管理多个模型版本或 LoRA adapter 的 ML 团队· 为推理服务实施金丝雀或蓝绿发布的平台工程师· 在不同容量等级间优化 GPU 利用率的基础设施团队总结与展望本次发布增强了 F5 NGINX Gateway Fabric 作为生产级 Gateway API 实现的能力增加了对关键用例的支持包括限流、会话保持、代理缓冲器配置、TCP/UDP 路由和 TLS Listener 配置。这些增强功能使运行高吞吐量的生产级应用更加容易同时在负载下保持可靠性。展望下一次发布我们将继续扩展身份验证功能包括额外的安全特性同时保持与 Kubernetes Gateway API 的规范一致。由于 GPU 分配价格昂贵且供应有限而 GPU 分配对突发且可能需要更长上下文能力的 AI 推理工作负载仍然是挑战因此保护、管理和高效路由推理流量的能力已经成为必需能力。我们要对以下贡献表示衷心感谢•通过 SnippetsPolicy 在网关级别支持 Snippets#4461。感谢 fabian4 的实现。•支持 TCPRoute 和 UDPRoute#4518。感谢 Skcey 推动此能力使 NGINX Gateway Fabric 在第 4 层用例上更适合企业级使用。•数据平面访问日志可配置的转义格式#4530。感谢 michasHL 的增强贡献。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2545966.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…