微软全新开源的Agentic Web网络项目:NLWeb,到底是什么 ?

news2025/5/23 16:22:12

目录

1、背景

2、NLWeb是什么?

3、NLWeb是如何工作的?

3.1 技术原理

3.2 对发布者的价值

3.3 核心团队与合作伙伴

4、快速入门指南

5、延伸阅读


Agentic:Agent的形容词,Agentic指系统由大型语言模型(LLM)或其他自治系统驱动的自主程度。

NLWeb:Natural Language Web(自然语言网络)的缩写,该项目旨在简化网站自然语言交互界面开发,轻松将任意网站转化为具备 AI 功能的智能应用平台。

1、背景

2025年5月20日,微软Build大会上,CEO Satya Nadella展示了如何构建开放的智能代理网络的(agentic web),目标是帮助每一位开发者构建能够赋能全球各地的人们和组织的应用程序和Agents。整体宣布了5个大事件(其中4个与Agent相关):

  • Coding agent:我们将GitHub Copilot从“配对程序员”升级为“同行程序员”。现在,您拥有一个直接集成在GitHub中的完整编程智能代理。您可以为它分配任务——无论是修复漏洞、开发新功能,还是持续的代码维护。它将自主完成这些任务。

  • Copilot调优:Copilot现在可以学习您公司独特的语气和语言风格。这主要是将您作为公司所拥有的专业知识进一步放大,以便每个人都能使用。

  • Agent factory:Foundry是用于构建应用程序和智能代理的完整应用平台。我们正在增加对Grok、Hugging Face、Meta、Mistral等更多模型的支持。此外还包括:Azure AI搜索中的智能代理检索功能、Foundry智能代理服务以及与Copilot Studio的集成等。

  • NLWeb是一个新的开放项目, 在代理网络中扮演着与 HTML 类似的角色,旨在简化网站的自然语言界面的创建,从而使任何网站易于将任何网站变成AI-Power的应用程序

  • 微软发现(Microsoft Discovery):企业代理平台,将整个技术栈整合在一起,以加快科学发现的速度。发现工具使用Agents生成想法、模拟结果并进行学习。一个很好的例子是这种有希望成为冷却剂的候选物质,它不依赖于持久性化学品(科学家研究领域范畴)。



2、NLWeb是什么?

为网站构建会话界面是很困难的,NLWeb 试图让网站更容易做到这一点。

「NLWeb 允许用户使用自然语言与任何网站进行交互。我们可以把它想象成智能体化 web 世界的 HTML。」

NLWeb 是由微软开发的一个开放项目,旨在让网站能够轻松地使用其选择的模型和自有数据创建丰富的自然语言界面。目标是让 NLWeb成为将网站高效转化为 AI 应用的最快捷、最简便的方法,让用户能够像使用 AI 助手或 Copilot 一样,直接使用自然语言查询网站内容。



由于 NLWeb 原生支持 MCP,因此人类和智能体可以使用相同的自然语言 API。MCP 是一种新兴的协议,用于聊天机器人和 AI 助手与工具交互。每个 NLWeb 实例本身也是一个 MCP 服务器,它支持一个核心方法 ask,该方法用于以自然语言的方式向网站提出问题。返回的响应利用了 schema.org,这是一个广泛使用的描述 Web 数据的词汇表。

简单来说,MCP 与 NLWeb 的关系就像 Http 与 HTML 的关系一样。作为一个开放协议和相关开源工具的集合,NLWeb 主要目标是为 AI Web 构建一个基础层 —— 就像 HTML 彻底革新了文档共享一样。

一直以来,开发能够用自然语言与应用程序乃至整个计算机世界进行自由对话的智能体一直是 AI 革命的核心。然而,当前大多数新型交互都被 ChatGPT、Claude 甚至必应等产品垄断。这些机器人汲取海量知识却不产生实质价值。而 NLWeb 相比传统搜索要便宜得多,且使用起来非常方便,仅需几行代码、任选 AI 模型(OpenAI 、DeepSeek、Gemini、Anthropic、Inception 等),并输入特定数据,NLWeb 就能为用户提供对话式交互界面(即一个文本框加提交按钮)。



比如:Eventbrite公司(美国一个活动管理和在线票务平台),面相用户的搜索场景,基于NLWeb升级前后的交互对比。

升级前:传统搜索交互

  • 构建传统搜索引擎,按条件搜索。



升级后:NLWEB自然语言交互

  • 自然语言输入:I'm in Seattle for a tech conference. Are there any geeky events I might enjoy?(译:我在西雅图参加一个技术会议。有什么我可能喜欢的极客活动吗?)



还有很多类似的场景,比如零售商可以使用 NLWeb 创建一个聊天机器人,帮助用户选择特定行程的服装;而烹饪网站则可以使用它来构建一个根据菜谱推荐合适菜肴的智能体。

回想以前,研究者为了建立一个网络搜索索引,需要爬取整个网络并创建一个包含它的索引。这对于搜索引擎和相关网站来说都是昂贵的。但有了 NLWeb 后,事情就变得简单了,比如你可能只需要获取一个 RSS 源,然后把它放到一个矢量数据库中,就可以运行了。此外,NLWeb 还可以调用廉价模型,而且整个过程快速且简便。

RSS 源是一种基于XML格式的数据源,用于发布和订阅网站内容的更新。通过RSS 源,用户可以方便地获取最新信息,而无需频繁访问网站。RSS应用在国外已经非常普遍,从个人博客(Blog)栏目、企业站点到世界级的门户都提供基于RSS的服务。

3、NLWeb是如何工作的?

微软的目标是将人工智能改变人们搜索方式的优势直接带到网站本身。正如 HTML 的出现让几乎任何人都能轻松创建网站一样,微软希望 NLWeb 能够让任何网络发布者都能轻松地为其网站打造智能、自然的语言体验。NLWeb 可以在智能体网络中扮演与 HTML 类似的角色,它允许用户以更丰富的语义方式直接与 Web 内容进行交互。

随着智能体网络的持续增长,NLWeb 将赋能网络发布者,使其能够按照自己的意愿参与其中,确保他们的网站能够随时进行互动、交易,并被其他智能体发现(如果他们选择的话)。



3.1 技术原理

NLWeb通过整合以下要素实现自然语言交互:

  1. 结构化数据支持:在实现方面,NLWeb 利用 Schema.org、RSS 等半结构化格式以及网站已发布的其他数据,并将它们与 LLM 驱动的工具相结合,创建可供人类和 AI 智能体使用的自然语言界面。

  2. LLM增强:NLWeb 系统通过整合来自底层 LLM 的外部知识(例如将地理洞察叠加到餐厅查询中)来增强这些结构化数据,从而提供更丰富的用户体验。

  3. 技术中立架构:作为一个开放项目,NLWeb 的技术无关性很强。它支持所有主流操作系统(Windows、MacOS、Linux),并允许开发者选择最符合自身需求的组件,同时支持所有主流模型和矢量数据库。

  4. 代理兼容性:提供人类与AI代理均可使用的统一接口。



3.2 对发布者的价值

  • 降低AI应用门槛:如同HTML简化网站建设,NLWeb让自然语言交互部署变得简单

  • 参与智能体经济:通过MCP协议自主控制网站内容在智能体网络中的可见性与交互方式

  • 数据主权保障:发布者完全掌控使用的模型、数据存储及服务扩展方式



3.3 核心团队与合作伙伴

  • 技术领袖:由RSS、RDF和Schema.org标准的创建者R.V. Guha主导开发

  • 早期采用者:芝加哥公共媒体、Eventbrite、Shopify、Tripadvisor等已部署测试

  • 技术生态伙伴:包括Milvus、Qdrant等向量数据库开发商



4、快速入门指南

访问NLWeb GitHub仓库获取:

  1. 核心服务代码:处理自然语言查询的轻量级服务框架

  2. 连接器套件:主流模型(如GPT-4、Claude)和向量数据库的预置接口

  3. 数据工具包:支持Schema.org、JSONL、RSS等格式的数据注入工具

  4. 前端模板:包含Web服务器前端及简易查询界面的开箱即用方案



5、延伸阅读

【完整版】微软Build 2025主题演讲 | 萨提亚·纳德拉_哔哩哔哩_bilibili

GitHub - microsoft/NLWeb: Natural Language Web

https://news.microsoft.com/build-2025-book-of-news/zh/#main

https://news.microsoft.com/source/features/company-news/introducing-nlweb-bringing-conversational-interfaces-directly-to-the-web/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2384006.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Idea出现 100% classes 等

总是误点出来,每次又忘了怎么消除,在这里记录一下。 出现这样: 操作idea界面的:点击View->Tool Windows ->Coverage,然后关掉

【学习笔记】计算机操作系统(五)—— 虚拟存储器

第五章 虚拟存储器 文章目录 第五章 虚拟存储器5.1 虚拟存储器概述5.1.1 常规存储管理方式的特征和局部性原理5.1.2 虚拟存储器的定义和特征5.1.3 虚拟存储器的实现方法 5.2 请求分页存储管理方式5.2.1 请求分页中的硬件支持5.2.2 请求分页中的内存分配5.2.3 页面调入策略 5.3 …

乘最多水的容器 | 算法 | 给定一个整数数组。有n条垂线。找出其中的两条线,使得它们与 x 轴共同构成的容器可以容纳最多的水。

在我们日常生活中,蓄水似乎是一个极为朴素的物理行为:两堵墙之间,注入水,看谁能装得更多。可如果换个角度,从算法的视角去看这个问题,它会变得怎样?你是否意识到,这样一个简单的问题…

【Java高阶面经:数据库篇】19、分库分表查询困境:无分库分表键时的高效应对

一、分库分表下的无分片键查询困境 在分布式数据库架构中,分库分表通过分片键(如买家ID)将数据分散存储,显著提升了单表性能和系统扩展性。然而,当业务需要从非分片键维度(如卖家ID)进行查询时,传统架构暴露出以下核心问题: 1.1 跨分片扫描的性能灾难 数据分散性:以…

spring中的BeanFactoryAware接口详解

一、接口定义与核心作用 BeanFactoryAware 是 Spring 框架提供的一个回调接口,允许 Bean 在初始化阶段获取其所属的 BeanFactory 实例。该接口定义如下: public interface BeanFactoryAware {void setBeanFactory(BeanFactory beanFactory) throws Bea…

Unity Hub打不开项目一直在加载

Unity Hub打不开项目,一直在加载。 运行环境:win10 解决方法:退还个人许可证,退出UnityHub重新登录后,再次获取个人许可证 Tips: 国内连续超过三天不登陆就需要激活一次。(每天登陆一次会自动续时间吗&…

蓝桥杯19681 01背包

问题描述 有 N 件物品和一个体积为 M 的背包。第 i 个物品的体积为 vi​,价值为 wi​。每件物品只能使用一次。 请问可以通过什么样的方式选择物品,使得物品总体积不超过 M 的情况下总价值最大,输出这个最大价值即可。 输入格式 第一行输…

ElasticSearch导读

ElasticSearch 简介:ElasticSearch简称ES是一个开源的分布式搜素和数据分析引擎。是使用Java开发并且是当前最流行的开源的企业级搜索引擎,能够达到近实时搜索,它专门设计用于处理大规模的文本数据和实现高性能的全文搜索。它基于 Apache Luc…

【机器学习】 关于外插修正随机梯度方法的数值实验

1. 随机梯度下降(SGD) 迭代格式: x k 1 x k − η k ∇ f i ( x k ) x_{k1} x_k - \eta_k \nabla f_i(x_k) xk1​xk​−ηk​∇fi​(xk​) 其中, η k \eta_k ηk​ 为步长(可能递减), ∇ f…

结构型:组合模式

目录 1、核心思想 2、实现方式 2.1 模式结构 2.2 实现案例 3、优缺点分析 4、适用场景 1、核心思想 目的:将总是在重复、迭代地显示的某种自相似性的结构(部分与整体结构特征相似),例如树形结构,以统一的方式处…

windows 删除文件夹提示“操作无法完成,因为其中的文件夹或文件已在另一程序中打开”

windows 删除文件夹提示“操作无法完成,因为其中的文件夹或文件已在另一程序中打开” tomact已经关闭了,刚开始怀疑是tomcat关闭不彻底,但是任务管理器–》进程里根本没有java的进程了,由于是医院服务器、不方便重启 解决方法&am…

微信小程序中,解决lottie动画在真机不显示的问题

api部分 export function getRainInfo() {return onlineRequest({url: /ball/recruit/getRainInfo,method: get}); }data存储json数据 data:{rainJson:{} }onLoad方法获取json数据 onLoad(options) {let that thisgetRainInfo().then((res)>{that.setData({r…

Wireshark 抓包工具使用

1.下载地址 https://2.na.dl.wireshark.org/win64/ 或者 Wireshark Go Deep 2.安装并打开 3.电脑设置热点,手机连接热点 4.手机发起网络请求,工具上选择WLAN。或者本地连接 5.点击查看抓包数据,过滤。最好用发送端ip过滤,s…

大语言模型(LLM)本身是无状态的,怎么固化记忆

大语言模型(LLM)本身是无状态的,无法直接“记住”历史对话或用户特定信息 大语言模型(LLM)本身是无状态的,无法直接“记住”历史对话或用户特定信息,但可以通过架构改进、外部记忆整合、训练方法优化等方案实现上下文记忆能力。 一、模型内部记忆增强:让LLM“记住”…

JUC入门(六)

12、四大函数式接口 Consumer<T>&#xff08;消费者接口&#xff09; 源码 功能 接收一个参数T&#xff0c;不返回任何结果。主要用于消费操作&#xff0c;例如打印日志、更新状态等。 使用场景 遍历集合并执行操作。 对象的字段赋值。 代码示例 import java.util.…

window xampp apache使用腾讯云ssl证书配置https

下载腾讯云ssl证书&#xff1a; 编辑Apache根目录下 conf/httpd.conf 文件&#xff1a; #LoadModule ssl_module modules/mod_ssl.so和#Include conf/extra/httpd-ssl.conf&#xff0c;去掉前面的#号注释。 编辑Apache根目录下 conf/httpd-ssl.conf 文件&#xff1a; <Vi…

逆向音乐APP:Python爬虫获取音乐榜单 (1)

1. 引言 在数字音乐时代&#xff0c;许多平台如音乐有榜单&#xff0c;限制非付费用户访问高音质或独家内容。然而&#xff0c;从技术研究的角度来看&#xff0c;我们可以通过逆向工程和Python爬虫技术解音乐的API接口&#xff0c;获取付费音乐的播放链接。 2. 技术准备 在当…

支持向量存储:PostgresSQL及pgvector扩展详细安装步骤!老工程接入RAG功能必备!

之前文章和大家分享过&#xff0c;将会出一篇专栏&#xff08;从电脑装ubuntu系统&#xff0c;到安装ubuntu的常用基础软件&#xff1a;jdk、python、node、nginx、maven、supervisor、minio、docker、git、mysql、redis、postgresql、mq、ollama等&#xff09;&#xff0c;目前…

idea常用配置 properties中文输出乱码

propertis配置中文乱码 源码和编译后的都是中文 程序输入效果 idea配置3处 程序输出效果 自定义注释模板 IDEA 中有以下两种配置模板。 File and Code Templates Live Templates File and Code Templates File and Code Templates 用来配置文件和代码模板&#xff0c;即…

day1 大模型学习 Qwen系列学习

Qwen 模型学习笔记:RM、SFT 与 RLHF 技术解析 一、Qwen 模型概述 Qwen 是阿里巴巴开源的大型语言模型系列,旨在实现通用人工智能(AGI)。其架构包括基础语言模型(如 Qwen-7B、Qwen-14B、Qwen-72B)和经过后训练的对话模型(如 Qwen-Chat)。后训练主要通过 SFT 和 RLHF 技…