浅聊一下，大模型应用架构 | 工程研发的算法修养系列（二）

大模型应用架构基础

AI应用演进概述

人工智能应用的发展经历了多个关键阶段，每个阶段都代表着技术范式的重大转变。

大语言模型基础

大语言模型(LLM)作为现代AI应用的核心组件，具有独特的技术特性和能力边界，理解这些基础对架构设计至关重要。

AI应用架构挑战

现代大语言模型(LLM)尽管强大，但在构建实用AI应用时仍面临多重架构挑战：

这些挑战催生了RAG(知识增强)、Agent(决策与执行增强)和MCP(功能扩展)等架构模式，共同构建起突破LLM原生局限的现代AI应用架构体系。

现代AI应用架构框架

现代AI应用架构融合多种技术组件，形成一个多层次、模块化的框架，以克服大语言模型的固有局限。这一架构框架由以下关键层次构成：

后续章节将深入探讨RAG、Agent和MCP三大核心技术，揭示它们如何各自解决特定挑战，并协同工作构建完整、强大的AI应用生态系统。

RAG

RAG技术概述

基本概念

RAG（Retrieval-Augmented Generation，检索增强生成）是一种结合检索(Retrieval)和生成(Generation)的AI技术框架。它通过从外部知识库中检索相关信息，补充大语言模型的知识，从而生成更准确、更可靠的回答。

目前大部分的AI聊天界面在输入框下方可以选择"深度思考"或"联网搜索"，"联网搜索"其实就是一种RAG，解决了模型内部知识过时或缺失的问题，提升了回答的时效性和广泛适用性。

使用RAG，可以解决以下问题：

知识更新问题：大模型的知识在训练后就固定了，无法获取最新信息。RAG可以通过连接外部、实时更新的知识源解决这一问题。

模型幻觉：大模型容易生成看似合理但实际不正确的信息。RAG通过提供事实依据，大幅减少了幻觉问题。

专业知识深度：针对专业领域知识，RAG可以连接专业资料库，提供更深入的回答。

透明度与可追溯性：RAG可以提供信息来源，使回答更加可验证。

知识私有化：企业可以将内部知识库与RAG结合，实现基于专有资料的问答能力。

核心组件

RAG系统的核心组件包括：

文档处理系统 (Document Processing System)

作为RAG流程的起点，负责将原始文档转换为适合检索的格式。主要功能包括文档清理、分块(Chunking)、元数据提取和文本标准化。常用工具包括LangChain的Document Loaders、LlamaIndex的Node Parsers，以及针对特定文档类型的处理器如Unstructured和PyPDF2。对于轻量级应用，可以使用NLTK或spaCy构建基础处理流程。

嵌入模型 (Embedding Model)

负责将文本转换为密集向量表示，是语义检索的基础。主流选项包括OpenAI的text-embedding-ada系列、Cohere的Embed模型，以及开源选项如BAAI/bge-large和Jina AI的jina-embeddings。模型选择需要平衡语义理解能力、维度大小和计算效率，同时考虑应用场景的语言和领域特点。

向量存储 (Vector Store)

负责管理文档向量并提供高效的相似度搜索能力。企业级选项包括Pinecone(全托管服务)、Weaviate(支持混合搜索)和Milvus(高吞吐量分布式系统)。开发环境可选择Chroma DB(易于集成)、FAISS(高性能本地索引)或Qdrant(自托管选项)。

检索增强系统 (Retrieval Augmentation System)

负责优化查询处理和结果筛选，包括查询改写、混合检索策略和结果重排序。常见技术包括HyDE(Hypothetical Document Embeddings)、重排序模型(如Cohere Rerank)、语义路由和多查询扩展。这一层通常需要根据业务需求整合多种检索方法，以提高结果的相关性。

生成模型 (Generative Model)

接收用户查询和检索到的上下文，生成连贯、准确的回答。主流选项包括OpenAI的GPT-4、Anthropic的Claude系列和Cohere的Command系列。开源替代方案包括Mistral、Llama 3和DeepSeek等。

回答后处理系统 (Post-processing System)

回答后处理系统负责验证生成内容的质量，包括事实性检查、引用验证、格式化和输出转换。这一组件确保最终回答符合业务标准，可能包括幻觉检测、敏感内容过滤和自动校正等机制，是保障RAG系统可靠性的重要环节。

下图展示了以上组件的是如何交互：

基于LangChain快速搭建RAG

LangChain是一个用于开发大语言模型(LLM)驱动应用程序的开源框架，它简化了将LLM与外部数据源和环境连接的过程，旨在帮助开发人员构建基于大语言模型的端到端应用程序。它提供了一套工具和组件，让开发者能够创建复杂、交互式的AI应用，如聊天机器人、问答系统、内容生成器等。

https://python.langchain.com/docs/introduction/

关键代码示例

基础的RAG流程如下，示例代码仅展示核心功能，实际应用时需要针对每一步进行调优。

▶文档预处理

文档读取

def read_word_document(file_path):    doc = docx.Document(file_path)    paragraphs = [para.text.strip() for para in doc.paragraphs if para.text.strip()]    return "\n".join(paragraphs)  # 合并段落，形成完整文本

文本分块

简单的字符分块可能会切断语义完整的内容，并且没有考虑文档结构和特定领域知识，实际使用需要按需调整。

def split_text(text, chunk_size=100, chunk_overlap=10):    text_splitter = RecursiveCharacterTextSplitter(        chunk_size=chunk_size, chunk_overlap=chunk_overlap, separators=["\n", "。", "？", "！"]    )    return text_splitter.split_text(text)

嵌入模型选择

def load_embedding_model(model_name="moka-ai/m3e-base"):    # 先下载模型（首次运行需联网）    embeddings = HuggingFaceEmbeddings(        model_name="moka-ai/m3e-base",  # Hugging Face 仓库路径        model_kwargs={"device": "cpu"},  # 可选 GPU 加速        encode_kwargs={"normalize_embeddings": True}  # 归一化向量    )    return embeddings

向量生成与存储

本地部署选择FAISS (Facebook AI Similarity Search)。对于大规模部署，可考虑Milvus或Pinecone等向量数据库。

FAISS是Facebook开源的向量相似度搜索库，维护成本低，部署复杂度低。支持纯本地部署无需额外服务；内存占用小，性能优秀；支持多种索引类型。

https://github.com/facebookresearch/faiss

from langchain_community.vectorstores import FAISS
def store_to_vector_db(docs, db_path="faiss_index"):    embeddings = load_embedding_model()    vector_db = FAISS.from_documents(docs, embeddings)    vector_db.save_local(db_path)

▶知识召回

向量检索

def search_similar_texts(query, vector_db, top_k=3):    results = vector_db.similarity_search(query, k=top_k)    return [r.page_content for r in results]

关键词检索（BM25）

def fulltext_search(query):    conn = sqlite3.connect(DB_FILE)    cursor = conn.cursor()    data = " OR ".join(jieba.cut(query))    cursor.execute("SELECT ori, bm25(documents) AS score FROM documents WHERE content MATCH ? ORDER BY score DESC LIMIT 3", (data,))    results = cursor.fetchall()    conn.close()    data = [item[0] for item in results]    return data

混合检索策略

下方示例仅对多种召回方式的结果简单合并，实际应用需要进行进一步优化，例如结果去重、排序融合、重排序等。

def query_knowledge_base(user_query, index_path="faiss_index"):    keyword_results = fulltext_search(user_query)    vector_results = search_word_vector(user_query, load_vector_db(index_path))    return vector_results + keyword_results   # 仅简单合并结果

▶内容生成

模型接入

使用Ollama本地部署大模型。

Ollama是一个开源工具，允许用户在本地设备上运行大型语言模型。

https://ollama.com/

计算内存需求的基本公式为：VRAM = 参数量(B) × 精度系数 × (1+开销系数)。

FP16精度为2字节/参数，INT8为1字节，INT4/Q4为0.5字节。例如，RTX 4060 Ti（16GB）可流畅运行7B-8B的FP16模型。

答案生成

def generate(prompt: str, model: str = "deepseek-r1:1.5b", stream: bool = False) -> str:    url = "http://localhost:11434/api/generate" # ollama默认端口    payload = {        "model": model,        "prompt": prompt,        "options": {            "temperature": 0.7,  # 控制生成随机性             "num_predict": 8192  # 最大生成长度        }    }    response = requests.post(url, json=payload)    return response.json()["response"]

图形界面

如果已有支持RAG的API接口，需要快速生成Web界面原型，可以使用v0快速完成前端开发，进行功能验证。

v0是Vercel推出的一款AI驱动的界面生成工具，它允许用户通过自然语言描述来创建精美的React网页界面和组件，并且支持实时预览。

支持RAG的开发平台

目前有非常多的一站式平台支持RAG，无需编码即可使用。

但如果有额外诉求或希望进一步提高召回性能，类似上文提到的Langchain自建具有更好的灵活性。

AI界面平台（Open WebUI）

Open WebUI是一个可扩展、功能丰富且用户友好的自托管网页界面，旨在为各类大语言模型提供类似ChatGPT的交互体验。适合个人开发者、研究人员和小型团队，尤其是那些希望在本地部署和使用LLMs的用户，适合需要灵活的本地大模型交互界面的用户（Open WebUI 没有官方托管平台，需要用户自行私有部署）。

https://www.openwebui.com/

部署完成后只需要两步即可体验RAG功能：

添加知识库，这里导入一个"RAG技术介绍与应用.txt"的文件到"测试知识库"。

在输入框使用"#"选择已经创建的知识库"测试知识库"，然后输入问题即可使用知识库。

LLM应用开发平台（Dify、n8n、Coze等）

适合企业级AI应用开发团队、需要构建完整知识库应用的业务部门，以及追求系统性AI解决方案的组织。

本文以Dify为例，Dify是一款开源的大语言模型(LLM)应用开发平台，融合了后端即服务(BaaS)和LLMOps的理念，使开发者可以快速搭建生产级的生成式AI应用。它提供了丰富的召回模式、跨知识库检索、工作流编排等企业级功能，具有较好的可拓展性和完善的前端界面，适合构建复杂的AI应用系统。（直接使用Dify官方托管平台，无需私有化部署）

在Dify平台中实现RAG功能非常便捷，整个过程可以简化为以下几个步骤：

数据准备，上传知识库文档，支持包括PDF、Word、Excel等多种常见格式。

检索配置，系统会自动对上传的文档进行向量化处理，不过其分块效率并非总是理想的。

ChatFlow配置，选择官方提供的"知识库+聊天机器人"，在知识检索选择刚才创建的知识库。

应用集成，通过简单的API调用或可视化界面配置，即可将RAG功能集成到您的应用中。

Agent

Agent技术概述

基础概念

Agent在计算机科学和人工智能领域中，通常指的是一种能够自主执行任务的软件实体。它们可以感知环境、做出决策并采取行动，以实现特定的目标。

拥有以下特点：

技术上，Agent通常采用ReAct（Reasoning+Acting）范式，即思考-行动-观察循环，或基于语言反馈的强化学习框架。每个行动步骤都通过提示工程驱动LLM生成结构化输出，实现与工具的交互并处理返回结果。

核心组件

推理引擎(LLM)：作为中枢决策单元，负责理解、规划和生成行动
工具集(Tools)：预定义的API接口，扩展模型与外部环境交互能力
工作记忆(Memory)：存储交互历史和中间状态，支持上下文连贯性
规划模块(Planner)：分解复杂任务并制定执行路径
执行器(Executor)：实际调用工具并收集结果的组件
观察处理器(Observer)：解析工具调用结果并整合到决策过程
提示模板(Prompts) ：结构化指令集，引导模型生成特定格式输出
反馈循环(Feedback Loop) ：评估行动效果并调整后续策略

模拟Agent运行流程

Agent的执行过程是一个动态的"思考-行动-观察"循环：

用户输入经过推理引擎(LLM)理解后，规划模块将任务分解为子目标；在每个决策点，LLM基于工作记忆中的上下文历史结合提示模板生成行动指令；执行器调用相应工具并获取结果；观察处理器将结果解析后反馈给LLM；反馈循环持续评估行动效果并调整策略，直至完成任务并生成最终回复；整个流程由推理引擎统筹协调，在保持上下文连贯性的同时实现复杂任务的自主处理。

下面代码给出一个符合ReAct范式的通用Agent示例，包含上述的核心组件。通过学习并修改这段代码，能够快速构建自己的基础Agent系统，理解如何将LLM的能力与外部工具组合以解决复杂任务。

def run(self, task: str) -> str:    # 工作记忆(Memory)：记录任务到交互历史    self.memory.add_message("user", task)
    # 规划模块(Planner)：分解任务创建执行计划    plan = self.planner.create_plan(task)    # 提示模板简化：计划创建提示...    self.memory.save_state("plan", plan)
    # 执行器(Executor)：准备执行计划    completed_steps = []
    for step in plan:        step_id = step["step_id"]        description = step["description"]        tool_name = step.get("tool")        print(f"执行步骤 {step_id}: {description}")
        if tool_name:            # 推理引擎(LLM)：确定工具参数和使用方式            tools_description = self._format_tools_description()            system_msg = self.system_prompt.format(tools_description=tools_description)            # 提示模板(Prompts)：工具使用提示...            messages = [                {"role": "system", "content": system_msg},                {"role": "user", "content": f"请帮我完成这个步骤：{description}。如果需要，请使用适当的工具。"}            ]
            # 推理引擎(LLM)：生成响应            response = self.llm_engine.generate(messages)            self.memory.add_message("assistant", response)
            # 观察处理器(Observer)：解析工具调用            tool_calls = self._parse_tool_calls(response)
            for tool_call in tool_calls:                try:                    # 执行器(Executor)：实际调用工具                    result = self.executor.execute_tool(                        tool_call["tool_name"],                         **tool_call["parameters"]                    )
                    # 观察处理器(Observer)：处理和解释结果                    observation = self.observer.process_result(description, result)
                    # 工作记忆(Memory)：记录执行结果                    step_result = {                        "step_id": step_id,                        "description": description,                        "tool_used": tool_call["tool_name"],                        "parameters": tool_call["parameters"],                        "result": result,                        "observation": observation                    }                    completed_steps.append(step_result)                    self.memory.add_message("system", f"工具执行结果: {result}")
                    # 反馈循环(Feedback Loop)：评估行动效果并调整策略                    remaining_steps = [s for s in plan if s["step_id"] not in [cs["step_id"] for cs in completed_steps]]                    feedback = self.feedback_loop.evaluate_and_adjust(                        task,                        completed_steps,                        observation,                        remaining_steps                    )                    # 提示模板(Prompts)：反馈评估提示...
                    # 规划模块(Planner)：根据反馈调整计划                    if feedback.get("需要调整", False):                        new_plan = feedback.get("调整后的计划", [])                        plan = [s for s in completed_steps] + new_plan                        self.memory.save_state("plan", plan)                        print("计划已调整")
                except Exception as e:                    # 工作记忆(Memory)：记录错误信息                    error_msg = f"执行步骤 {step_id} 时发生错误: {str(e)}"                    print(error_msg)                    self.memory.add_message("system", error_msg)        else:            # 非工具步骤处理            step_result = {                "step_id": step_id,                "description": description,                "completed": True            }            completed_steps.append(step_result)
    # 推理引擎(LLM)：生成最终总结    summary_prompt = f"""    你刚刚帮助用户完成了以下任务：{task}     已完成的步骤：    {json.dumps(completed_steps, ensure_ascii=False, indent=2)}            请提供一个简洁的总结，说明任务完成情况和主要结果。    """           messages = [{"role": "user", "content": summary_prompt}]    summary = self.llm_engine.generate(messages)
    # 工作记忆(Memory)：记录总结    self.memory.add_message("assistant", summary)    return summary

基于LangChain快速搭建Agent

我们每次都需要手写上面复杂的执行过程吗？当然不，LangChain提供了丰富的工具和框架，使Agent的搭建变得相对简单高效。

基本的Agent构建流程如下：

下面给出示例代码：

# Prompt templateprompt = ChatPromptTemplate.from_messages([    ("system", """你是一个专业的旅游规划助手。你的任务是根据用户偏好创建详细的旅行计划。    使用可用的工具收集必要信息并创建全面的旅行策略。    始终考虑天气条件、交通选择、住宿可用性和当地景点。    提供详细的每日行程和费用估算。"""),    MessagesPlaceholder(variable_name="chat_history"),    ("human", "{input}"),    MessagesPlaceholder(variable_name="agent_scratchpad"),])
# Initialize the LLMdef get_llm() -> BaseChatModel:    return ChatOpenAI(        model="deepseek-chat",        temperature=0.7,        api_key=DEEPSEEK_API_KEY,        base_url="https://api.deepseek.com/v1"  # DeepSeek API endpoint    )
# Create the agentdef create_agent():    try:        # Fetch tools from server        tools = create_tools_from_server_data()        llm = get_llm()        agent = create_openai_functions_agent(llm, tools, prompt)        return AgentExecutor(agent=agent, tools=tools, verbose=True)    except Exception as e:        print(f"Error creating agent: {e}")        return None
# Main function to create travel plandef create_travel_plan(preferences: TravelPreferences) -> TravelPlan:    # 创建Agent    agent_executor = await create_agent()    # 初始化聊天历史    chat_history = []    # 创建初始提示    initial_prompt = f"""为{preferences.destination}从{preferences.start_date}到{preferences.end_date}创建一个旅行计划。    预算: ${preferences.budget}    兴趣爱好: {', '.join(preferences.interests)}    住宿偏好: {preferences.accommodation_preference}"""     # 执行Agent    response = await agent_executor.ainvoke({        "input": initial_prompt,    })    # 从链输出中获取原始内容    content = response.get("output", "")    # 创建一个简单的TravelPlan，将原始内容作为建议    return content

支持Agent的开发平台

Dify、n8n、Coze等平台均支持Agent的搭建，官方文档对此有详细介绍及示例，此处不再赘述。

Agent的局限性

在上面的基于LangChain的Agent代码中，其实缺少一部分核心代码，就是工具的获取及调用。

传统Agent只能使用预定义工具集，难以灵活扩展，且工具集成复杂，通常需要自定义开发和定制化编码，所以MCP应运而生。

当然，除了工具链不完善之外Agent还有许多地方存在进步空间，下图所列条目不再赘述。

MCP

MCP技术概述

基本概念

Model Context Protocol (MCP) 是一种标准化协议，用于大语言模型（LLM）与外部数据源、服务和工具进行交互的框架。它允许LLM通过结构化的方式访问和操作外部上下文信息，从而增强模型的能力，使其能够执行更复杂的任务。

MCP 的概念最先由Claude的母公司提出，目前不是一个完全确定或标准化的交互协议。MCP更像是一种架构模式或设计理念，而非一个明确定义的标准协议。未来可能会出现统一标准，但目前仍处于竞争性创新阶段。

https://modelcontextprotocol.io/introduction

值得一提的是，对于熟悉区块链技术的同学来说，MCP Server的设计理念与Oracle预言机有异曲同工之妙。它们都扮演着信息中介的角色，通过提供标准化的接口来确保数据交互的可靠性和一致性。

核心组件

MCP系统是由多个协同工作的核心组件构成的完整架构，包括负责执行环境和运行时管理的MCP主机(Host)、处理工具注册与调用请求的服务器(Server)、与服务器交互并处理模型生成调用的客户端(Client)、实现和注册特定工具的工具提供者(Tool Provider)，以及连接语言模型与MCP系统的LLM集成层。

MCP与Function Call

Function Call与MCP代表了两个不同层次的技术关注点：

Function Call专注于功能调用的表达层面，它通过大模型为预定义方法生成结构化的参数，确保调用的准确性和规范性。

而MCP则着眼于更高层次的系统架构，它不仅能够生成参数，更重要的是提供了一个完整的功能管理、发现和执行框架。这个框架能够动态发现新方法并实现调用，同时包含了丰富的基础设施支持。

可以说，Function Call是MCP协议中的一个核心组件，但MCP的范畴更为广泛，它构建了一个完整的功能调用生态系统。

集成MCP到AI平台

此处以Cursor为例：

Cursor是一款深度集成AI、旨在极大提升编程效率的代码编辑器，它基于VS Code构建并提供了更智能的代码生成、编辑和理解能力。

https://www.cursor.com/cn

开源MCP Server

我们可以在https://cursor.directory/mcp找到非常多的MCP Server，此处我们以GitHub为例。获取某个组织下的所有项目名称。

根据官方文档给出的配置内容在Cursor中添加一个MCP Server，同时填入在GitHub申请的AccessToken。

此时就能通过Cursor调用GitHub MCP Server提供的工具来获取数据。

构建自己的MCP Server

基于Anthropic提供的FastMCP包，我们实现一个MCP Server，可以查询指定位置天气，并记录到电脑自带的备忘录中。

# Initialize FastMCP servermcp = FastMCP("weather")
@mcp.tool()async def get_forecast(latitude: float, longitude: float) -> str:    """获取某个地点的天气预报    Args:        latitude: 纬度        longitude: 经度    """    # 省略具体获取天气的过程    # 此处可调用其他第三方气象平台接口 或 mock    return mock_data
@mcp.tool()async def create_note(content: str) -> str:    """创建一个新的备忘录并填入指定内容    Args:        content: 要添加到新备忘录中的内容    """    # 先打开Notes应用    subprocess.run(['open', '-a', 'Notes'])    # 使用AppleScript命令创建新笔记    applescript = f'''    tell application "Notes"        activate        make new note at folder "Notes" with properties {{body:"{content}"}}    end tell    '''    subprocess.run(['osascript', '-e', applescript])    return "成功创建新笔记并填入内容"
if __name__ == "__main__":    # Initialize and run the server    mcp.run(transport='stdio')

将上面的代码保存到本地后，在Cursor中添加如下配置。

{  "mcpServers": {      "weather": {          "command": "uv",          "args": [              "--directory",              "/Users/zq/weather",  // 文件所在目录的绝对路径              "run",              "weather.py"          ]      }  }}

配置完成后在输入框中进行提问，Agent首先调用查询天气的工具获取到目标位置的天气，然后创建备忘录并写入天气预报的内容。

基于HTTP的MCP协议

我可以不使用Anthropic提供的SDK，自己实现MCP吗？当然可以！

目前不同公司开发的MCP是不完全通用的。因此我们可以参考其定义来实现一套自己的MCP协议，核心是提供一个list_tools接口，告诉大模型提供哪些接口，以及接口的作用及入参，并且不受语言限制。

app = FastAPI()
async def get_weather_data(location: str, date: str) -> Dict[str, Any]:    # 省略具体获取天气的过程    # 此处可调用其他第三方气象平台接口 或 mock    return generate_mock_weather(location, date)
@app.post("/api/weather")async def get_weather(request: WeatherRequest):    data = await get_weather_data(request.location, request.date)    return {"status": "success", "data": data}
@app.get("/api/list_tools")async def list_tools():    """Return a list of all available tools in the MCP server"""    tools = [        {            "name": "get_weather",            "description": "Get weather forecast for a specific location and date",            "endpoint": "/api/weather",            "method": "POST",            "params": [                {"name": "location", "type": "string", "description": "The location to get weather for"},                {"name": "date", "type": "string", "description": "The date to get weather for"}            ]        }    ]    return {"status": "success", "tools": tools}
    if __name__ == "__main__":    uvicorn.run(app, host="0.0.0.0", port=8000)

下面给出调用方代码示例，主要实现了一个动态工具加载系统，用于与MCP Server交互，使得应用程序能够动态发现MCP服务器提供的工具，并自动生成调用这些工具的函数接口。

具体功能如下：

fetch_tools_from_server()：从MCP服务器获取可用工具列表，发送GET请求到/api/list_tools端点。

create_dynamic_tool_executor()：为每个工具创建执行函数。

create_tools_from_server_data()：将从服务器获取的工具数据转换为Tool对象列表。

# Function to fetch tools from MCP serverasync def fetch_tools_from_server() -> List[Dict[str, Any]]:    """Fetch available tools from the MCP server"""    async with httpx.AsyncClient() as client:        response = await client.get(f"{MCP_SERVER_URL}/api/list_tools")        return response.json()["tools"]
def create_dynamic_tool_executor(tool_info: Dict[str, Any]) -> Callable:    async def execute_api_call(*args, **kwargs):        payload = {}        param_names = [p["name"] for p in tool_info["params"]]        # Map args and kwargs to parameters        for i, arg in enumerate(args):            if i < len(param_names):                payload[param_names[i]] = arg        for key, value in kwargs.items():            if key in param_names:                payload[key] = value        # Execute request        async with httpx.AsyncClient() as client:            is_post = tool_info["method"] == "POST"            request_kwargs = {"json" if is_post else "params": payload}            method = client.post if is_post else client.get            response = await method(f"{MCP_SERVER_URL}{tool_info['endpoint']}", **request_kwargs)               if response.status_code == 200:                return response.json()["data"]            raise Exception(f"API call failed with status {response.status_code}: {response.text}")    # Create synchronous wrapper with proper metadata    def sync_executor(*args, **kwargs):        return asyncio.run(execute_api_call(*args, **kwargs))    # Set function metadata    sig_params = [inspect.Parameter(name=p["name"], kind=inspect.Parameter.POSITIONAL_OR_KEYWORD,                                     annotation=param_type) for p in tool_info["params"]]    sync_executor.__signature__ = inspect.Signature(parameters=sig_params)    sync_executor.__name__ = tool_info["name"]    sync_executor.__doc__ = tool_info["description"]    return sync_executor# Function to create Tool objects from fetched tool datadef create_tools_from_server_data(tool_data: List[Dict[str, Any]]) -> List[Tool]:    """Create Tool objects from fetched tool data"""    tools = []    for tool_info in tool_data:        # Create a dynamic tool executor for this tool        executor = create_dynamic_tool_executor(tool_info)        # Create a Tool object        tools.append(            Tool(                name=tool_info["name"],                func=executor,                description=tool_info["description"]            )        )    return tools