大模型LLM ACA - ACP认证考试模拟试卷一

news2026/3/30 20:14:26

目录一、大模型LLM ACA - ACP认证考试二、大模型LLM ACA - ACP认证考试模拟试卷一单选题70 题 × 1 分 70 分1. 在代码中answer_correctness 指标的主要作用是什么2. 在ask_llm_route函数中如果问题类型是“公司内部文档查询”会使用哪个方法3. 你为教育公司搭建了RAG问答系统且知识库存储了各部门的机密数据如财务部的薪资表、教务部的未公开课件。为了确保普通员工只能访问自己有权限的数据以下哪种做法最合适4. 在大语言模型微调的训练循环中哪个步骤负责计算模型输出与真实标签之间的差异5. 开启代码解释器插件后大模型能够直接实现什么操作6. 模型微调适合解决哪种任务7. 在以下代码片段中completion.choices[0].message.content的作用是什么8. 在调用大语言模型对话的API过程中以下哪个代码片段正确地展示了system、user和assistant三种角色的交互顺序9. 在提示词框架中上下文Context的主要作用是什么10. 在 Ragas 中context recall 指标的主要作用是什么11. 以下选项中不属于RAG工作流程中“建立索引”阶段的步骤的是哪一项12. 在问题改写中以下哪种方法将单一查询改写为多步骤查询13. 在大模型安全治理中如何识别和避免对用户输入的非法查询进行响应14. 在RAG应用的多轮对话中改写后的新query的主要作用是什么15. 下列哪个场景最能体现多模态协同学习的优势16. 在文档解析与切片阶段以下哪种改进策略适用于文档切片长度过大的情况17. 在 Answer Correctness 的计算过程中语义相似度是通过什么模型得到的18. 在编写LLM提示词时下列哪项原则是正确的19. 你想在面向高中生的技术分享里用大模型生动地解释阿里云弹性容器实例ECI的基本原理。下列哪种提示词最能实现“易懂、形象化”的效果20. 你想让 RAG 应用同时支持多种类型的信息查询有些问 “人名信息”有些问 “技术细节”。哪种 “提示词模板” 策略更适合21. 在控制大模型生成内容的随机性时top_p参数的作用是什么22. 你需要借助大模型为小学生写一篇关于“保护环境”的科普短文但输出的内容过于学术化如频繁使用“碳达峰“生物降解”等术语。以下哪个提示词优化方向最能直接解决该问题23. 在开发智能新闻摘要应用的过程中工程师利用大语言模型来生成文章摘要。假设在某个例子中模型需决定摘要中下一个词汇已知“经济”之后最可能的两个词汇按概率高低依次是“增长”概率0.7和“衰退”(概率0.3)。则当“经济”之后模型大概率会如何选择24. 在以下代码片段中presence_penalty0.6的作用是什么25. 以下关于大模型推理过程的描述中正确的是26. 梯度下降算法中如果学习率设置过大可能导致27. 在下列哪项任务中大语言模型可能不是最佳工具选择?28. 在使用大语言模型 (如Qwen - Turbo) 对课程内容进行初步翻译时以下哪一项是必须的?29. 大语言模型中的top_P参数的主要作用是什么?30. 增强大模型能力的插件通常是通过什么方式与大模型集成的31. 在提示词框架中样例Sample的主要作用是什么32. 你在优化一个多语言翻译系统发现文学翻译经常“失去原文意境”而技术文档翻译经常“用词生硬、难以理解”。现有提示词已包含“保持专业性“和”语言流畅”要求并添加了示例。下一步最应优先尝试的策略是33. RAG 未检索到相关信息但模型仍编造回答。下列哪种做法有助于减少这种幻觉34. 在创建索引时以下哪些方法被使用35. 通过LlamaIndex创建RAG应用时编写了如下代码这段代码中如何修改召回文本段的个数?36. 在优化 answer correctness 指标时以下哪种方法可以提升生成答案的准确度37. 在调用百炼大模型接口时如何指定用户的输入内容38. 在使用 Qwen-Max 辅助内容生成的过程中以下哪个操作是正确的39. 在创建RAG应用时SimpleDirectoryReader方法的主要作用是什么40. 通过 LlamaIndex 创建 RAG 应用时一份知识文件是如何传入 RAG 应用的请选择顺序41. 在文档切片过程中以下哪种切片方法适合文档逻辑性强、内容专业的场景42. 预训练 (Pre-training在自然语言处理大模型中的核心目的是什么43. 在top_p0.9的设置下大模型的输出会有什么特点44. 在切片向量化与存储阶段以下哪些是 embedding_models 字典的作用45. 在构建RAG应用时以下关于句子滑窗检索的优势描述正确的是哪一项?46. 在微调大语言模型的数据预处理流程中哪一步骤旨在减少文本中的噪声提高数据质量?47. 在LLM提示词中分配角色时以下哪项不是需要考虑的因素48. 向量数据库的主要作用是什么49. 你在开发 RAG 应用时发现召回的文本段包含了回答所需的必要信息但是回答效果很差你可以怎么做50. 根据Multi - Agent的思想对于复杂的RAG任务最适合通过以下哪种方式进行处理51. 利用大模型处理文本时如果需要模型理解并回应与当前时间相关的问题最可能用到的插件是52. 在需要创意和多样化的场景中建议如何设置temperature参数53. 作为应用开发者如果想要让大模型避免回答与个人隐私相关的问题最推荐在哪个角色中设置相应的限制54. 在自定义提示词模板中以下哪项是用于约束大模型行为的注意事项55. 你在开发一个可以自动回答客户问题的客服平台。除了回答产品知识问题外你希望它还能执行与账户相关的操作例如实时查询用户订单状态、修改账户绑定的手机号、提交工单或退款申请。你应该考虑引入什么技术来扩展大模型的能力56. 在LlamaIndex的默认提示词模板中context_str表示什么A. 从向量库中检索到的上下文信息B. 用户的问题C. 大模型的角色57. 在大语言模型RAG应用的基本工作流程中如何将用户问题和检索到的相关文档块提交给大语言模型?58. 某企业的文档Markdown 格式中部门职责常落在多段文字里检索时想精准定位哪种切片策略最能减少“职责信息”被拆散的问题59. 在示例中以下哪些任务需要经过RAG链路来生成答案60.多Agent系统通过模拟或利用多个交互的智能体 Agents来解决复杂问题具有分布性、适应性、动态性的特点。以下哪个场景适合采用多Agent系统61. 在开发一个需要调用大模型 API 的应用时为了保护敏感信息不被泄露以下哪种方式是处理 API Key 的安全做法62. 在问题改写中以下哪种方法通过大模型生成假想文档63. 为了提高知识索引的性能以下哪项技术涉及到了使用更先进的嵌入模型64. 在使用 Assistant API 时如何验证 API 请求是否成功65. 在本教程中Planner Agent 的作用是什么66. 在优化检索效果时以下哪些方法可以提升大模型对参考信息的理解67. 你开发了一个聊天机器人用户反馈每次提问后总是要等很久才能看到回复你应该怎么做68. 如果想要自定义 langchain 的 LLM 对象理论上只需要准备以下哪个要素69. 在合规与数据安全方面以下哪项措施对于保护敏感数据在微调过程中不被泄露不是必要的70. 假设你正在使用大模型解决以下数学问题“小明每天存入银行10元钱但每周末周六和周日会取出20元用于消费。如果小明从某周一第一天开始存钱青问小明需要多少天才能存够100元”为了提升大模型解答此类问题的准确率以下哪种提示方法最能有效引导大模型生成正确的答案二多选题30 题 × 1 分 30 分1. Assistant API 的 Assistant 类的各项功能中涵盖了以下哪些操作2. 在检索召回阶段以下哪些方法用于在检索后减少无关信息3. 在检索阶段以下哪些步骤是必要的4. 以下哪些方法有助于你减少大模型应用的输出结果等待时间5. 用户多次反馈 “AI 回答中有捏造内容”排查后发现是当知识库没有相关内容时大模型直接虚构答案。为减少此情况你可以怎么做6. 某大型公司对每位员工都有多条文档记录。RAG 在检索时只依赖 Embedding 相似度有时召回了不匹配的“同名员工”信息。为提高准确度你会如何处理7. 为了将 RAGAS 评测适配到中文问答场景有哪些有效方法8. 通过 LlamalIndex 创建 RAG 应用在修改默认 prompt 时包含以下哪些步骤9. 以下关于temperature参数的描述哪些是正确的10. Ragas 提供的以下哪些指标用于评估生成环节11. 视频合规检测的关键步骤包括下列哪些选项?12. 以下哪些描述符合基于语义的文档切片的理念13. 在使用大模型提炼图文课程内容时以下哪些指导原则是正确的14. 在实现大模型辅助的新员工帮助应用中以下哪些建议有助于提升用户体验15. 以下哪些因素会影响 RAG 系统的性能16. 你发现大量员工信息都存放在 PDF、Word 文档里部分还包含表格和图片RAG 无法正确提取关键信息。你可以怎么处理17. 已知 prompt_template 定义了让大模型生成摘要的具体要求以下哪些措施可以提高摘要生成函数的生成质量18. 在开发一款基于大语言模型的会议纪要生成工具时团队发现模型在处理会议记录时经常遗漏关键决议内容导致生成的纪要不够准确和全面。以下哪两个选项能较低成本地解决这一问题19. 在加载本地索引文件时以下哪些参数可以设置20. 以下哪些选项属于提示词要素中的样例Sample21. 在多轮对话场景中以下哪些方案更有利于保障用户体验的同时降低大模型使用成本22. 某电商公司需开发一个客服机器人处理“退换货政策咨询“和”商品推荐”任务。下列哪两种角色应深度参与提示词设计23. RAG应用的主要组成部分包括哪些24. 以下哪些措施可以提高大模型在私域场景下的安全性25. 在切片向量化与存储阶段以下哪些是余弦相似度的计算方法26. 在LlamaIndex的默认提示词模板中以下哪些变量是必要的27. 当你在使用一款基于大模型构建的创意助手要求它一次性产生10条宣传文案时发现生成的文案千篇一律缺乏多样性。为了在保证一定多样性的同时避免模型生成不符合主题的内容可以优先考虑以下哪些改进措施28. 关于图片合规检查的技术手段下列说法正确的有哪些29. 关于大模型在文本处理中的局限性以下哪些陈述是准确的30. 在大模型的问答工作流程中以下哪些阶段涉及Token的处理一、大模型LLM ACA - ACP认证考试探索未来智能的钥匙——ACA-ACP大模型工程师认证专栏导读含十套模拟真题和真题精选请认真阅读考试须知后准备好相关资料开始进行防作弊验证。验证通过后将正式开始考试。答题开始即开始计时中途不可暂停如超时则自动提交1、考试共 (100) 道题总分100分及格分数80分。模拟试题库对应模拟试题按70:30-单选题-多选题真题一般50:252、考试需在120分钟内交卷过程中无法暂停请提前安排好时间如未及时交卷则本次考试作废3、推荐使用 Chrome 浏览器版本73及以上的正式版本或Firefox浏览器版本66及以上的正式版本)4、开始答题前会进行身份验证需要您拍摄并上传身份证人像面照片并按照系统要求开启摄像头进行面部识别5、考试过程中请保持摄像头开启并对准面部系统会不定时进行抓拍并与身份证照片做对比如发现作弊行为您的考试成绩将作废6、考试过程中系统将判断您的浏览器状态如发现最小化浏览器、切换标签页、窗口缩小或扩大等行为以及弹出广告弹窗将会给出警告。如果次数过多您的考试成绩将作废7、考试前请关闭即时通信软件以及其他可能会有弹窗的软件以免影响您的考试祝大家一次上岸顺利拿证未来在云赛道上越走越宽、越走越远 ✨二、大模型LLM ACA - ACP认证考试模拟试卷一单选题70 题 × 1 分 70 分1. 在代码中answer_correctness 指标的主要作用是什么A. 评估答案的准确度B. 增加模型的训练数据C. 减少模型的推理时间2. 在ask_llm_route函数中如果问题类型是“公司内部文档查询”会使用哪个方法A. ra askB. reviewed_promptC. translate_prompt3. 你为教育公司搭建了RAG问答系统且知识库存储了各部门的机密数据如财务部的薪资表、教务部的未公开课件。为了确保普通员工只能访问自己有权限的数据以下哪种做法最合适A. 预处理用户问题时强制添加请仅回答我部门数据的提示词B. 对大模型进行微调使其主动拒绝跨部门问题C. 为每个用户单独生成加密密钥用于访问知识库D. 在检索阶段根据用户权限过滤无权限文档4. 在大语言模型微调的训练循环中哪个步骤负责计算模型输出与真实标签之间的差异A. 梯度更新B. 参数初始化C. 反向传播D. 正向传播5. 开启代码解释器插件后大模型能够直接实现什么操作A. 仅提供代码编写建议B. 执行用户请求的代码逻辑并给出结果C. 修改外部程序的源代码6. 模型微调适合解决哪种任务A. 数据量极小的任务B. 需要学习庞大知识库的任务C. 需要模型学习专业领域知识的任务D. 数据分布剧烈漂移的任务7. 在以下代码片段中completion.choices[0].message.content的作用是什么A. 获取提取的标签内容B. 获取用户输入的内容C. 获取系统消息的内容8. 在调用大语言模型对话的API过程中以下哪个代码片段正确地展示了system、user和assistant三种角色的交互顺序A. messages [{role: assistant, content: 你好}, {role: user, content: 我想订一张机票}, {role: system, content: 你是一个订票助手}]B. messages [{role: system, content: 你是一个订票助手}, {role: user, content: 我想订一张机票}, {role: assistant, content: 你好,请问你想去哪里?}]C. messages [{role: user, content: 我想订一张机票}, {role: system, content: 你是一个订票助手}, {role: assistant, content: 你好,请问你想去哪里?}]9. 在提示词框架中上下文Context的主要作用是什么A. 提供任务的背景信息B. 明确要求大模型完成的具体任务C. 定义大模型扮演的角色10. 在 Ragas 中context recall 指标的主要作用是什么A. 评估 contexts 与 ground_trut的事实一致性程度B. 评估检索召回的参考信息中与准确答案相关的条目是否排名靠前、占比高C. 增加模型的训练数据11. 以下选项中不属于RAG工作流程中“建立索引”阶段的步骤的是哪一项A. 将文档解析为纯文本B. 将长文本切成更小的片段C. 将用户问题转换为向量表示12. 在问题改写中以下哪种方法将单一查询改写为多步骤查询A. 将单一查询改写为多步骤查询B. 重排序C. 滑动窗口检索13. 在大模型安全治理中如何识别和避免对用户输入的非法查询进行响应A. 增加训练数据量B. 引导用户输入示范C. 利用大模型服务平台的快速干预功能14. 在RAG应用的多轮对话中改写后的新query的主要作用是什么A. 提高检索准确性B. 增加模型的训练数据C. 减少模型的推理时间15. 下列哪个场景最能体现多模态协同学习的优势A. 单纯的文本情感分析任务B. 仅依赖声音的语音识别系统C. 利用图像和地理位置信息进行精准的视觉定位16. 在文档解析与切片阶段以下哪种改进策略适用于文档切片长度过大的情况A. 减少切片长度或开发更合适的切片策略B. 增加模型的训练数据C. 减少模型的推理时间17. 在 Answer Correctness 的计算过程中语义相似度是通过什么模型得到的A. Embedding 模型B. 大模型C. 增加模型的训练数据18. 在编写LLM提示词时下列哪项原则是正确的A. 提示词应尽可能详细包含所有可能的上下文信息B. 使用模糊不清的表述以增加模型的自由发挥空间C. 保持提示词简洁明了聚焦于核心需求19. 你想在面向高中生的技术分享里用大模型生动地解释阿里云弹性容器实例ECI的基本原理。下列哪种提示词最能实现“易懂、形象化”的效果A. 请以高中生能理解的方式使用生动比喻讲解 ECI 原理。B. 简短介绍 ECI 功能即可。C. 写一篇详尽 ECI 论文全部使用专业术语。D. 仅列出 ECI 命令和参数列表。20. 你想让 RAG 应用同时支持多种类型的信息查询有些问 “人名信息”有些问 “技术细节”。哪种 “提示词模板” 策略更适合A. 对所有疑问一概使用相同的通用模板不区分问题类型B. 先把所有问题都改成 “人事类”让技术类问题也以人事视角回答C. 让用户在输入问题时手动指定要用哪种模板D. 根据问题类型人事类 / 技术类自动选择对应模板21. 在控制大模型生成内容的随机性时top_p参数的作用是什么A. 调整候选Token的概率分布B. 筛选出累计概率达到阈值的候选TokenC. 增加候选Token的数量22. 你需要借助大模型为小学生写一篇关于“保护环境”的科普短文但输出的内容过于学术化如频繁使用“碳达峰“生物降解”等术语。以下哪个提示词优化方向最能直接解决该问题A. 定义角色与受众以“小学科学老师”身份用比喻和故事向“612岁学生”讲解B. 提供样例附上一篇《如何节约用水》的短文语言平实包含互动问答C. 补充任务目标要求文章包含“垃圾分类对社区的影响”案例D. 扩展上下文添加背景“当前城市垃圾填埋占比超过60%”23. 在开发智能新闻摘要应用的过程中工程师利用大语言模型来生成文章摘要。假设在某个例子中模型需决定摘要中下一个词汇已知“经济”之后最可能的两个词汇按概率高低依次是“增长”概率0.7和“衰退”(概率0.3)。则当“经济”之后模型大概率会如何选择A. 选择“增长”因为其概率高于“衰退”B. 选择“衰退”以增加摘要的多样性C. 同时包含“增长”和“衰退”以反映所有可能情况24. 在以下代码片段中presence_penalty0.6的作用是什么A. 减少输出的重复性B. 增加输出的多样性C. 使输出更具确定性25. 以下关于大模型推理过程的描述中正确的是A. 这是模型学习新知识和技能的过程B. 这是模型根据已学习到的知识对新输入做出响应的过程C. 这是向模型添加更多数据以提高其性能的过程26. 梯度下降算法中如果学习率设置过大可能导致A. 在最优解附近震荡B. 需要更多迭代次数才能收敛C. 收敛速度过慢D. 参数更新幅度不足27. 在下列哪项任务中大语言模型可能不是最佳工具选择?A. 分析用户反馈识别产品改进建议的主题。B. 确定两种药物治疗效果是否有统计学上的显著差异。C. 自动为新闻文章分配合适的标签类别。D. 从大量日志数据中自动检测异常登录行为28. 在使用大语言模型 (如Qwen - Turbo) 对课程内容进行初步翻译时以下哪一项是必须的?A. 提供明确的系统消息和翻译任务提示B. 将源文件转为图片格式C. 使用固定的翻译模板29. 大语言模型中的top_P参数的主要作用是什么?A. 控制模型生成文本的长度B. 控制模型只考虑概率最高的几个词C. 控制模型使用的CPU核心数量30. 增强大模型能力的插件通常是通过什么方式与大模型集成的A. 直接修改大模型源代码B. 使用API接口进行功能扩展C. 通过硬件升级提升性能31. 在提示词框架中样例Sample的主要作用是什么A. 让大模型参考具体案例B. 提供任务的背景信息C. 定义大模型扮演的角色32. 你在优化一个多语言翻译系统发现文学翻译经常“失去原文意境”而技术文档翻译经常“用词生硬、难以理解”。现有提示词已包含“保持专业性“和”语言流畅”要求并添加了示例。下一步最应优先尝试的策略是A. 提高温度参数Temperature1.0增强灵活性B. 要求模型分两次翻译先直译再人工润色C. 在现有模板中增加更多诗歌和手册的对照示例D. 为文学和技术翻译分别设计专用提示词模板33. RAG 未检索到相关信息但模型仍编造回答。下列哪种做法有助于减少这种幻觉A. 把所有文档一次性放进模型上下文B. 提示词要求“若无匹配则回答无法解答C. 开启高温度让模型由创造34. 在创建索引时以下哪些方法被使用A. SimpleDirectoryReaderB. VectorStoreIndex.from_documentsC. index.as_query_engine35. 通过LlamaIndex创建RAG应用时编写了如下代码这段代码中如何修改召回文本段的个数?A. from_documents[similarity_top_k] as_query_engine(similarity_top_k)B. query_enginC. query(similarity_top_k)D. print_response_stream(similarity_top_k)36. 在优化 answer correctness 指标时以下哪种方法可以提升生成答案的准确度A. 调整大模型生成的超参数如temperatureB. 增加模型的训练数据C. 减少模型的推理时间37. 在调用百炼大模型接口时如何指定用户的输入内容A. 将用户输入内容作为messages列表中字典的content字段的值传入B. 将用户输入内容作为 model 参数的值传入C. 将用户输入内容作为 api_key 参数的值传入D. 将用户输入内容作为 base_url 参数的值传入38. 在使用 Qwen-Max 辅助内容生成的过程中以下哪个操作是正确的A. 让 Qwen-Max 执行编程代码B. 利用 Qwen-Max 生成课程脚本C. 应用 Qwen-Max 进行视频剪辑任务D. 直接使用 Qwen-Max 进行图像设计39. 在创建RAG应用时SimpleDirectoryReader方法的主要作用是什么A. 将指定文件夹中的文件加载为document对象B. 将文本分段C. 将文本向量化40. 通过 LlamaIndex 创建 RAG 应用时一份知识文件是如何传入 RAG 应用的请选择顺序A. Node 对象 - query_engine-Document 对象 - indexB. Document 对象 - Node 对象 - index-query_engineC. Node 对象 - Document 对象 - index-query_engineD. Document 对象 - index-Node 对象 - query_engine41. 在文档切片过程中以下哪种切片方法适合文档逻辑性强、内容专业的场景A. 语义切片B. Token 切片C. 句子切片42. 预训练 (Pre-training在自然语言处理大模型中的核心目的是什么A. 利用大量末标注文本数据学习通用的语言结构和模式B. 直接在特定任务的数据集上进行模型参数优化C. 通过人类反馈机制不断调整模型输出以更贴合人类偏好43. 在top_p0.9的设置下大模型的输出会有什么特点A. 输出内容非常多样化B. 输出内容相对单一C. 输出内容完全固定44. 在切片向量化与存储阶段以下哪些是 embedding_models 字典的作用A. 定义要测试的 Embedding 模型B. 增加模型的训练数据C. 减少模型的推理时间45. 在构建RAG应用时以下关于句子滑窗检索的优势描述正确的是哪一项?A. 提高大模型生成的速度B. 对大模型的注意力机制进行了针对性改善C. 提高检索阶段的精确性同时,保证了生成阶段的信息完整性46. 在微调大语言模型的数据预处理流程中哪一步骤旨在减少文本中的噪声提高数据质量?A. 序列填充B. 文本清洗C. 特征选择D. 数据增强47. 在LLM提示词中分配角色时以下哪项不是需要考虑的因素A. 角色的年龄阶段B. 角色的物理外观C. 角色的专业知识48. 向量数据库的主要作用是什么A. 存储和管理大量的关系型数据。B. 存储和管理大量的图像。C. 存储和管理大量的向量数据并提供高效的相似性检索。D. 存储和管理大量的文本数据并提供全文检索功能。49. 你在开发 RAG 应用时发现召回的文本段包含了回答所需的必要信息但是回答效果很差你可以怎么做A. 更换向量数据库的选型B. 更换性能更好的大模型C. 更换性能更好的 embedding 模型D. 尝试使用 LlamaIndex 外的其它 RAG 开发框架50. 根据Multi - Agent的思想对于复杂的RAG任务最适合通过以下哪种方式进行处理A. 将所有任务步骤整合到一个大型prompt中,一次调用大模型完成所有处理B. 根据任务特点,将复杂任务拆分成多个子任务,每个子任务使用不同的模型、prompt或代码逻辑进行处理C. 只使用DashScope Parse解析文档,其他优化步骤都手动完成51. 利用大模型处理文本时如果需要模型理解并回应与当前时间相关的问题最可能用到的插件是A. 代码审查插件B. 天气查询插件C. 时间插件52. 在需要创意和多样化的场景中建议如何设置temperature参数A. 设置较高的温度值B. 设置较低的温度值C. 使用默认温度值53. 作为应用开发者如果想要让大模型避免回答与个人隐私相关的问题最推荐在哪个角色中设置相应的限制A. userB. assistantC. 任何角色都可以D. system54. 在自定义提示词模板中以下哪项是用于约束大模型行为的注意事项A. 根据上下文信息而非先验知识来回答问题B. 增加模型的训练数据C. 减少模型的推理时间55. 你在开发一个可以自动回答客户问题的客服平台。除了回答产品知识问题外你希望它还能执行与账户相关的操作例如实时查询用户订单状态、修改账户绑定的手机号、提交工单或退款申请。你应该考虑引入什么技术来扩展大模型的能力A. RAG Retrieval Augmented GenerationB. Agent智能体C. 大模型微调56. 在LlamaIndex的默认提示词模板中context_str表示什么A. 从向量库中检索到的上下文信息B. 用户的问题C. 大模型的角色57. 在大语言模型RAG应用的基本工作流程中如何将用户问题和检索到的相关文档块提交给大语言模型?A. 将用户问题和文档块直接拼接成一个长字符串提交B. 将用户问题和文档块分别提交给大模型,然后将两个结果合并C. 使用预设的提示词模板,将用户问题和文档块整合到模板中,然后提交给大模型58. 某企业的文档Markdown 格式中部门职责常落在多段文字里检索时想精准定位哪种切片策略最能减少“职责信息”被拆散的问题A. Token 切片B. 随机分段C. 句子切片D. Markdown 结构化切片59. 在示例中以下哪些任务需要经过RAG链路来生成答案A. 内部知识查询B. 文档审查C. 增加模型的训练数据60.多Agent系统通过模拟或利用多个交互的智能体 Agents来解决复杂问题具有分布性、适应性、动态性的特点。以下哪个场景适合采用多Agent系统A. 单一目标的持续追踪任务B. 简单的自动化仓库物品搬运C. 大型物流仓储中心的自动化物资拣选与搬运61. 在开发一个需要调用大模型 API 的应用时为了保护敏感信息不被泄露以下哪种方式是处理 API Key 的安全做法A. 在代码中写入 API KeyB. 将 API Key 存储到环境变量中C. 在代码注释中记录 API KeyD. 将 API Key 保存在公开的配置文件中62. 在问题改写中以下哪种方法通过大模型生成假想文档A. 用假设文档来增强检索HyDEB. 重排序C. 滑动窗口检索63. 为了提高知识索引的性能以下哪项技术涉及到了使用更先进的嵌入模型A. Decomposition问题分解B. CRAG互联网检索C. BGE新嵌入模型64. 在使用 Assistant API 时如何验证 API 请求是否成功A. if response.status_code HTTPStatus.CREATED:B. if response.status_code HTTPStatus.BAD_REQUEST:C. if response.status_code HTTPStatus.OK:D. if response.status_code HTTPStatus.NOT_FOUND:65. 在本教程中Planner Agent 的作用是什么A. 负责执行工具函数B. 负责总结 Agent 的输出内容C. 负责分析用户输入并将任务分发到其它 Agent 上66. 在优化检索效果时以下哪些方法可以提升大模型对参考信息的理解A. 使用结构化的文档格式B. 增加模型的训练数据C. 减少模型的推理时间67. 你开发了一个聊天机器人用户反馈每次提问后总是要等很久才能看到回复你应该怎么做A. 在生成间隙通过前端界面展示动画减少用户等待的疲惫感B. 提醒用户输入尽量少的提示词C. 降低temperature值D. 首选流式输出68. 如果想要自定义 langchain 的 LLM 对象理论上只需要准备以下哪个要素A. 一个 API KeyB. 一个 Model nameC. 一个 JSON直接加载即可D. 一个输入为字符串输出为字符串的函数69. 在合规与数据安全方面以下哪项措施对于保护敏感数据在微调过程中不被泄露不是必要的A. 对数据集进行去标识化处理移除个人可识别信息B. 在传输和存储过程中实施加密技术C. 在公开分享微调模型时仅分享模型参数而非训练数据D. 使用更高性能的计算设备来加速微调过程70. 假设你正在使用大模型解决以下数学问题“小明每天存入银行10元钱但每周末周六和周日会取出20元用于消费。如果小明从某周一第一天开始存钱青问小明需要多少天才能存够100元”为了提升大模型解答此类问题的准确率以下哪种提示方法最能有效引导大模型生成正确的答案A. 提供少量样例B. 明确输出要求C. 思维链方法二多选题30 题 × 1 分 30 分1. Assistant API 的 Assistant 类的各项功能中涵盖了以下哪些操作A. 删除B. 更新C. 剪切D. 创建E. 复制F. 列举2. 在检索召回阶段以下哪些方法用于在检索后减少无关信息A. 重排序B. 滑动窗口检索C. 问题改写3. 在检索阶段以下哪些步骤是必要的A. 将用户问题转化为向量B. 在向量数据库中找出最相似的向量C. 增加模型的训练数据D. 减少模型的推理时间4. 以下哪些方法有助于你减少大模型应用的输出结果等待时间A. 使用支持上下文缓存的模型 APIB. 使用参数量更大的模型C. 提前生成和复用内容D. 减少输入 Token 数量5. 用户多次反馈 “AI 回答中有捏造内容”排查后发现是当知识库没有相关内容时大模型直接虚构答案。为减少此情况你可以怎么做A. 在百炼 RAG 应用中将回答范围设置为 “仅知识库范围”B. 调高 temperature 值C. 使用 ReRank 对检索结果再次排序D. 使用提示词无匹配就明确回复 “无法回答”6. 某大型公司对每位员工都有多条文档记录。RAG 在检索时只依赖 Embedding 相似度有时召回了不匹配的“同名员工”信息。为提高准确度你会如何处理A. 给每条记录打标签如部门、邮箱并结合标签过滤B. 修改大模型为 qwen-maxC. 改用 TokenTextSplitterD. 提高相似度阈值过滤噪声7. 为了将 RAGAS 评测适配到中文问答场景有哪些有效方法A. 使用中文能力较强的大模型B. 将 RAGAS 自带的 prompt 翻译为中文再传入C. 在 faithfulness 中修改 json.dumps 函数使其返回中文而非 unicode 码D. 在 System prompt 中提醒大模型你要适配到中文问答场景8. 通过 LlamalIndex 创建 RAG 应用在修改默认 prompt 时包含以下哪些步骤A. 用 index 的 update_prompts 方法将新的 prompt 同步上去B. 定义新的 prompt 字符串将 chunk 和 query 的位置空出来C. 对新的 prompt 进行保存使得 LlamalIndex 中的源码 prompt 也变成中文D. 使用新的 prompt 初始化一个 PromptTemplate 对象9. 以下关于temperature参数的描述哪些是正确的A. 温度值越低输出结果越固定B. 温度值越高输出结果越多样化C. 温度值不影响输出结果10. Ragas 提供的以下哪些指标用于评估生成环节A. Answer RelevancyB. FaithfulnessC. Context Precision11. 视频合规检测的关键步骤包括下列哪些选项?A. 视频上传后的用户评论分析B. 视频预处理例如视频分段和帧提取C. 音频合规检测D. 视频编码格式的选择E. 图片合规检测F. 文本合规检测包括字幕和音频转录文本12. 以下哪些描述符合基于语义的文档切片的理念A. 使用机器学习模型对文档进行语义分析并根据语义边界进行切分。B. 在 Chunk 中添加上下文信息例如标题、父级列表项等。C. 将代码模块单独切出来并标注其编程语言。D. 将文档按照固定长度进行切分。E. 将表格的每个单元格作为一个独立的 Chunk。F. 根据文档的结构例如标题、段落、列表等进行切分13. 在使用大模型提炼图文课程内容时以下哪些指导原则是正确的A. 提炼关键信息,避免冗长段落B. 使用简短标题,聚焦于要点C. 内容应尽量详细和全面D. 不做任何修改,直接使用原始内容14. 在实现大模型辅助的新员工帮助应用中以下哪些建议有助于提升用户体验A. 为每个任务定制详细的系统提示词确保大模型理解上下文。B. 限制用户查询长度因为长文本可能导致响应延迟或理解错误。C. 引入多轮对话机制允许用户基于大模型的初步回应进一步细化需求。D. 由于大模型的准确性极高无需提供反馈或修正机制。E. 实现自动检测用户查询类型并调用相应的大模型处理策略无需用户指定任务类型。15. 以下哪些因素会影响 RAG 系统的性能A. 硬件资源的限制B. 文档的质量和数量C. 向量数据库的类型和配置D. 查询语句的表达方式E. 所使用的预训练语言模型的大小和性能F. 切片方法的选择16. 你发现大量员工信息都存放在 PDF、Word 文档里部分还包含表格和图片RAG 无法正确提取关键信息。你可以怎么处理A. 手动复制粘贴所有文档内容B. 使用 OCR 技术识别并提取图片中的文字C. 强制用户只上传纯文本D. 使用 DashScopeParse 等工具对 PDF/Word 进行结构化解析17. 已知 prompt_template 定义了让大模型生成摘要的具体要求以下哪些措施可以提高摘要生成函数的生成质量A. 将 document 分成多个段落分别生成摘要最后合并。B. 在 prompt_template 中明确指出需要提取文章的主旨。C. 不使用 prompt_template直接调用大模型。D. 在 prompt_template 中提供一些示例摘要。E. 在 prompt_template 中提供更详细的输出格式要求例如指定摘要的长度、语气等。18. 在开发一款基于大语言模型的会议纪要生成工具时团队发现模型在处理会议记录时经常遗漏关键决议内容导致生成的纪要不够准确和全面。以下哪两个选项能较低成本地解决这一问题A. 增加模型的训练数据量特别是包含更多会议记录样本的数据集B. 要求模型在输出纪要时使用特定格式如紫色字体或表格形式C. 在提示词中明确角色定义例如“你是一名专业秘书负责从会议记录中提取所有关键决议和行动项”D. 要求模型先对会议记录中的行动项和决议进行逐句摘要标记再生成最终的纪要19. 在加载本地索引文件时以下哪些参数可以设置A. 存储路径B. 使用的embedding模型C. API Key20. 以下哪些选项属于提示词要素中的样例SampleA. 请你扮演一位医生。B. 输入汽车输出交通工具C. 用户输入“我想了解一下人工智能。” 你的回复“人工智能是……”D. 请用表格形式展示结果。E. 输入苹果输出水果F. 请你总结这篇文章的中心思想。21. 在多轮对话场景中以下哪些方案更有利于保障用户体验的同时降低大模型使用成本A. 在多轮对话场景中使用支持长上下文缓存的大模型 APIB. 每次对话仅保留最近 2 轮历史避免携带过长的上下文C. 按照 100 的长度对历史对话取截断避免携带上下文过长D. 在多轮对话场景中避免始终传入完整的历史对话而是用最早的历史对话做总结处理后携带在对话中22. 某电商公司需开发一个客服机器人处理“退换货政策咨询“和”商品推荐”任务。下列哪两种角色应深度参与提示词设计A. 产品经理定义用户场景和业务流程B. 前端开发工程师负责对话界面实现C. 算法工程师擅长模型调优和参数调整D. 客服部门主管熟悉用户高频问题和政策细节23. RAG应用的主要组成部分包括哪些A. 建立索引阶段B. 检索与生成阶段C. 模型训练阶段D. 模型推理阶段24. 以下哪些措施可以提高大模型在私域场景下的安全性A. 对相关人员进行安全培训B. 建立完善的安全 incident 响应机制C. 使用开源的数据管理软件D. 将所有数据存储在云端E. 定期更新大模型和相关软件F. 对大模型进行持续的安全评估和测试25. 在切片向量化与存储阶段以下哪些是余弦相似度的计算方法A. 计算向量之间的夹角B. 计算向量的点积C. 增加模型的训练数据D. 减少模型的推理时间26. 在LlamaIndex的默认提示词模板中以下哪些变量是必要的A. context_strB. query_strC. 大模型的角色27. 当你在使用一款基于大模型构建的创意助手要求它一次性产生10条宣传文案时发现生成的文案千篇一律缺乏多样性。为了在保证一定多样性的同时避免模型生成不符合主题的内容可以优先考虑以下哪些改进措施A. 使用模糊的指令让模型自由发挥。B. 检查提示词是否过于局限尝试在提示词中明确指定多个角度方向如情感、风格、视角等来扩展其灵活性。C. 固定 top_p0.1 以确保最大范围的词汇选择。D. 小幅调高 temperature 以保证生成内容的多样性。28. 关于图片合规检查的技术手段下列说法正确的有哪些A. 可以使用目标检测算法如 YOLO 系列检测图片中的敏感物体例如武器。B. OCR 技术可以用于提取图片中的文字信息用于后续的文本合规检测。C. 水印和品牌标志检查与合规性无关不需要进行检测。D. 图片内容检测只能依靠人工审核无法使用深度学习模型进行自动化分类。E. PHash 算法可以用于版权检查通过比较图像指纹识别相似图像。F. 卷积神经网络CNN可以用于对图片内容的合规性进行分类例如识别暴力内容。29. 关于大模型在文本处理中的局限性以下哪些陈述是准确的A. 即使有合适的系统提示词大模型生成的内容仍需人工复审以保证质量。B. 大模型技术已经完全成熟能够无差错地执行所有文本转换和润色任务。C. 大模型可能在处理特定领域专业术语时出现误解。D. 大模型对用户查询的依赖性强如果查询表述不清结果可能偏离预期。E. 在没有明确指示的情况下大模型可能无法自动识别源语言和目标语言。30. 在大模型的问答工作流程中以下哪些阶段涉及Token的处理A. 输入文本分词化B. Token向量化C. 大模型推理

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2466071.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！