sdu软件学院创新实训(三)
基于lx同学构建的原型系统进行了两次迭代原型系统情况队友搭建起了基本的后端springboot和langchain4j框架以及小程序前端。实现了对大模型的基本调用问答。完成milvus向量数据库的连接。待解决的问题原型系统出于测试显式写明apikey。同时没有添加对语音功能有关api调用的管理。对话记录管理存在问题没有实现专业资料的读取向量化以及写入向量数据库回答时没有进行增强检索其他功能第一次迭代修改application.yml,完成目前所有需要调用的模型的api的管理同时添加对各api的管理config类该部分使用trae调用qwen3coderNext和copilot多次迭代完成同时修复了前端多轮对话的显示问题。第二次迭代语音功能基于上次api调用的准备这次开始实现语音功能使用codex模型为gpt5.4prompt我要实现面向老年人的ai语音健康助手功能要求在chat主页点击左下角可以进入语音通话界面完善整个语音通话功能点击语音通话后进入通话界面不需要更多的点击动作可以直接开始说话说话完成后自动检测结束开始回答然后用户可以继续说话用户也可以打断ai的语音回复可以选择方言包括粤语等可以选择显示文字。 后端使用豆包语音合成模型2.0,流式语音识别大模型根据豆包语音合成模型2.0,流式语音识别大模型的文档进行语音功能的实现之后手动修复utf-8withBOM的编码不兼容问题修复前端点击的路由问题完成效果但由于微信开发者工具没办法测试音频输入待测试知识库codexgpt5.4prompt对于这个老年智能ai语音健康助手构建rag增强检索给出一个构建知识库的方案由管理员端上传或直接读取data文件夹的所有pdf文件构建专业医疗知识库根据检索知识库内容回答回答的时候给出引用来源使用流式输出回答向量数据库目前使用milvus但由于现在还没有开发管理员端上传接口无法方便调用于是追加prompt 后端启动时自动对data文件夹进行检查有没有新的pdf文件如果有就进行向量化存储用于之后检索。向量化使用的模型是 embedding: model-name: text-embedding-v4功能启动成功但报错阅读可知 text-embedding-v4 单次批量上限是 10而此处直接设置为一次性全部传入被接口拒接修改后再次报错Milvus 集合里 page_num 和 order_num 都是Int64类型但传的是 Java Integer查看文档可知Milvus Java SDK 要求必须传 Long类型。再次报错向量维度冲突text-embedding-v4返回1024维向量但之前队友的 Milvus 集合medical_knowledge 是按 384 维建的故无法写入向量数据库修复后测试在data文件夹中添加一个pdf文件切片向量化入库全部成功测试问答增强检索也成功。添加多个医学资料pdf重启后端出现多个报错由于在每个 PDF 入库后都立刻 flush而 Milvus 的 flush频率限制得很低导致批量扫描时会被连续打回 修复 批量导入过程中不频繁 flush只在整轮扫描结束后统一flush/load并带简单重试。 测试成功但消息回复的显示格式需要继续改进回复速度较慢
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2519202.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!