视频地址:
https://www.bilibili.com/video/BV18142187g5/
书生大模型全链路开源开放体系–笔记
技术发展

inerLM2.5 支持100wtoken
核心技术思路
数据合成

1.基于规则的构造
代码 公式,函数,数学题解
2.基于模型的数据扩充
代码加注释
3.基于人类反馈的数据生成
强化学习思路,RLHF路子。
全链条开源体系

数据-》预训练-》微调-》部署-》评测-》应用
开源数据处理工具箱

数据标注:label llm 开源项目 —说是特别好用。
预训练

数据并行
流水并行
张量并行
序列并行
微调xtuner

司南评测

部署lmdeploy

部署lmdeploy推理性能对比

描述为什么需要智能体

agent智能体任务拆解

agent可以有点像prompt里的cot (chain of thought) 思维链任务拆解,把每种任务模拟人脑解决。
mindsearch ai搜索引擎的智能体

huixiagndou知识库构建工具

1.私有化部署
2.免费商用
InterLM-xcomposer
多模态模型


















