课程文档:https://github.com/InternLM/Tutorial/blob/camp2/opencompass/readme.md
 课程作业:https://github.com/InternLM/Tutorial/blob/camp2/opencompass/homework.md
OpenCompass 大模型评测实战
- 1. 大模型的评测
 - 1.1 大模型评测如何促进发展
 - 1.2 大模型评测中的难点
 
- 2. OpenCompass介绍
 - 2.1 OpenCompass发展历程
 - 2.2 OpenCompass广泛应用助力
 - 2.3 OpenCompass评测大模型方式和优点特性
 - 2.4 OpenCompass模型排行
 
- 作业
 
1. 大模型的评测
1.1 大模型评测如何促进发展

1.2 大模型评测中的难点

2. OpenCompass介绍
2.1 OpenCompass发展历程

2.2 OpenCompass广泛应用助力

2.3 OpenCompass评测大模型方式和优点特性

 

 
 
 

2.4 OpenCompass模型排行

作业
基础作业
- 使用 OpenCompass 评测 internlm2-chat-1_8b 模型在 C-Eval 数据集上的性能
 
查看支持的数据集和模型
 
 评测结果:
 
进阶作业
- 将自定义数据集提交至OpenCompass官网
 



















