11月千言最新评测推荐,覆盖中文对话、视频语义理解、可信AI等前沿方向

news2025/7/13 16:46:27

千言数据集是百度联合中国计算机学会、中国中文信息学会共同发起的数据共建计划,千言针对每个自然语言处理问题,均收集和整理多个开源数据集,进行统一的处理并提供统一的测评方式,帮助加速模型的研发。截至目前,千言评测任务已覆盖15个任务方向。

千言数据集官网:https://www.luge.ai

近期,千言联合天津大学、百度搜索内容技术部等开设了多个评测任务,覆盖中文对话、视频语义理解、可解释性评测、阅读理解等前沿技术方向,详情如下:

一、中文对话任务

1、知识对话评测

知识对话是指对话系统利用外部知识信息,使聊天内容更加丰富、准确,这对提升用户体验是非常重要的。为了解决静态知识的丰富性、时效性和个性化问题,我们提出了一个全新的知识对话任务——搜索信息增强的对话(SINC)。对话系统在对话的过程中动态地搜索外部知识信息,并将搜索知识用于回复生成中。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/432/0/introduction

在这里插入图片描述

2、对话共指消解评测

在任务型对话系统中,往往包含大量的指代现象,即使用代词代替已经出现过的词语。考虑到任务型对话的特点,我们主要关注槽值的共指消解,这将有助于对话系统更好地理解对话文本。此任务要求模型具备远距离依赖建模能力、多槽值指称识别能力以及上下文感知的共指消解能力。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/550/0/introduction

在这里插入图片描述

3、对话状态追踪评测

在任务型对话系统中,对话状态追踪模块负责跟踪和更新整个对话历史中提及的与任务有关的信息,其从自然语言理解模块接收对话历史中各轮次语句提及的信息,并输出当前对话状态,即对话历史中提及的(domain, slot, value)三元组的集合。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/552/0/introduction
在这里插入图片描述

4、自然语言理解评测

在任务型对话系统中,自然语言理解(NLU)模块主要负责从用户输入的语句中获取与任务有关的信息,例如预订出租车服务时所需要的出发地和目的地等槽位的槽值,其性能对任务型对话系统的整体表现有重大影响。在涉及多领域的场景下,NLU模块的输出一般以四元组 (intent, domain, slot, value) 的集合表示。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/554/0/introduction
在这里插入图片描述

5、生成式对话省略与共指消解联合建模评测

在任务型对话系统中,除了指代现象之外,省略现象也十分常见,这使得准确理解对话变得较为困难。本次评测聚焦于对话中省略和共指消解的联合建模,要求模型能够根据对话已有上下文信息正确判断并还原当前对话语句中省略和被指代的槽值。如果句子中没有省略或指代现象,则输出原句子。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/556/0/introduction
在这里插入图片描述

6、基于对话历史的回复生成评测

在任务型对话系统中,基于对话历史信息的回复更加自然流畅,且有助于完成任务的系统侧回复语句。此任务要求模型具备理解对话历史信息,判断对话当前进度和缺失信息,并据此生成回复的能力。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/558/0/introduction
在这里插入图片描述

二、视频语义理解任务

1、视频语义理解评测

视频的深度语义理解是诸多视频智能应用的基础,期望融合知识、NLP、视觉、语音等相关技术和多模态信息,为视频生成刻画主旨信息的语义标签,从而实现视频的语义理解。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/434/0/introduction
在这里插入图片描述

2、视频看点抽取评测

视频看点是指对视频片段内容的概括,通过短句总结概括视频中各个片段的主题。所有看点构成视频内容大纲,让用户可以直观、快速地理解视频的主要内容。本任务会给出视频、视频标题、视频字幕,要求参赛选手基于提供的信息提取出视频的所有看点,并给出所有看点的起始时间和看点摘要。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/672/0/introduction
在这里插入图片描述

三、可解释性评测任务

1、中文情感分析可解释性评测

情感分析可解释性评测任务旨在评估情感分析模型预测准确率的同时,评估预测的可解释性。基于给定的输入文本t,模型输出其对应的情感标签,以及预测依赖的证据。基于模型预测的情感标签,评估模型的准确率;基于模型提供的预测依赖证据,评估预测可解释性。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/443/0/introduction
在这里插入图片描述

四、阅读理解任务

中学语文阅读理解任务评测

该评测任务中的数据集中题目为中学语文阅读理解题目。通常是一个长文章后接着几个相应的问题。文章的平均长度为1024,这十分考验模型从长文本中提炼信息的能力,同时文章同时设计古诗文和现代文。相应的问题涉及字词的理解,段落总结,逻辑推理,情感分析以及创作背景等各个方面。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/708/0/introduction
在这里插入图片描述

五、知识问答任务

针对民航出行领域中信息动态更新频繁、用户出行问答需求旺盛及大量文本数据使用价值较低等问题,探索基于阅读理解技术实现从民航相关网页的文本数据中精准抽取出的问题和答案对。

1、细粒度文本级答案抽取

此任务要求模型具有细粒度的文本理解和信息抽取能力。基于目标文章的段落集合P’,提供一个用户问句Qi,要求模型从段落集合P’中找到一个或者多个连续的片段作为答案,答案可以为词(Word)、短语(Phrase)或句子(Sentence)等,问句对应的答案集合A为不同类型答案的集合。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/668/0/introduction

在这里插入图片描述

2、段落级答案抽取

该任务关键在于评判模型对于答案段落精准定位的能力,作为篇章级答案检索的进一步细粒度定位,并为文本级答案抽取提供候选段落集合(P’)。在给定目标文章的段落集合P中,结合用户问句Q,识别包含问句答案的段落,模型可返回与答案相关或者评分较高的N个段落(Pi, Pj, Pk)。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/666/0/introduction

在这里插入图片描述

3、篇章级答案检索

本任务旨在探究模型篇章级信息检索能力,定位满足用户问句的答案所在相应文章。基于民航领域相关语料集合S,结合用户问句Q,采用信息检索相关模型与方法,返回与问句Q较相关或检索模型得分较高的N篇文章(Si, Sj, Sk等)。

评测链接:https://aistudio.baidu.com/aistudio/competition/detail/670/0/introduction

在这里插入图片描述

现在报名上述千言评测任务并提交结果,将有机会获得千言定制精美周边礼品!

在这里插入图片描述

如果您想了解更多中文NLP方向任务评测榜单,请点击查看:

https://www.luge.ai/#/luge/game

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/17767.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[附源码]java毕业设计上海景宏不锈钢厨房设备报修系统

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

云原生系列 【轻松入门容器基础操作】

✅作者简介: CSDN内容合伙人,全栈领域新星创作者,阿里云专家博主,华为云云 享专家博主,掘金后端评审团成员 💕前言: 最近云原生领域热火朝天,那么云原生是什么?何为云原生…

数据分析 | Pandas 200道练习题 进阶篇(3)

文章目录DA21 大佬用户成就值比例DA22 牛客网用户最高的正确率DA23 统计牛客网用户的名字长度DA24 去掉信息不全的用户DA25 修补缺失的用户数据DA26 解决牛客网用户重复的数据总结:❤️ 作者简介:大家好我是小鱼干儿♛是一个热爱编程、热爱算法的大三学生…

生信步骤|MAFFT结合HMMER进行多序列比对和基于隐马模型的基因搜索

蛋白质都是由相似的小型结构域组成的。如果我们有若干个已知的蛋白序列,那我们就可以根据这些蛋白序列比较其含有的保守域,寻找在蛋白数据库中上是否也有一样保守域的蛋白。而后根据统计学模型,将显著性较高的蛋白序列预测为同一类基因家族蛋…

Oracle SQL执行计划操作(5)——分区相关操作

5. 分区相关操作 该类操作与SQL语句执行计划中分区表操作相关。根据不同的具体SQL语句及其他相关因素,如下各操作可能会出现于相关SQL语句的执行计划。 1)PARTITION RANGE ALL 对范围分区(RANGE PARTITION)表的所有分区进行子…

内存泄漏检测C版小工具

一 内存泄漏简介 内存泄漏(Memory Leak)是指程序中己动态分配的堆内存由于某种原因程序未释放或无法释放,造成系统内存的浪费,导致程序运行速度减慢甚至系统崩溃等严重后果。 内存泄漏分类: 1.堆内存泄漏&#xff1…

基于LMI的非线性混沌系统滑模控制

目录 前言 1.非线性系统 2.控制器设计 3.仿真分析 3.1仿真混沌系统 3.2 LMI求解反馈阵F 3.3仿真模型 ​​​​3.4仿真结果 3.5注意事项 前言 前面我们介绍了很多种滑模面设计,以及介绍了几篇结合LMI的滑模控制,其核心思想可以看作是用LMI去控制…

【python与数据分析】Numpy数值计算基础——补充

目录 二、矩阵生成与常用操作 1.生成矩阵 2.矩阵转置 3.查看矩阵特征 4.矩阵乘法 5.计算相关系数矩阵 6.计算方差、协方差、标准差 7.行列扩展 8.常用变量 9.矩阵在不同维度上的计算 10.应用 (1)使用蒙特卡罗方法估计圆周率的值 &#xff0…

【Transformers】第 10 章 :从零开始训练 Transformer

🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞…

JS实现复制富文本到剪贴板/粘贴板的最佳实践

背景 最近有想实现一个功能,通过点击一个button按钮,来复制网页内容(含html)来实现复制后粘贴到邮件或者word具有富文本的效果。在网站翻了一些资料,要么就是方法已经被弃用,要么就是兼容性特别差,要么就是不能复制成…

HTML做一个简单漂亮的旅游网页(纯html代码)重庆旅游 7页

⛵ 源码获取 文末联系 ✈ Web前端开发技术 描述 网页设计题材,DIVCSS 布局制作,HTMLCSS网页设计期末课程大作业 | 家游景点介绍 | 旅游风景区 | 家乡介绍 | 等网站的设计与制作 | HTML期末大学生网页设计作业 HTML:结构 CSS:样式 在操作方面…

HTML+CSS简单漫画网页设计成品--(红猪(9页)带注释)

⛵ 源码获取 文末联系 ✈ Web前端开发技术 描述 网页设计题材,DIVCSS 布局制作,HTMLCSS网页设计期末课程大作业 | 网页设计作业 | 动漫网页设计 | 动漫网页设计成品 | 动漫网页设计成品模板 | 简单漫画网页设计成品 | HTML期末大学生网页设计作业,Web大学…

Linux自建RustDesk中继服务器

向日葵、ToDesk,想控制手机。【收费】、【收费】、【收费】、【收费】 作为编程人员,这钱我有点不想花。手里有常开机电脑,于是我萌生想法,使用frp做代理,用adb命令将手机的屏幕截图后展示在网页上,按秒刷…

布谷鸟搜索算法的改进及其在优化问题中的应用(Matlab代码实现)

🍒🍒🍒欢迎关注🌈🌈🌈 📝个人主页:我爱Matlab 👍点赞➕评论➕收藏 养成习惯(一键三连)🌻🌻🌻 🍌希…

GIS重投影的方法

ArcGIS修改地理坐标系/投影坐标系 把坐标系修改为和已知数据坐标系相同,使之能正常显示数据 加载数据,若加载数据的过程中,出现以下提示,则说明坐标系不一致,建议转换。 首先给数据框设置一个坐标系,该坐…

STC51单片机31——红外遥控收发代码

发射部分代码&#xff1a; #include<reg51.h> #define uchar unsigned char #define uint unsigned int sbit P20P2^0; //发射引脚 sbit P10P1^0; sbit P11P1^1; uchar k; void delay() { uchar j,i; for(i0;i<255l;i) for(j0;j<255;j) ; } void…

明道云在艾默生数字化实践的新进展

本文来自艾默生电气IT经理丁元才&#xff0c;在明道云2022年秋季伙伴大会活动演讲&#xff0c;经校对编辑后整理为演讲精华。 大家早上好&#xff0c;今天我讲的主题叫《明道云在艾默生数字化实践的新进展》。这个“新进展”刚好契合明道云今天的大会主题——新力量、新希望。…

完美收官 | IOTE第十八届国际物联网展精彩落幕,美格智能参展回顾

11月15日-17日&#xff0c;由深圳市物联网产业协会主办&#xff0c;深圳市物联传媒有限公司、深圳市易信物联网络有限公司承办的第十八届IOTE国际物联网博览会以“数智芯生&#xff0c;云端共创”为主题&#xff0c;在深圳国际会展中心&#xff08;宝安&#xff09;17号馆盛大召…

如何根据项目的eslint去配置vscode的setting

文章目录一、安装 必要的插件1-1 Eslint1-2 Prettier-Code formatter1-3 安装Vetur二、配置相关文件2-1 配置 setting.json2-1-1 找到setting.json文件配置vscode2-1-2 在文件中添加如下配置2-2 配置 .eslintrc.js2-3 配置 .editorconfig2-4 配置.eslintignore三、之前配置记录…

基于80C51单片机的经纬度定位显示装置设计

目 录 摘要&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#xff0e;&#…