为大模型而生!顶流大佬发起成立学术会议 COLM,或成为未来 NLP 最强顶会?!

news2025/7/14 3:43:02

图片

夕小瑶科技说 原创
作者 | 智商掉了一地、ZenMoore

前段时间,ACL 2024 的主席公开抨击称“ arXiv是科研的毒瘤”,这引发了大范围的争论。

图片

一时间,大家对 *CL 的抵触情绪愈发高涨,绝大多数学界都在这场辩论中站在了支持 arXiv+Twitter 的一方。

   大模型研究测试传送门

GPT-4传送门(免墙,可直接测试,遇浏览器警告点高级/继续访问即可):
Hello, GPT4!

实际上除此之外,学界不止一次地对于学术出版和会议制度进行了广泛辩论,许多顶尖科研人员都表达了对ACL等会议匿名期政策的不满,称论文长达5个月甚至10个月无法在 arXiv 公开,导致常被其他不准备投稿会议的论文抢发,他们甚至还联合发起过一项反对 ACL 设置匿名期的联合署名行动。

这些学者普遍认为,这些匿名政策阻碍了科技的快速进步,限制了文献交流的自由,使得现在的作者们都不太愿意在ACL或类似的会议上投稿。尤其是在这个大模型技术爆炸的年代,arXiv+Twitter 或者 arXiv+微信公众号 的论文宣发方式成为了主流。

图片

一时间,大家纷纷呼吁新会当立...

COLM 的创立

在这个背景下,领域内的一些大佬认为应该为这一新的领域(LLM)设立一场专门的学术会议。类似于 2013 年 ICLR 的成立,就是专门为了 DL 这个新兴领域。

于是,Sasha Rush、Denny Zhou、Yejin Choi 等 NLP 头部科学家联合创立了 NLP 新会议 Conference On Language Modeling(COLM),旨在通过这个专注于语言建模研究的学术平台,创建一个拥有不同学科专业知识的研究人员社区,专注于理解、改进和批评语言模型技术的发展。

COLM 这个新会议的创立不仅是学界的一次创新,也是一个积极的尝试,旨在推动语言模型领域的进一步研究和合作。

回顾 ICLR 在成立后短短五年内就成为了人工智能领域的几大顶级会议之一,我们可以期望三到五年后的 COLM 也将成为 NLP 领域的头部学术会议,甚至超越 ACL/EMNLP/NAACL 目前这三大 NLP 顶会的影响力。

会议链接:https://colmweb.org/

发起人团队

COLM 的第 1 届会议由一支具备广泛语言建模研究经验的团队发起,多位领域内的大佬既包括来自工业界的研究人员,也包括来自学术界的研究人员。

图片

 

会议投稿主题

COLM 鼓励广泛全面的投稿,涵盖了 LLM 的各个方面,包括对语言模型的理解、改进和批评。该会议的议题包括但不限于:

  • 对齐:微调、指导微调、强化学习(包括人类反馈)、提示微调以及上下文对齐。

  • 数据:预训练数据、对齐数据以及通过手动或算法分析、采集或生成的合成数据。

  • 评估:基准、模拟环境、可扩展监督、评估协议和度量标准,包括人工或机器评估。

  • 社会影响:偏见、公平性、滥用、工作、气候变化等。

  • 安全性:安全、隐私、错误信息、对抗性攻击和防御。

  • 语言模型的科学:规模定律、基本限制、新兴能力、解密、可解释性、复杂性、训练动态、学习理论等。

  • 计算高效的语言模型: 优化模型效率,包括模型蒸馏、压缩、量化等。

  • 大型语言模型的工程学: 如何在不同的硬件设置上进行分布式训练和推理。

  • 语言模型的学习算法: 涵盖元学习、模型混合、持续学习等。

  • 语言模型的推理算法: 包括解码、推理、搜索算法等。

  • 人类思维、大脑、哲学、法律与语言模型: 从多个角度如认知科学、神经科学、哲学来研究模型。

  • 面向所有人的语言模型: 主要关注多语言和文化多样性。

  • 语言模型与世界: 包括模型的事实性、常识推理等。

  • 具身的语言模型: 和感知、行动、机器人等多模态结合。

  • 语言模型与交互: 聚焦交互式学习和多智能体学习。

  • 带工具和代码的语言模型: 如何与现有工具和API集成。

  • 多模态与新应用领域的语言模型: 探索在视觉、代码、数学等多模态和新应用上的可能性。

COLM 提供了广泛的主题,为研究人员提供了一个独特的平台,以共同推进语言模型领域的研究,他们将采用 NeurIPS 的投稿和评审政策,并采用 OpenReview 的相关流程。

有许多研究人员对于这个新创办的会议表达了期待与赞同。

图片

图片

 

会议重要时间节点

  • 截稿日期:2024 年 3 月 15 日(AoE 时间)

  • 举办时间:2024 年 10 月

Fun Facts

最后,比较有趣的是,COLM 会议博客中解释了为什么选择了羊驼的照片,将其形容为“丑萌丑萌的”。这不仅为 COLM 添加了一些幽默,也使这个新会议变得独具特色。

图片

 

那么问题来了,大家准备投稿这个会议吗?欢迎在评论区留言想法~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1103180.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PreparedStatement

使用参数化查询:使用预编译的语句和参数化查询来执行SQL语句,而不是将用户输入直接嵌入到SQL语句中。这将帮助防止恶意输入注入SQL语句。

Zoho WorkDrive荣获专业研究机构评定的“Leader”称号

近年,在云计算、大数据、移动互联网、社交所引领的数字化转型变革中,企业对于数字资产的保护和利用愈加重视。相较于结构化数据,企业对于非结构化数据(文档、图片、音视频等)管理的需求更强、难度更大。 同时&#xf…

NodeJS 菜鸟教程目录

NodeJS 七天入门教程 谁适合阅读本教程? 前端开发者和希望构建后端的开发者:如果你是一名前端开发者,或者是一名希望构建后端的开发者,那么本教程将为你提供一个很好的学习Node.js的机会。通过学习本教程,你可以更好地了解后端开发的技术和Node.js在后端开发中的应用。初学…

日常学习记录随笔-redis实战

redis的持久化(rdb,aof,混合持久化) redis的主从架构以及redis的哨兵架构 redis的clusterredis 是要做持久化的,一般用redis会把数据放到缓存中为了提升系统的性能 如果redis没有持久化,重启的化数据就会丢失,所有的请…

【LeetCode热题100】--31.下一个排列

31.下一个排列 思路: 方法:两遍扫描 注意到下一个排列总是比当前排列要大,除非该排列已经是最大的排列。我们希望找到一种方法,能够找到一个大于当前序列的新序列,且变大的幅度尽可能小。具体地: 我们需要…

5年经验之谈 —— App测试、Web测试和接口测试一般测试流程!

app测试流程: 1、需求分析,了解具体需求 2、测试准备:原型图、效果图、需求文件、测试用例、用例评审、各种测试数据准备 3、测试环节:接受版本,开始执行 1)冒烟测试:对版本质量的控制以及此…

【LeetCode: 260. 只出现一次的数字 III | 位运算 | 哈希表】

🚀 算法题 🚀 🌲 算法刷题专栏 | 面试必备算法 | 面试高频算法 🍀 🌲 越难的东西,越要努力坚持,因为它具有很高的价值,算法就是这样✨ 🌲 作者简介:硕风和炜,…

ModStartCMS v7.4.0 公共图片库支持,安全功能升级

ModStart 是一个基于 Laravel 模块化极速开发框架。模块市场拥有丰富的功能应用,支持后台一键快速安装,让开发者能快的实现业务功能开发。 系统完全开源,基于 Apache 2.0 开源协议,免费且不限制商业使用。 功能特性 丰富的模块市…

C# 开发工具包 – 现已正式发布

作者:Wendy Breiding 排版:Alan Wang 今天,我们很高兴地宣布 C# 开发工具包正式发布,C# 开发工具包是一个 Visual Studio Code 扩展,为 Linux、macOS 和 Windows 带来了改进的编辑器优先 C# 开发体验。 谢谢社区的努…

文件传输软件的挑战与发展趋势

无论是在教育、医疗、金融、媒体、政府等行业,还是在个人生活和工作中,文件传输软件都有着广泛的应用价值和意义。然而,随着信息技术的发展和数据量的增长,文件传输软件也面临着一些挑战和问题,同时也有着一些发展趋势…

eNSP在hybrid接口上配置vlan

一、什么是vlan VLAN(Virtual Local Area Network,虚拟局域网)是一种通信技术,它可以将一个物理的局域网在逻辑上划分成多个广播域。每个VLAN都是一个广播域,VLAN内的主机可以直接通信,而VLAN之间则不能直…

SAP-QM-质检收货时报错

采购订单收货时,报错,点击蓝字查看未清的检验批,做使用决策QA11,完成后回复正常。

论文阅读-FCD-Net: 学习检测多类型同源深度伪造人脸图像

一、论文信息 论文题目:FCD-Net: Learning to Detect Multiple Types of Homologous Deepfake Face Images 作者团队:Ruidong Han , Xiaofeng Wang , Ningning Bai, Qin Wang, Zinian Liu, and Jianru Xue (西安理工大学,西安交…

李航:关于大模型的思考及研究热点

本文阐述李航老师对 LLM 的一些看法,主要观点如下: ChatGPT 的突破主要在于规模带来的质变和模型调教方式的发明。 LLM 融合了实现人工智能的三条路径。 LLM 的开发需要结合第三者体验和第一者体验。 LLM 能近似生成心智语言。 LLM 需要与多模态大模…

Leetcode刷题详解——找到字符串中所有字母异位词

1. 题目链接:438. 找到字符串中所有字母异位词 2. 题目描述: 给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。 异位词 指由相同字母重排列形成的字符串(包括…

静态IP怎么设置网速快?

随着互联网的普及,越来越多的人需要连接到互联网。大多数人使用动态IP来连接,但有时您可能需要使用静态IP。如果您使用静态IP,那么您需要设置一个静态IP地址。这通常是在路由器或计算机上完成的。 首先,您需要了解什么是静态IP地址…

顺序表第一部分(介绍篇),三部曲后面分别是实现和介绍

目录 1、顺序表的概念及结构 1.1线性表 2、顺序表分类 2.1顺序表分类 2.1.1静态顺序表 2.1.2动态顺序表 1、顺序表的概念及结构 1.1线性表 顺序表是n个有相同特性的数据元素的有限序列。线性表非常常用,常见的数据表是: 顺序表,链表&…

德国人工智能公司【Kodex AI】完成160万欧元融资

来源:猛兽财经 作者:猛兽财经 猛兽财经获悉,总部位于德国柏林的人工智能公司【Kodex AI】今日宣布已完成160万欧元融资。 本轮融资由Signals VC领投,Techstars、德意志银行等天使投资者参与,其中包括:most AI首席执行官…

【音视频流媒体】 3、ffmpeg、ffplay、ffprobe 超详细介绍

文章目录 一、ffmpeg1.1 安装1.2 基本参数 二、ffprobe2.1 查编码格式2.2 查视频时长 五、视频转流5.1 MP4转H2645.2 H264转MP45.3 AVI转MP45.4 MP4转H265 六、视频文件6.1 播放6.2 filter 过滤器6.2.1 crop 6.3 视频截取6.4 视频拼接6.5 获取分辨率 七、视频和图7.1 视频抽帧7…

DNS(一)

介绍 名字解析服务:当主机IP变化时,只要修改名称服务即可,用户仍可以通过原有的名称进行访问而不受影响。 本地名称解析配置文件:hosts LInux中是 /etc/hosts Windows中是 C:\Windows\System32\drivers\etc\hosts DNS&…