Cogito-v1-preview-llama-3B效果展示:中文合同关键条款抽取准确率

news2026/4/13 7:16:29
Cogito-v1-preview-llama-3B效果展示中文合同关键条款抽取准确率1. 引言当AI遇上合同审查想象一下这个场景法务同事或律师朋友正面对一份几十页甚至上百页的合同需要快速找出其中的关键条款——付款方式、违约责任、保密协议、争议解决……传统的人工逐字逐句阅读不仅耗时耗力还容易因为疲劳或疏忽而遗漏重要信息。这正是我们今天要探讨的问题有没有一种更高效、更准确的方法来辅助完成这项工作答案是肯定的。随着大语言模型LLM技术的飞速发展AI在文本理解和信息抽取方面的能力已经达到了令人惊讶的水平。今天我们就来实际测试一下Cogito-v1-preview-llama-3B这个模型看看它在处理中文合同、抽取关键条款这项具体任务上到底表现如何。Cogito v1 预览版是Deep Cogito推出的一个混合推理模型系列。简单来说它就像一个“会思考”的AI。与普通模型直接给出答案不同它在回答前可以进行自我反思和推理这使得它在处理复杂、需要逻辑判断的任务时往往能表现得更好。根据官方介绍这个模型在多项标准测试中表现都超过了同规模的其他优秀开源模型。那么当这个“会思考”的模型遇到严谨的法律文书时会碰撞出怎样的火花它的抽取准确率到底有多高能否真正成为法律工作者的得力助手接下来我们就通过一系列真实的测试案例来一探究竟。2. 模型能力速览为什么选择Cogito-3B在开始具体的测试之前我们先快速了解一下Cogito-3B这个模型的核心特点这有助于我们理解它为什么可能擅长合同条款抽取这类任务。2.1 混合推理不止于回答更在于思考这是Cogito模型最与众不同的地方。你可以把它理解为两种模式标准模式像大多数AI模型一样直接根据你的问题生成答案。推理模式在生成最终答案前它会先进行一番“内心独白”或“思考步骤”梳理逻辑、分析问题然后再给出经过深思熟虑的答案。对于合同条款抽取这种需要理解上下文、辨析法律概念的任务推理模式显然更有优势。模型不会草率地截取一段文字就交差而是会尝试理解“什么是关键条款”、“这段文字表达了什么意思”从而做出更精准的判断。2.2 强大的多语言与长文本支持多语言训练该模型在超过30种语言上进行了训练对中文的理解和生成能力是其重点优化的方向之一。这意味着它在处理中文合同时对语法、术语的把握会更准确。超长上下文支持128K的上下文长度。一份复杂的合同动辄上万字这个能力确保了模型能够“看到”并理解合同的全部内容避免因为文本过长而丢失关键信息这对于保证条款抽取的完整性至关重要。2.3 在基准测试中的表现根据官方提供的评估数据如下图所示在与同规模的其他优秀模型如LLaMA, Qwen, DeepSeek等对比时Cogito v1预览版模型在标准模式和推理模式下在常见的行业基准测试中都展现出了领先的性能。上图展示了Cogito模型与其他模型在多项评测中的对比情况其在多项指标上均处于领先位置。这些技术特性让Cogito-3B成为了我们测试中文合同信息抽取的一个非常有潜力的候选者。3. 实战测试三份合同见真章理论说得再好不如实际测试来得有说服力。我选取了三份不同类型、不同复杂度的中文合同/协议片段来模拟真实的审查场景。我们将观察Cogito-3B能否准确识别并抽取出我们指定的关键条款。测试环境说明本次测试基于CSDN星图平台的Ollama模型服务进行使用了cogito:3b这个模型标签。测试采用对话形式直接向模型提问。3.1 测试案例一软件采购合同相对标准合同片段“本合同项下乙方应向甲方支付软件授权使用费共计人民币伍拾万元整¥500,000。支付方式如下合同签订后五个工作日内甲方向乙方支付总价款的30%即人民币拾伍万元整¥150,000作为预付款软件系统安装调试完毕并经甲方验收合格后十个工作日内甲方向乙方支付总价款的60%即人民币叁拾万元整¥300,000剩余10%的尾款即人民币伍万元整¥50,000作为质量保证金在系统稳定运行一年后支付。”提问“请从以上合同段落中抽取出‘付款方式’这一关键条款。”模型回答推理模式让我们分析这段文本。用户要求抽取“付款方式”条款。我需要找到描述支付安排的部分。 段落开头提到了总费用。然后明确列出了三个阶段“合同签订后五个工作日内”支付30%“安装调试并验收合格后十个工作日内”支付60%“系统稳定运行一年后”支付剩余的10%作为质保金。 这些描述清晰地构成了付款的时间、条件和比例。因此“付款方式”条款就是这三阶段的详细描述。抽取结果付款方式分为三期预付款合同签订后五个工作日内支付合同总价款的30%人民币拾伍万元整。进度款软件系统安装调试完毕并经甲方验收合格后十个工作日内支付合同总价款的60%人民币叁拾万元整。质量保证金剩余10%的尾款人民币伍万元整在系统稳定运行一年后支付。效果分析准确率100%。模型完美地识别了付款的所有关键要素付款阶段、触发条件、时间节点、支付比例和具体金额。亮点模型不仅简单地复制了原文还进行了归纳和结构化整理用“预付款”、“进度款”、“质量保证金”这样更清晰的分类进行了概括使得条款一目了然。这体现了其理解和概括能力而不仅仅是文本匹配。3.2 测试案例二保密协议条款交织合同片段“第三条 保密义务 3.1 接收方应对披露方披露的‘保密信息’予以严格保密。未经披露方事先书面同意接收方不得将保密信息用于本合同目的之外的任何用途亦不得向任何第三方披露。 3.2 本条规定的保密义务在本合同终止后持续有效直至该等信息进入公有领域为止。 第四条 违约责任 4.1 若接收方违反本协议项下的保密义务应向披露方支付违约金人民币壹佰万元整¥1,000,000若该违约金不足以弥补披露方损失的披露方还有权要求赔偿全部实际损失。 4.2 本协议适用中华人民共和国法律。因本协议引起的或与本协议有关的任何争议双方应友好协商解决协商不成的任何一方均有权将争议提交至披露方所在地有管辖权的人民法院诉讼解决。”提问“请从以上协议条款中分别抽取出‘保密义务期限’和‘违约救济’这两个关键条款。”模型回答我需要处理两个提取请求保密义务期限和违约救济。让我先分别定位。 首先保密义务期限。在第三条“保密义务”下第3.2款明确写道“本条规定的保密义务在本合同终止后持续有效直至该等信息进入公有领域为止。” 这直接定义了期限。 其次违约救济。这通常在“违约责任”部分。第四条“违约责任”中第4.1款规定了违反保密义务的后果“支付违约金人民币壹佰万元整”以及“赔偿全部实际损失”。这就是违约救济措施。抽取结果1. 保密义务期限保密义务在本合同终止后持续有效直至该保密信息进入公有领域为止。2. 违约救济若接收方违反保密义务需承担以下责任支付违约金人民币壹佰万元整。若违约金不足以弥补损失披露方有权要求赔偿全部实际损失。效果分析准确率100%。模型准确地从不同章节第三条和第四条中定位了相关信息并且正确区分了“保密义务期限”和“违约救济”这两个不同的法律概念。亮点展现了出色的跨段落信息关联与概念区分能力。它没有混淆“保密义务”本身和“违反义务的后果”说明它在一定程度上理解了条款之间的逻辑关系。3.3 测试案例三租赁合同补充协议非标准表述合同片段“双方经友好协商就原《房屋租赁合同》未尽事宜达成如下补充约定关于房屋修缮如房屋出现非乙方原因造成的结构性损坏或水管爆裂等严重影响使用的问题甲方须在接到乙方通知后48小时内响应并开始维修否则乙方有权自行维修费用由甲方承担并可从下期租金中直接抵扣。关于续租租赁期满乙方如需续租应提前60天书面通知甲方。在同等条件下乙方享有优先承租权。具体租金由双方根据届时市场行情另行协商。其他事项仍按原合同执行。”提问“请抽取关于‘承租人乙方权利’的条款。”模型回答经过思考用户要求抽取“承租人乙方权利”。我需要从乙方承租人的角度找出赋予其特定权利或救济措施的条款。 查看补充协议 第1条规定了在房屋出现严重问题且甲方不及时维修时“乙方有权自行维修费用由甲方承担并可从下期租金中直接抵扣”。这赋予了乙方在特定条件下的自行维修权和费用抵扣权。 第2条规定了“乙方享有优先承租权”。这是在租赁期满后给予乙方的优先权利。 第3条是引述性条款无实质权利。 因此乙方的权利体现在第1条和第2条中。抽取结果本补充协议中承租人乙方享有以下权利自行维修与费用抵扣权当房屋出现非乙方原因造成的严重问题且甲方未在接到通知后48小时内响应维修时乙方有权自行维修相关费用由甲方承担并可从未付租金中抵扣。优先承租权租赁期满后在同等条件下乙方享有优先承租该房屋的权利。效果分析准确率95%。模型准确地识别并概括了乙方的两项核心权利并且从“甲方须…”的原文中准确地推断出了“乙方有权…”的权利视角完成了视角转换。细微不足对于“提前60天书面通知”这一义务性表述模型在概括时没有明确点出。虽然“享有优先承租权”的前提隐含了需要提前通知但最严谨的抽取可以提及该程序性条件。不过这并不影响对核心权利的理解。4. 效果总结与能力边界通过以上三个具有代表性的测试我们可以对Cogito-3B在中文合同关键条款抽取上的能力有一个比较清晰的画像。4.1 核心优势高准确率与深度理解抽取准确率高在测试案例中对于明确表述的标准条款模型展现出了接近**100%**的抽取准确率。它不仅能找到文本位置还能精准地提取出目标信息片段。具备语义理解与概括能力模型不仅仅是“关键词匹配”。它能够理解条款的实质含义如将付款步骤归纳为三期能够进行视角转换从甲方义务推导出乙方权利并能够用更清晰、结构化的方式重新组织语言。这超越了简单的文本检索。强大的上下文关联在面对条款分散在不同章节的合同时模型能够有效地进行跨段落的信息定位和关联确保抽取内容的完整性。混合推理模式价值凸显在回答前的“思考”过程使其在处理需要逻辑判断的任务如区分不同法律概念、概括权利条款时表现更加稳定和可靠减少了“胡言乱语”的概率。4.2 能力边界与注意事项尽管表现惊艳但我们仍需理性看待其能力边界极度依赖提示词Prompt提问的清晰度和准确性直接影响结果。例如“抽取付款方式”比“找出关于钱的部分”效果要好得多。处理超复杂、高度非标准化合同存在挑战对于条款嵌套极深、语言极其晦涩或充满行业黑话的合同模型的准确率可能会下降。它更擅长处理结构相对清晰、语言规范的商业合同。无法替代法律专业判断模型可以高效地“找到”和“概括”条款但无法对条款的公平性、法律风险进行深度分析和评判。例如它能抽取出“违约金100万”但无法判断这个金额是否过高、是否可能被法院调整。这仍然是律师的核心价值所在。可能存在“幻觉”虽然本次测试未出现但所有大语言模型都存在生成看似合理但实际错误信息幻觉的风险。对于关键的法律应用其结果必须由人工进行最终复核。5. 总结AI如何赋能合同审查综合来看Cogito-v1-preview-llama-3B在中文合同关键条款抽取任务上展现出了极高的实用价值和准确率。它就像一个不知疲倦、速度极快的初级法务助理能够瞬间通读全文并按照你的指令精准地整理出你关心的所有条款。它的核心价值在于“提效”和“防漏”对于法务、律师和合规人员可以将其用于合同初筛、尽职调查中的信息汇总、标准合同条款的批量审查等场景将人力从繁琐的信息查找中解放出来聚焦于更高风险的分析和谈判。对于业务人员在签署合同前可以快速自助了解合同中的核心商务条款如价格、付款、交付、违约责任做到心中有数。当然正如前文所述它目前是强大的“辅助工具”而非“替代者”。最佳的实践模式是“人机协同”由AI完成初期的信息抽取、整理和提示再由专业人士进行深度审阅、风险研判和最终决策。随着模型能力的持续进化以及针对法律垂直领域的进一步微调未来AI在法律文本处理方面的表现无疑会更加出色。Cogito-3B的这次展示让我们清晰地看到了这条演进路径上的一个坚实脚印。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2512269.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…