[论文阅读] 人工智能 | 大语言模型计划生成的新范式:基于过程挖掘的技能学习

news2025/6/7 19:37:56

#论文阅读#

大语言模型计划生成的新范式:基于过程挖掘的技能学习

论文信息

Skill Learning Using Process Mining for Large Language Model Plan Generation
Andrei Cosmin Redis, Mohammadreza Fani Sani, Bahram Zarrin, Andrea Burattin
Cite as: arXiv:2410.12870 [cs.CL] (or arXiv:2410.12870v1 [cs.CL] for this version)
https://doi.org/10.48550/arXiv.2410.12870

研究背景:当LLMs遇到复杂任务的“绊脚石”

想象你让AI规划一场跨国会议,传统大语言模型(LLMs)可能会生成一个线性步骤列表:先订会议室、再发邮件、最后准备资料。但现实中,这些步骤可能可以并行进行(比如订会议室的同时预约咖啡),而LLMs却因缺乏“结构化控制流模型”,只能按顺序执行,效率低下且难以复用类似场景的经验。

这就像用简单的菜谱列表做满汉全席:每个步骤孤立执行,无法发现“预处理食材”和“调制酱汁”可以同时进行,也无法将“宴会流程”作为通用技能复用到其他活动中。现有文本规划器的核心痛点在于:

  • 线性思维限制效率:只能生成扁平动作序列,无法识别并行任务(如同时预订会议室和发送邀请)。
  • 缺乏结构导致“失忆”:相似任务需从头规划,无法复用历史技能(如重复生成“安排会议”的步骤)。
  • 黑箱决策难解释:用户难以理解为什么AI选择某一步骤,调试和优化困难。

创新点:给LLMs装上“流程显微镜”

论文的核心突破是将**过程挖掘(Process Mining)**技术引入LLMs,让AI从历史生成的动作序列中提取“技能模型”,就像从大量烹饪记录中总结出标准化菜谱流程:

  • 技能发现:用过程挖掘算法(如归纳矿工)从LLM生成的动作序列中提炼结构化控制流模型,例如将“安排会议”的不同执行痕迹整合成包含并行步骤(预订房间+准备资料)的流程模型。
  • 技能存储与检索:将模型存入“技能库”,通过“一致性检查”(Conformance Checking)匹配当前任务需求,确保检索的技能在结构上与目标任务对齐,而非仅靠文本语义相似性。
  • 并行执行与可解释性:结构化模型允许AI识别可并行的任务分支,缩短执行时间,同时让用户直观看到步骤间的逻辑关系。

研究方法和思路:三步搭建智能规划系统

1. 从“流水账”到“流程图”:过程发现提取技能

  • 输入:LLM生成的动作序列(如“预订会议室→发送邮件→准备资料”)。
  • 处理:使用归纳矿工算法分析序列,识别动作间的顺序、并行关系,生成BPMN或Petri网格式的流程模型。例如,发现“预订会议室”和“准备资料”可并行执行,合并为“会议准备”技能。
  • 输出:结构化技能模型,存入技能库。

2. 技能库:让LLMs“记住”历史经验

  • 存储形式:每个技能是一个包含控制流结构的模型,记录动作间的依赖关系和并行可能。
  • 复用机制:当新任务与历史任务相似时,LLM无需从头生成计划,直接从技能库检索匹配模型,像调用函数一样复用经验。

3. 精准匹配:一致性检查提升检索质量

  • 单阶段方法:仅用一致性检查,通过“对齐适应度”指标衡量生成计划与技能模型的结构匹配度,避免因文本表述差异导致的误匹配(如“安排会议”和“组织会谈”可能对应同一模型)。
  • 两阶段方法:先通过文本语义嵌入(如ada-002)快速过滤候选技能,再用一致性检查重新排序,平衡效率与准确性。

实验验证:结构化模型真的有用吗?

  • 数据集:使用ProcessTBench(含LLM生成的532个任务轨迹)和TaskBench(533个多语言重述任务)。
  • 关键发现
    • 过程挖掘能有效从LLM轨迹中提取高保真模型,平均“重放适应度”0.96,“对齐适应度”0.94,表明模型与真实流程高度吻合。
    • 在技能检索中,两阶段方法(ada-002+一致性检查)的F1分数达0.90,MRR达0.93,接近纯语义模型(ada-002),但在规划器准确率≥0.7时表现更优,且更具可解释性。

主要贡献:让LLMs从“新手”变“专家”

  1. 填补文本规划与代码规划的鸿沟:赋予文本型LLMs类似代码规划器的结构化控制流能力,无需依赖代码生成即可实现技能复用和并行执行。
  2. 提升效率与透明度
    • 并行执行可缩短任务时间,如TaskBench中查询响应速度提升1.43倍。
    • 结构化模型让用户清晰看到AI决策逻辑,便于调试和优化自动化流程。
  3. 开创过程挖掘与LLMs的交叉应用:首次将过程挖掘技术用于LLM的技能学习,为自动化规划提供了可解释、可复用的新框架。

总结:未来已来,但仍需探索

论文通过实验证明,过程挖掘与LLMs的结合能有效提升复杂任务的规划效率和可解释性,为企业自动化、智能代理等场景提供了新路径。然而,当前研究仍基于合成数据集,未来需在真实场景中验证,同时探索更复杂的规划器设计和开放集技能检索。

一句话总结:给LLMs一套“流程建模工具”,让它学会从历史经验中提炼可复用的结构化技能,像人类一样高效规划复杂任务。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2403283.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

矩阵QR分解

1 orthonormal 向量与 Orthogonal 矩阵 orthonormal 向量定义为 ,任意向量 相互垂直,且模长为1; 如果将 orthonormal 向量按列组织成矩阵,矩阵为 Orthogonal 矩阵,满足如下性质: ; 当为方阵时&…

【MATLAB去噪算法】基于CEEMDAN联合小波阈值去噪算法(第四期)

CEEMDAN联合小波阈值去噪算法相关文献 一、EMD 与 EEMD 的局限性 (1)EMD (经验模态分解) 旨在自适应地将非线性、非平稳信号分解成一系列 本征模态函数 (IMFs),这些 IMFs 从高频到低频排列。 核心问题:模态混合 (Mode Mixing) 同…

从理论崩塌到新路径:捷克科学院APL Photonics论文重构涡旋光技术边界

理论预言 vs 实验挑战 光子轨道角动量(Orbital Angular Momentum, OAM)作为光场调控的新维度,曾被理论预言可突破传统拉曼散射的对称性限制——尤其是通过涡旋光(如拉盖尔高斯光束)激发晶体中常规手段无法探测的"…

智能推荐系统:协同过滤与深度学习结合

智能推荐系统:协同过滤与深度学习结合 系统化学习人工智能网站(收藏):https://www.captainbed.cn/flu 文章目录 智能推荐系统:协同过滤与深度学习结合摘要引言技术原理对比1. 协同过滤算法:基于相似性的推…

文档处理组件Aspose.Words 25.5全新发布 :六大新功能与性能深度优化

在数字化办公日益普及的今天,文档处理的效率与质量直接影响到企业的运营效率。Aspose.Words 作为业界领先的文档处理控件,其最新发布的 25.5 版本带来了六大新功能和多项性能优化,旨在为开发者和企业用户提供更强大、高效的文档处理能力。 六…

固态继电器与驱动隔离器:电力系统的守护者

在电力系统中, 固态继电器合驱动隔离器像两位“电力守护神”,默默地确保电力设备的安全与稳定运行。它们通过高效、可靠的性能,保障了电力设备在各种环境下的正常工作。 固态继电器是电力控制中的关键组成部分,利用半导体器件来实…

【数据分析】基于adonis2与pairwise.adonis2的群组差异分析教程

禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者! 文章目录 介绍加载R包数据下载导入数据数据预处理adonis分析pairwise.adonis2分析总结系统信息介绍 本教程主要用于执行和分析基于距离矩阵的多样性和群落结构分析,特别是通过adonis2和pairwi…

Nginx + Tomcat负载均衡群集

目录 一、案例环境 二、部署 Tomcat(102/103) 1、准备环境 (1)关闭firewalld 防火墙 (2)安装JDK 2、安装配置 Tomcat (1)Tomcat 的安装和配置 (2)移动…

嵌入式开发之STM32学习笔记day22

STM32F103C8T6 FLASH闪存 1 FLASH简介 STM32F1系列微控制器的FLASH存储器是一种非易失性存储器,它在微控制器中扮演着至关重要的角色。以下是对STM32F1系列FLASH存储器及其相关编程方式的扩展说明: 【FLASH存储器的组成部分】 程序存储器:这…

分词算法BBPE详解和Qwen的应用

一、TL;DR BPE有什么问题:依旧会遇到OOV问题,并且中文、日文这些大词汇表模型容易出现训练中未出现过的字符Byte-level BPE怎么解决:与BPE一样是高频字节进行合并,但BBPE是以UTF-8编码UTF-8编码字节序列而非字符序列B…

多线程下使用缓存+锁Lock, 出现“锁失效” + “缓存未命中竞争”的缓存击穿情况,双重检查缓存解决问题

多线程情况下,想通过缓存同步锁的机制去避免多次重复处理逻辑,尤其是I/0操作,但是在实际的操作过程中发现多次访问的日志 2025-06-05 17:30:27.683 [ForkJoinPool.commonPool-worker-3] INFO Rule - [vagueNameMilvusReacll,285] - embeddin…

Playwright 测试框架 - .NET

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖 本博客的精华专栏: 【自动化测试】

命令行以TLS/SSL显式加密方式访问FTP服务器

昨天留了一个小尾巴~~就是在命令行或者代码调用命令,以TLS/SSL显式加密方式,访问FTP服务器,上传和下载文件。 有小伙伴可能说ftp命令不可以吗?不可以哦~~ ftp 命令本身不支持显式加密。要实现 FTP 的显式加密,可以使…

Linux配置yum 时间同步服务 关闭防火墙 关闭ESlinux

1、配置yum 1.1、Could not resolve host: mirrorlist.centos.org; 未知的错误 https://blog.csdn.net/fansfi/article/details/146369946?fromshareblogdetail&sharetypeblogdetail&sharerId146369946&sharereferPC&sharesourceRockandrollman&sharefr…

LLaMA-Factory和python版本的兼容性问题解决

引言 笔者今天在电脑上安装下LLaMA-Factory做下本地的模型调优。 从github上拉取代码git clone https://github.com/hiyouga/LLaMA-Factory.git. pycharm建立工程,按照官网指导如下: LLaMA-Factory 安装 在安装 LLaMA-Factory 之前,请确保您安装了下列依赖: 运行以…

每日算法-250605

每日算法 - 20240605 525. 连续数组 题目描述 给定一个二进制数组 nums , 找到含有相同数量的 0 和 1 的最长连续子数组,并返回该子数组的长度。 思路 前缀和 哈希表 解题过程 核心思想是将问题巧妙地转换为寻找和为特定值的子数组问题。 转换问题:我…

分布式锁-Redisson实现

目录 本地锁的局限性 Redisson解决分布式锁问题 在分布式环境下,分布式锁可以保证在多个节点上的并发操作时数据的一致性和互斥性。分布式锁有多种实现方案,最常用的两种方案是:zookeeper和redis,本文介绍redis实现分布式锁方案…

C++学习-入门到精通【14】标准库算法

C学习-入门到精通【14】标准库算法 目录 C学习-入门到精通【14】标准库算法一、对迭代器的最低要求迭代器无效 二、算法1.fill、fill_n、generate和generate_n2.equal、mismatch和lexicographical_compare3.remove、remove_if、remove_copy和remove_copy_if4.replace、replace_…

HarmonyOS运动语音开发:如何让运动开始时的语音播报更温暖

##鸿蒙核心技术##运动开发##Core Speech Kit(基础语音服务)# 前言 在运动类应用中,语音播报功能不仅可以提升用户体验,还能让运动过程更加生动有趣。想象一下,当你准备开始运动时,一个温暖的声音提醒你“…

vscode使用系列之快速生成html模板

一.欢迎来到我的酒馆 vscode,yyds! 目录 一.欢迎来到我的酒馆二.vscode下载安装1.关于vscode你需要知道2.开始下载安装 三.vscode快速创建html模板 二.vscode下载安装 1.关于vscode你需要知道 Q:为什么使用vscode? A:使用vscode写…