EMNLP 22：SetGNER: General Named Entity Recognition as Entity Set Generation

news2026/2/2 16:09:38

SetGNER: General Named Entity Recognition as Entity Set Generation

**任务形式：**识别flat、nest和不连续实体。

**任务建模方式：**采用基于pointer的方式实现任务建模，文本序列中的每个word可以用tag表示，具体为：
三个特征的tags: ⟨∅⟩, indicating no-entityfound; ⟨#⟩, indicating fragment of entity is found;
⟨/s⟩, indicating the end of the generated sequence.
Ptr(⟨∅⟩) = C,
Ptr(⟨#⟩) = C + 1,
Ptr(⟨/s⟩) = C + 2.
序列中其余tags的表示：（j是word在序列中位置）
Ptr(wj ) = C + 3 + j

pointer sequence for entity ei is defined as: 在这里插入图片描述

模型结构

1 word level 的encoder

先采用encoder编码器得到token level 的embedding的表示。
之后，采用maxpool 操作，得到word level 的embedding表示。具体是对每个word的tokens中，计算tokens的start和end的表示。
R是word level的表示，size是N*d
在这里插入图片描述

2 mention detector

2.1 预测每个head word下有多少个实体？

V = ReLU(WV R + bV )
之后，使用softmax layer计算，得到在这里插入图片描述
loss函数：

2.2 预测一个word是否是entity的head或者tail？

在这里插入图片描述

3 parallel generator

由于目标序列由Pointer tags组成，因此在解码之前应将它们转换为单词/标签。我们将此操作表示为 Retrieve(·)
在这里插入图片描述

对于retrieve之后的序列，采用bart的decoder完成解码操作。

在这里插入图片描述
loss 函数：

训练过程

还有一个反向生成过程。
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/132184.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Java算法_LeetCode122：买卖股票的最佳时机II

Java算法_LeetCode122：买卖股票的最佳时机II

LeetCode122：买卖股票的最佳时机II 给你一个整数数组 prices ，其中 prices[i] 表示某支股票第 i 天的价格。在每一天，你可以决定是否购买和/或出售股票。你在任何时候最多只能持有一股股票。你也可以先购买，然后在同一天 …

阅读更多...

有关于huggingface evaluate的使用

有关于huggingface evaluate的使用

老版本Transformer的from datasets import load_metric，在新版本中被替换成了evaluate。这个包挺难用的，而且不同版本的接口都有点不太一样，本博客以transformers4.18.0, evaluate0.4.0为例，示范一下如何使用evaluate进行常见的…

阅读更多...

【LDF】线性判别函数（一）

【LDF】线性判别函数（一）

基于判别函数的判别准则对于ccc类分类问题：设 gi(x),i1,2,…,cg_i(\mathbf{x}), i1,2, \ldots, cgi(x),i1,2,…,c, 表示每个类别对应的判别函数，决策规则为：如果 gi(x)>gj(x),∀j≠ig_i(\mathbf{x})>g_j(\mathbf{x}), \forall j \n…

阅读更多...

[机器学习-概念新] 什么是欧式距离、标准化欧式距离、马氏距离、余弦距离

[机器学习-概念新] 什么是欧式距离、标准化欧式距离、马氏距离、余弦距离

1.欧式距离(Euclidean Distance) 欧式距离源自N维欧氏空间中两点间的距离公式： 代码实践 from scipy import spatial vec1 [1, 2, 3, 4] vec2 [5, 6, 7, 8] euclidean spatial.distance.euclidean(vec1, vec2) print(euclidean) 2.标准化欧式距离（S…

阅读更多...

狂揽两千星，速度百倍提升，高性能Python编译器Codon开源

狂揽两千星，速度百倍提升，高性能Python编译器Codon开源

这个高性能 Python 编译器具有支持 Python 众多语法、完美互通其他框架等优点。众所周知，Python 是一门简单易学、具有强大功能的编程语言，在各种用户使用统计榜单中总是名列前茅。相应地，围绕 Python，研究者开发了各种便捷工具&…

阅读更多...

G1垃圾回收

G1垃圾回收

目录一、G1垃圾回收器G1垃圾回收阶段（3个）① Young Collection② Young Collection CM③ Mixed CollectionYoung Collection 跨代引用RemarkG1—垃圾回收器优化字符串去重类卸载巨型对象动态调整阈值一、G1垃圾回收器定义： Garbage First&…

阅读更多...

lanmp环境搭建，你需要一次独立安装来深入了解各个软件

lanmp环境搭建，你需要一次独立安装来深入了解各个软件

一，安装Apache yum install httpd -y,安装apache,版本为2.4.6，最新为2.4.9。 cp /etc/httpd/conf/httpd.conf /etc/httpd/conf/httpd.conf.bak; vim /etc/httpd/conf/httpd.conf （默认唯一） 端口改为8000，不能与Ngin…

阅读更多...

File类的使用

File类的使用

java，File类File类静态成员变量构造方法常用方法用于创建、删除文件/文件夹的方法用于遍历文件/文件目录的方法文件过滤器方法File类 Java文件类以抽象的方式代表文件名和目录路径名。该类主要用于文件和目录的创建、文件的查找和文件的删除等。 File对象代表磁盘…

阅读更多...

数据分析的大体思路

数据分析的大体思路

目录标题数据分析企业数据的分析的三个方向：离线分析（Batch Processing）实时分析（Real Time Processing |Streaming）：机器学习（Machine Learning）数据分析的流程明确分析的目的和思路…

阅读更多...

JVM调优基本概念

JVM调优基本概念

1、jvm组成以工作流程 jvm组成类装载器、运行时数据区（内存模型）、字节码执行引擎工作大致流程首先我们的java类编译成class类文件，当我们的class文件开始执行，我们的虚拟机便开始工作。类加载器将class加载到运行时数据区…

阅读更多...

SSM之Spring（一）

SSM之Spring（一）

目录一：Spring简介 1.1 Spring概述 1.2 SpringFrameWork 1.2.1 SpringFrameWork特性 1.2.2 Spring Framework五大功能模块二：IOC 2.1 IOC容器 2.1.1 IOC思想 2.1.2 IOC容器在Spring中的实现 2.2 基于XML管理bean 2.2.1 入门案例 2.2.2 获取bean…

阅读更多...

Golang switch 的使用的注意事项和细节

Golang switch 的使用的注意事项和细节

内容来自：尚硅谷-韩老师教学笔记，链接：尚硅谷 1）case/switch 后是一个表达式( 即:常量值、变量、一个有返回值的函数等都可以) 2）case 后的各个表达式的值的数据类型，必须和 switch 的表达式数据类型一致 3…

阅读更多...

辞暮尔尔烟火年年，朝朝暮暮岁岁平安。（2022年度总结）

辞暮尔尔烟火年年，朝朝暮暮岁岁平安。（2022年度总结）

目录前言： 一、第一件事情，重新认识自己，从内核出发二、第二件事情，告别内卷，拥抱微雕三、第三件事情，愿2023，你我更更好前言： 今天是2022年12月31日，2022年的最…

阅读更多...

Shell——变量与脚本运行的方式

Shell——变量与脚本运行的方式

文章目录变量定义变量的几种方式1）无引号2）单引号3）双引号4）反引号export定义变量变量的提取、修改与删除1）变量的提取2）变量的修改3）变量的删除特殊变量1）位置参数2）${#…

阅读更多...

Jetpack组件(fragment)（1）

Jetpack组件(fragment)（1）

一.什么是Fragment? 碎片是活动的一部分，使得活动更加的模块化设计。我们可以认为碎片是一种子活动。碎片拥有自己的布局，自己的行为及自己的生命周期回调。当活动在运行的时候，你可以在活动中添加或者移除碎片。你可以合并多个碎片在一个…

阅读更多...

Android修炼之混淆

Android修炼之混淆

自嘲时刻作为Java和Android开发者，大家应该都对混淆很熟悉了。网上也有各路大神提供的混淆模板，基本上直接拿来用就好。但我还是想捋一捋，因为工作中被混淆这家伙“玩弄”了好几次，必须把它记在小本本上。介绍基本概念混淆…

阅读更多...

Cesium中使用Sampler3D，3D纹理，实现体渲染

Cesium中使用Sampler3D，3D纹理，实现体渲染

Cesium中使用Sampler3D，3D纹理，实现体渲染 Cesium目前（20221231）还不支持直接使用3D纹理，但是其实内部已经可以WebGL2，而且内置常量也有3DTexture。所以，可以通过仿Texture，来实现3…

阅读更多...

如何彻底的理解需求，做出更好的软件

如何彻底的理解需求，做出更好的软件

背景： 最近接到了一个需求，大概的需求就是我们有一些数据，默认分为了两类。如果变多的话，用户找起来非常的困难，针对这个现象我们提出了两点解决方案。1：添加搜索。2：添加分组。第一波设计&…

阅读更多...

Android的adb命令实战篇-1

Android的adb命令实战篇-1

2023年 —— 是充满希望的一年. 对于Android开发者而言，ADB命令或多或少都使用过，今天我们就一起来整体回顾一下吧。 ADB的全称：Android Debug Bridge 1. ADB(Android Debug Bridge) 在实际工作中，周围同事会抱怨记不住常用的a…

阅读更多...

过寒假

过寒假

小时候，每到一放假就被父亲送回奶奶家。除了寒假作业，我还会带一堆书回去看。我小时候特别喜欢到邮电局大厅去订阅报刊杂志，就连学校也会报名订阅报刊。我小学时看完梁羽生的《七剑下天山》就是翻日报上每天的小说连载看完的。那时候过年时家…

阅读更多...

推荐文章

最新文章