Efficient Estimation of Word Representations in Vector Space论文笔记解读

Efficient Estimation of Word Representations in Vector Space论文笔记解读

news2026/3/4 11:17:35

基本信息

作者	TomasMikolov	doi	10.48550
发表时间	2013	期刊	ICLR
网址	http://arxiv.org/abs/1301.3781

研究背景

1. What’s known 既往研究已证实
前馈神经网络语言模型(NNLM)
循环神经网络语言模型(RNNLM)

2. What’s new 创新点
Word2vec有两种模型：CBOW和Skip-gram，使得计算成本下降并且准确率提升。
Word2vec的向量表示能够自动捕捉到单词之间的语义和语法关系。

3. What’s are the implications 意义
加快训练速度。
能够在大规模语料上进行词向量的训练。
衡量词向量之间的相似程度。

研究方法

1. skip-gram
通过中心单词来预测上下文单词。对于给定的一对（中心单词，上下文单词），我们希望最大化它们的共现概率。
在这里插入图片描述
用softmax来估计每个上下文单词的概率：

损失函数：

2. cbow（词袋模型bag-of-word）
用周围词预测中心词，求和的时候忽略了每个词的顺序。
在这里插入图片描述

损失函数：

最后输出V个概率，复杂度比较高，采用了2重方法降低复杂度，分别是层次softmax和负采样。

3. Hierarchical Softmax
将输出层的单词表示为一个二叉树，其中每个叶子节点都表示一个单词。每个非叶子节点都表示两个子节点的内积，每个叶子节点都表示该单词的条件概率。由于二叉树的形状，我们可以使用 $log_{2}W$ 个节点来表示词汇表大小为W的模型，降低计算量。
在这里插入图片描述
4. Negative Sampling
舍弃多分类，把多分类转变成二分类问题（正样本和负样本）。

正样本：用中心词和其中一个周围词做成正样本（jumps over)
负样本：我们随机从词表里面选一个词与over构成负样本（over again)

增大正样本的概率，减小负样本的概率。

损失函数：正样本函数+负样本函数
在这里插入图片描述
函数“J neg-sample ”越大越好，损失函数需要加个符号让损失越小越好。
https://zhuanlan.zhihu.com/p/419804103

结果与讨论

单词向量优于以前的技术状态。
使用非常简单的模型架构可以训练高质量的词向量。计算复杂性低，可从更大的数据集中计算非常精确的高维词向量。
通过Word2vec训练出的词向量可以用于许多自然语言处理任务，例如词义相似度计算、命名实体识别和情感分析等。

重要图

文献中重要的图记录下来
图1: 新的模型架构。CBOW架构根据上下文预测当前单词，Skip-gram根据当前单词预测周围单词
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1920774.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

怎么用【指令工程】调优大模型？

怎么用【指令工程】调优大模型？

如今，大模型有很多，对于大模型的调优方式也有很多，你是否也在纠结？那么该怎么用【指令工程】调优大模型？本文总结了相关内容，一起来看看吧。你是否曾在大模型的调优选择感到非常纠结，不知如何做…

阅读更多...

Python实战Elasticsearch的核心技巧详解

Python实战Elasticsearch的核心技巧详解

概要 Elasticsearch 是一个分布式的搜索引擎，可以用于全文搜索、结构化搜索、分析等多种场景。它基于Lucene构建，提供了强大的搜索功能和数据分析能力。本文将详细介绍如何使用Python实现与Elasticsearch的交互，包括安装、配置、基本操作和实际应用示例。安装和配置安装…

阅读更多...

【MybatisPlus】QueryWapper和LambdaQueryWrapper的区别

【MybatisPlus】QueryWapper和LambdaQueryWrapper的区别

【MybatisPlus】QueryWapper和LambdaQueryWrapper的区别 （一）MyBatisPlus的条件查询构造器QueryWrapperLambdaQueryWrapper优缺点使用场景 （二）Lambda的概念（三）QueryWrapper如何进化成LambdaQueryWrapper的…

阅读更多...

【排序算法】计数排序

【排序算法】计数排序

目录一.基本思想二.缺陷及优化三.代码实现四.特性总结 1.可以排序负数 2.适合范围集中的整数 3.时间复杂度：O(Nrange) 4.空间复杂度：O(range) 5.稳定性：稳定一.基本思想根据待排序数组a创建一个新的数组count，该数组…

阅读更多...

这个软件可无限制免费领取金币，领取后即可自由实现AI文生图，AI Chat及其AI文生PPT等AI功能

这个软件可无限制免费领取金币，领取后即可自由实现AI文生图，AI Chat及其AI文生PPT等AI功能

目前AI文生图工具浩如烟海，不过基本上都是限制使用，每天只能使用几次到十几次，如果还想继续使用，那么只能花钱购买，这对于绝大多数人来说确实是一个痛点，那么有没有一款软件可以实现使用自由呢？…

阅读更多...

【在线词典】项目实现

【在线词典】项目实现

15_Dictionary 在线词典搭建客户端-服务器架构准备必要的资源整理原始数据整理英汉双语对照表，将XLSX格式转换成CSV格式，准备好vocabulary_list.csv文件备用注意：CSV格式的文件必须使用UTF-8的字符集； 建立mydatabase.…

阅读更多...

第17周：天气预测

第17周：天气预测

目录前言一、前期准备 1.1 导入库 1.2 导入数据 1.2.1 数据介绍 1.2.2 数据导入二、探索式数据分析（EDA） 2.1 数据相关性探索 2.2 是否会下雨 2.3 地理位置与下雨的关系 2.4 湿度和压力对下雨的影响 2.5 气温对下雨的影响三、数据预处理…

阅读更多...

Windows 零散记录

Windows 零散记录

文章目录一、鼠标焦点丢失一、鼠标焦点丢失如：打字时没打完鼠标焦点中途就消失了解决： 1、windowsR 组合键打开运行，输入regedit打开注册表 2、找到目录 HKEY_CURRENT_USER\Control Panel\Desktop\ForegroundLockTimeout 设置锁定超时时…

阅读更多...

starRocks搭建

starRocks搭建

公司要使用新的大数据架构，打算用国产代替国外的大数据平台。所以这里我就纠结用doris还是starrocks，如果用doris，因为是开源的，以后就可以直接用云厂商的。如果用starrocks就得自己搭建，但是以后肯定会商业化&#xf…

阅读更多...

ARM功耗管理之多核处理器启动

ARM功耗管理之多核处理器启动

安全之安全(security)博客目录导读思考：SecureBoot？多核处理器启动流程？PSCI启动方式？ 一般嵌入式系统使用的都是对称多处理器（Symmetric Multi-Processor, SMP）系统，包含了多个cpu, 这几个cp…

阅读更多...

脑电图 (EEG) ：语音脑机接口（BCI）的理想选择

脑电图 (EEG) ：语音脑机接口（BCI）的理想选择

运动性语言障碍是一种严重的医疗状况，它让患者几乎或完全失去说话能力。这种状况在帕金森病患者中的发生率为90%，在中风患者中的发生率为45.2%，在肌萎缩侧索硬化症（ALS）患者中的发生率为95%。典型的针对语言障碍的沟通…

阅读更多...

轮转数组（超详细！）

轮转数组（超详细！）

前言： 小编在上一篇文章的时候拿过轮转数组作为例子来讲述复杂度，但是小编并没有给出这个题目的正确解答，既然读者朋友已经了解复杂度了（不了解也没关系，可以看小编上一篇文章），下面&#xff0c…

阅读更多...

木舟0基础学习Java的第十六天(异常，分类，自定义异常，注意事项)

木舟0基础学习Java的第十六天(异常，分类，自定义异常，注意事项)

异常异常概述：异常是Java程序运行过程中出现的错误异常分类：API查找Throwable 1.Error(服务器宕机，数据库崩溃等) 2.Exception C(异常的继承体系)API查RuntimeException 运行时异常：一般是程序员的错误异常可以让我们发现错…

阅读更多...

LiveNVR监控流媒体Onvif/RTSP用户手册-用户管理:编辑、添加用户、关联通道、重置密码、删除、过滤搜索

LiveNVR监控流媒体Onvif/RTSP用户手册-用户管理:编辑、添加用户、关联通道、重置密码、删除、过滤搜索

LiveNVR监控流媒体Onvif/RTSP用户手册-用户管理:编辑、添加用户、关联通道、重置密码、删除、过滤搜索 1、用户管理1.1、添加用户1.2、关联通道1.3、重置密码1.4、编辑1.5、删除1.6、过滤搜索 2、RTSP/HLS/FLV/RTMP拉流Onvif流媒体服务 1、用户管理 1.1、添加用户点击用户管理…

阅读更多...

【源码开源】C#桌面应用开发：串口调试助手

【源码开源】C#桌面应用开发：串口调试助手

c#桌面应用开发 1、环境搭建和工程创建：参照番茄定时器项目工程创建参照 2、界面布局设计 3、具体功能函数 （1）端口扫描： private void btn_com_scan_Click(object sender, EventArgs e){//端口号扫描ReflashPortToComboBox(…

阅读更多...

【JavaWeb程序设计】JavaBean（二）

【JavaWeb程序设计】JavaBean（二）

目录一、请设计并实现下面的Web应用 1. 运行结果 2. inputNumber.jsp代码 3. ComputerBean.java代码 4. handleCompute 5. lookResult.jsp 二、基于MVC模式完成用户注册功能，不允许添加重名用户，使用AJAX技术在用户填写时进行检查并提示是否重复&…

阅读更多...

【产品经理】WMS多仓调拨转移说明

【产品经理】WMS多仓调拨转移说明

对于仓储管理来说，越来越多企业开始应用WMS进行系统化的管理，以提升仓库的作业效率。本文作者从业务流程和基础功能两个方面展开介绍，希望对你有帮助。一、业务流程。在线下业务流程拓展，仓库不断增多的过程中，由于…

阅读更多...

[leetcode]circular-array-loop 环形数组是否存在循环

[leetcode]circular-array-loop 环形数组是否存在循环

. - 力扣（LeetCode） class Solution { public:bool circularArrayLoop(vector<int>& nums) {int n nums.size();auto next [&](int cur) {return ((cur nums[cur]) % n n) % n; // 保证返回值在 [0,n) 中};for (int i 0; i < n; i…

阅读更多...

Apache AGE 运算符

Apache AGE 运算符

运算符字符串特定比较运算符测试数据 SELECT * FROM cypher(graph_name, $$ CREATE (:Person {name: John}),(:Person {name: Jeff}),(:Person {name: Joan}),(:Person {name: Bill}) $$) AS (result agtype);Starts With 对字符串执行区分大小写的前缀搜索。 SELECT * …

阅读更多...

Vue2-集成Element-ui、Fontawesome、Axios介绍与使用

Vue2-集成Element-ui、Fontawesome、Axios介绍与使用

文章目录前期准备Element UI介绍Element-ui安装使用Fontawesome介绍Fontawesome安装使用Axios介绍Axios安装使用本篇小结更多相关内容可查看前期准备脚手架生成vue2项目：NodeJS安装并生成Vue脚手架(保姆级) Element UI介绍 Element UI 是一个基于 Vue.js 2.0…

阅读更多...

推荐文章

最新文章