机器学习：自督导式学习模型

机器学习：自督导式学习模型

news2025/12/24 21:14:45

outline

在这里插入图片描述

自督导式模型有跨语言的能力

在这里插入图片描述

中文：DRCD的数据集
英文：SQuAD的数据集
在104种语言上进行学习，并在英文上进行微调，结果在中文上效果也比较好。

XTREME Benchmark
只用英文进行微调，在其他剩下的语言中进行测试。

bert可以无视语言的表象，只了解符合背后代表的语义。

看看英文对中文相近的分数算出来，然后取平均值得到MRR，该值越大越好。

语言的信息藏在哪里呢？通过embedding展示，相近的词更接近

英文转化成向量后，并对其进行偏移向量后，能够重构为中文。

可以在英文上测试，并在中文上进行测试。中英文上的embedding是有点差距的。

自督导式模型有跨领域的能力

在这里插入图片描述

把DNA的组成替换成字符型的表示形式进行学习

用bert有明显的提升。不仅学到了语义信息，也学到了一些通用的能力，在其他领域也能有较好的性能，

在DNA 蛋白质音乐上都有所帮助。

pre-trained模型有强化模型的能力
在这里插入图片描述
跨语言学习的能力用在语音回答系统。

终极状态：输入是语音，输出也是语音。

光用hubert是不行的，可以通过中间层后再加几层网络：

在这里插入图片描述
可以把Hubert的输出丢给文字的预训练Bert

在人造的资料上训练Bert

在这里插入图片描述

通过规则生成一些tokens，并将tokens进行映射，之后再送到网络中进行学习。

random产生的资料的效果不好
pair产生资料的效果还是非常明显的
shuffle产生的资料效果还是可以的

token的序列长度是非常重要的。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1317290.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【计算机视觉】SIFT

【计算机视觉】SIFT

在边缘提取的时候，用高斯一阶导对信号进行卷积，响应值最大的就是边界如果用高斯二阶导对信号进行卷积，0点就是边界点（二阶导等于0的点，对应一阶导的极值点） 如果用高斯二阶导在不同的信号上进行卷积&#x…

阅读更多...

基于主动安全的AIGC数据安全建设

基于主动安全的AIGC数据安全建设

面对AIGC带来的数据安全新问题，是不是就应该一刀切禁止AIGC的研究利用呢？答案是否定的。要发展AIGC，也要主动积极地对AIGC的数据安全进行建设。让AIGC更加安全、可靠的为用户服务。为达到此目的，应该从三个方面来开展AIGC的数据安…

阅读更多...

【GPU】安装nvidia驱动

【GPU】安装nvidia驱动

安装NVIDIA驱动通常有几种方法，包括使用发行版自带的软件仓库、使用NVIDIA官方网站上的.run文件、或使用专有的PPA（个人软件包存档）等。以下是基于不同情况的一般步骤： 一、通过发行版仓库安装（以Ubuntu为例&#xff…

阅读更多...

【深度强化学习】策略梯度方法：REINFORCE、Actor-Critic

【深度强化学习】策略梯度方法：REINFORCE、Actor-Critic

参考 Reinforcement Learning, Second Edition An Introduction By Richard S. Sutton and Andrew G. Barto非策略梯度方法的问题之前的算法，无论是 MC，TD，SARSA，Q-learning， 还是 DQN、Double DQN、Dueling DQN…

阅读更多...

day02-报表技术POI

day02-报表技术POI

1、基于模板导出列表数据 1.1、需求按照以下样式导出excel 1.2、思路首先准备一个excel模板，这个模板把复杂的样式和固定的内容先准备好并且放入到项目中，然后读取到模板后向里面放入数据。 1.3、实现第一步：准备一个excel作为导出的…

阅读更多...

ShuffleNet V1+V2(pytorch)

ShuffleNet V1+V2(pytorch)

V1 V1根本思想： 1.GConv替换resnet的普通1*1Conv 2.GConv后加channel shuffle模块对GConv的不同组进行重新组合。channel_shuffle a是resnet模块，b，c是ShuffleNetV1的block，在V1版中，两模块branch2的第一个1*1卷积…

阅读更多...

i春秋云镜之Tsclient

i春秋云镜之Tsclient

首先拿到目标:39.99.137.155 首先通过Fscan扫描目标: 可以看到扫描出来了一个SqlServer的弱口令。账号是sa，密码是1qaz!QAZ。这里就不使用navicat进行连接了，这里使用impacket-mssqlclient进行连接。 impacket-mssqlclient sa:1qaz!QAZ39.99.137.…

阅读更多...

Electron框架：构建跨平台桌面应用的终极解决方案

Electron框架：构建跨平台桌面应用的终极解决方案

文章目录一、Electron框架简介二、Electron框架的优势1. 开发效率高2. 跨平台性能好3. 易于维护4. 强大的原生能力三、如何使用Electron框架快速开发跨平台桌面应用1. 安装Electron2. 创建项目文件夹3. 编写主进程代码4. 编写界面代码5. 运行应用《Electron入门与实战》编辑…

阅读更多...

Chromadb词向量数据库总结

Chromadb词向量数据库总结

简介 Chroma 词向量数据库是一个用于自然语言处理（NLP）和机器学习的工具，它主要用于词嵌入（word embeddings）。词向量是将单词转换为向量表示的技术，可以捕获单词之间的语义和语法关系，使得计算…

阅读更多...

linux日志管理_日志轮转logrotate

linux日志管理_日志轮转logrotate

10.2 日志轮转logrotate 10.2.1 简介日志：记录了程序运行时各种信息。通过日志可以分析用户行为，记录运行轨迹，查找程序问题。但由于磁盘的空间是有限的，日志轮转就像飞机里的黑匣子，记录的信息再重要也只能记录…

阅读更多...

漏刻有时百度地图API实战开发(12)(切片工具的使用、添加自定义图层TileLayer)

漏刻有时百度地图API实战开发(12)(切片工具的使用、添加自定义图层TileLayer)

TileLayer向地图中添加自定义图层 var tileLayer new BMap.TileLayer();tileLayer.getTilesUrl function (tileCoord, zoom) {var x tileCoord.x;var y tileCoord.y;return images/tiles/ zoom /tile- x _ y .png;}var lockMap new BMap.MapType(lock_map, tileLaye…

阅读更多...

[ 8 种有效方法] 如何在没有备份的情况下恢复 Android 上永久删除的照片？

[ 8 种有效方法] 如何在没有备份的情况下恢复 Android 上永久删除的照片？

我们生命中最重要的时刻，但这样做有缺点，其中之一就是数据丢失的风险。您可能倾向于定期删除无意义的照片，同时保存可爱的照片，从而使您的 Android 设备井井有条。然而，有些人在删除自己珍视的图像时不小心犯了错误。您…

阅读更多...

安卓跳转页面闪屏，方法里需要传View 参数

安卓跳转页面闪屏，方法里需要传View 参数

/*** 跳转到首页的公共方法* */public void ToIndexpage(View v){//设置跳转的页面Intent intent new Intent(this, MainActivity.class);//实行跳转startActivity(intent);}

阅读更多...

【PHP入门】1.1-PHP初步语法

【PHP入门】1.1-PHP初步语法

-PHP语法初步- PHP是一种运行在服务器端的脚本语言，可以嵌入到HTML中。 1.1.1PHP代码标记在PHP历史发展中，可以使用多种标记来区分PHP脚本 ASP标记： <% php代码 %>短标记： <? Php代码 ?>，以上两种…

阅读更多...

解锁数据探索新时代，JetBrains DataGrip 2023 Mac/win中文版下载

解锁数据探索新时代，JetBrains DataGrip 2023 Mac/win中文版下载

JetBrains DataGrip 2023 Mac/win，作为一款全新的数据库管理和开发工具，为数据工程师、分析师和开发人员提供了强大的功能和工具，帮助他们更高效地处理和分析数据。无论你是使用Mac还是Windows系统，都能够通过这款软件轻松驾驭数据…

阅读更多...

Spring MVC 中的常用注解和用法

Spring MVC 中的常用注解和用法

目录一、什么是 Spring MVC 二、MVC定义三、简述 SpringMVC 起到的作用有哪些? 四、注解五、请求转发或请求重定向一、什么是 Spring MVC Spring Web MVC 是基于 Servlet API 构建的原始 Web 框架，从⼀开始就包含在 Spring 框架中。它的正式名称“Spring Web…

阅读更多...

css 使用flex 完成瀑布流布局

css 使用flex 完成瀑布流布局

瀑布流布局在商城类、文章类 app、网页中都是常用的，使用这样的形式，能过让整个页面更加的活波，也能让图片根据实际的大小来显示，更好的展示图片内容。那么代码如何实现呢实现的效果代码 <template><view class"…

阅读更多...

【Python节日系列】慢慢画一棵粉红色的圣诞树（完整代码）

【Python节日系列】慢慢画一棵粉红色的圣诞树（完整代码）

写在前面本期内容：慢慢画一棵粉红色的圣诞树，圣诞节快乐吖！目录目录写在前面目录环境需求粉红色圣诞树

阅读更多...

谈谈spring中AOP

谈谈spring中AOP

概述在软件业，AOP为Aspect Oriented Programming的缩写，意为：面向切面编程，通过预编译方式和运行期动态代理实现程序功能的统一维护的一种技术。AOP是OOP的延续，是软件开发中的一个热点，也是Spring框架中…

阅读更多...

尚硅谷JavaWeb电子书城项目(Java+Mysql+Tomcat+Jsp)

尚硅谷JavaWeb电子书城项目(Java+Mysql+Tomcat+Jsp)

自己写的在线电子书城项目，可改写，添加功能，如打折，分类，用户管理，评论等功能。使用方法： 1.使用idea导入项目。 2.数据库要用项目resource文件里的book.sql文件建立。 3.修改jdbc.properi…

阅读更多...

推荐文章

最新文章