AI产业沙龙【语音之家】—京东在AI语音方向的技术探索与实践

news2025/8/4 4:19:35

CCF语音对话与听觉专委会 、中国人工智能产业发展联盟(AIIA)评估组京东科技语音之家希尔贝壳共同主办的【语音之家】AI产业沙龙—京东在AI语音方向的技术探索与实践,将于2022年11月29日19:30-21:30线上直播。

沙龙简介

如今人机对话的技术在智能客服领域得到了广泛的应用,语音应答、智能语音外呼、客服智能质检等系统为企业数字化转型提供了更多的方案,客户服务中越来越考虑为用户带来快捷便利服务的同时,注重自身运营效率的提高,产业的发展也为语音相关的技术提出了更高的诉求,服务过程的对话体验也为语音技术带来了更高的挑战,推动了语音相关技术的发展。京东语音在人机对话方面进行了深入的技术探索和落地实践,涵盖端到端模型和监督对比学习的结合帮助语音识别更准确,口语化多模态的处理帮助对话系统理解的更智能,语音编辑技术让话术播报更拟人和自然,本次线上沙龙将通过三个Talk细致介绍相关成果。

参会嘉宾

 付立

嘉宾简介:付立,京东科技语音算法工程师,主要负责语音识别相关技术的研发和落地。

分享主题:基于监督对比学习的客服语音识别技术探索与实践

摘要:语音识别技术作为京东智能人机交互平台“言犀”的一项核心技术能力,目前已经在电商、物流、金融等客服场景中获得广泛应用。然而,现有的端到端语音识别技术通常以优化整个音频的平均识别效果为训练目标,缺乏更细力度的监督信息,导致模型可能存在对吞音和近音字识别不够准确的问题。本次分享将介绍团队在监督对比学习端到端语音识别技术的探索,以及该方法在实际客服场景中的应用。

王培英

嘉宾简介:王培英,京东科技算法工程师,主要负责自然语言理解、多模态学习等算法研究,以及在智能客服、智能语音外呼等核心产品中的算法落地。

分享主题:如何提升语音对话机器人的"理解能力"

摘要:相较于文本对话机器人,语音对话系统为人们提供了更加便捷的交互方式,但同时带来了更多的技术挑战:语音识别错误难以避免、口语对话常伴随着磕磕绊绊、人机交互如何做到自然流畅。本次分享将围绕着语音对话中的语言理解问题,介绍我们在鲁棒语言理解、口语文本顺滑以及话语权决策等技术上的探索与实践。

 宋伟

嘉宾简介:宋伟,京东科技集团语音算法工程师,主要负责语音合成、声音转换和语音编辑等语音技术的研发和落地。

分享主题:基于文本的语音编辑技术的探索与实践

摘要:在很多场景中,我们希望能够像编辑文本一样直接对语音进行编辑,实现对语音内容的插入、删除和修改操作。通过语音编辑技术,可以对已有的录音内容进行修改,从而生成新的内容,该技术即可以用来删除录音中多余的口水词,在语音中插入录制过程中遗漏的部分,也可以用来替换录制出错的语音内容。语音编辑的难点在于如何保证编辑区域的韵律和上下文一致,如何保证编辑区域的音色、音质和非编辑区域保持一致,如何让编辑边界平滑过渡等问题。对此京东语音合成团队探索了高质量的语音编辑技术方案,并落地应用于内部业务,本次分享将围绕基于文本的语音编辑技术展开介绍。

沙龙议程

时间报告主题报告人
19:30-20:05基于监督对比学习的
客服语音识别技术探索与实践
付立
20:05-20:10Q&A
20:10-20:45如何提升语音对话机器人的
"理解能力"
王培英
20:45-20:50Q&A
20:50-21:25基于文本的语音编辑技术的
探索与实践
宋伟
21:25-21:30Q&A

参加方式

直播将通过语音之家微信视频号进行直播

活动奖品

11月29日在直播间,为大家准备1顶SpeechHome主题棒球帽、1个AISHELL5周年玩偶,观看直播互动即可抽取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/34673.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【构建ML驱动的应用程序】第 10 章 :为模型构建安全措施

🔎大家好,我是Sonhhxg_柒,希望你看完之后,能对你有所帮助,不足请指正!共同学习交流🔎 📝个人主页-Sonhhxg_柒的博客_CSDN博客 📃 🎁欢迎各位→点赞…

MYSQL进阶(3)

SQL语句的优化: 1)Insert语句的优化:我们如果说向数据库中插入数据,可以从下面几个方面来进行优化: 1.1)批量插入数据,values后面加上多个括号 1.2)手动控制事务,关闭自动提交,避免大量用到事务 1.3)按照主键顺序插入 2)大批量插入…

unity和C#的多线程 Thread的IsBackground属性,详解

Thread的IsBackground = true;//主程序结束后,线程随之结束 【日常要用到的】 Thread的IsBackground = false;//主程序结束后,线程不会随之结束 案例1、 using System; using System.Threading; namespace ConsoleApp1 { class Program { static void Main(st…

【数据结构】顺序表—纯C实现顺序表

顺序表文章目录定义特点缺陷静态顺序表动态顺序表接口实现顺序表初始化顺序表销毁顺序表增容头部的插入删除头插头删尾部的插入删除尾插尾删中间的插入删除中间插入中间删除顺序表查找顺序表打印定义 顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构&#xf…

sklearn.metrics模块重要API总结(持续更新)

目录前言各类指标分类指标(Classification metrics)sklearn.metrics.accuracy_scoresklearn.metrics.aucaverage_precision_score (AP)回归指标(Regression metrics)多标签排序指标(Multilabel ranking metrics&#x…

JUC05-AQS、ReentrantLock原理

一、AQS 全称是 AbstractQueuedSynchronizer,是同步器的相关框架,juc中很多锁的实现类依赖同步器(AQS的子类)完成核心操作 要点 内部维护state变量资源状态,state0表示当前无线程占用,state!0代表该锁正在被线程占用提供FIFO的等待队列&…

Mongodb实验二——分片集群搭建

目录 前言 题目一 1.创建副本集实例(Mongod) cfg0_0配置 cfg0_1配置 cfg0_2配置 ch0_0配置 ch0_1配置 ch0_2配置 ch1_0配置 ch1_1配置 ch1_2配置 2.初始化副本集 ch0conf.js配置 ch1conf.js配置 3.创建路由节点(分片管理服务器…

Live800:避开客服雷区,提升客服转化

小刘在某在线商城开了个小店铺,店铺做得不错,宝贝销量稳定,小日子过得有滋有味。 最近一段时间,流量持续下滑,销量跟着走低,可愁死了。 "流量有波动很正常,但是一直降一直降,肯…

《恋上数据结构与算法》第1季:算法概述

数据结构与算法的学习笔记目录:《恋上数据结构与算法》的学习笔记 目录索引算法概述1. 算法和数据结构1.1 什么是算法1.2 什么是数据结构2. 时间复杂度2.1 如何判断一个算法的好坏呢?2.2 基本操作执行次数2.3 大O表示法3. 空间复杂度3.1 概念定义4. 算法…

MCE | BCL6 小分子也能发挥类 PROTAC 的功能

图示摘要:来自作者 Jonas Koeppel (Ph. D., Department of Medical Oncology, Dana-Farber Cancer Institute) 的 Twitter杂合双功能降解技术 (PROTAC,靶蛋白配体-Linker-E3 连接酶配体组成的“三体”聚合物) 已被用于多种疾病相关靶点的降解剂开发&…

老年患者植入LVAD的挑战:胃肠道出血

EF值降低的心力衰竭随着年龄的增长越来越常见。据研究报道,75岁以上人群的患病率是普通人群的4倍,目前是老年人死亡和住院的最常见原因之一。治疗方案主要包括心脏移植(HT)和长期左心室辅助装置(LVAD)植入,这两种方法已被临床研究证明可降低患…

Flutter高仿微信-第34篇-单聊-小视频

Flutter高仿微信系列共59篇,从Flutter客户端、Kotlin客户端、Web服务器、数据库表结构、Xmpp即时通讯服务器、视频通话服务器、腾讯云服务器全面讲解。 详情请查看 效果图: 详情请参考 Flutter高仿微信-第29篇-单聊 , 这里只是提取小视频的部…

Android App开发即时通信中通过SocketIO在客户端与服务端间传输文本和图片的讲解及实战(超详细 附源码)

需要源码和服务端代码请点赞关注收藏后评论区留下QQ~~~ 一、通过SocketIO传输文本消息 虽然HTTP协议能够满足多数常见的接口交互,但是他属于短连接,每次调用完就自动断开连接,并且HTTP协议区分了服务端和客户端,双方的通信过程是…

机器学习知识经验分享之三:基于卷积神经网络的经典目标检测算法

文章目录前言一、一阶段目标检测算法1.YOLO系列算法2.SSD检测算法3. RetinaNet检测算法二、两阶段目标检测算法1.Faster R-CNN检测算法2.Mask R-CNN检测算法3.Cascade R-CNN检测算法总结前言 本系列文章将对机器学习知识进行分享总结。便于大家从理论层面了解人工智能基础原理…

软件被人后台篡改了收款码属于入侵吗?

最近很多做平台的小伙伴,碰到了同样的问题,就是软件程序后台被恶意篡改收款二维码 这个问题出现在平台主身上无疑是雪上加霜,第一时间找到了小蚁君,分析了一下当时的情况,先安装了小蚁的入侵检测系统,显示…

计算机毕业设计之java+ssm协同办公系统

项目介绍 本公司文档协同办公管理系统采用SSM(SpringSpringMVCMyBatis)框架开发,主要包括系统用户管理模块、用户信息模块、文件信息管理、个人事务管理、资料信息管理、登录模块、和退出模块等多个模块. 本系统主要包含了等系统用户管理、用户信息管理…

webpack5 PWA解决Web App 项目网络离线情况没法访问情况

为什么 开发 Web App 项目,项目一旦处于网络离线情况,就没法访问了。 我们希望给项目提供离线体验。 是什么 渐进式网络应用程序(progressive web application - PWA):是一种可以提供类似于 native app(原生应用程序) 体验的 Web App 的技术。…

Go语言中操作Redis

Redis介绍 Redis是一个开源的内存数据库,Redis提供了多种不同类型的数据结构,很多业务场景下的问题都可以很自然地映射到这些数据结构上。 除此之外,通过复制、持久化和客户端分片等特性,我们可以很方便地将Redis扩展成一个能够包…

Word控件Spire.Doc 【图像形状】教程(5) 如何在 C# 中将文本环绕在图像周围

Spire.Doc for .NET是一款专门对 Word 文档进行操作的 .NET 类库。在于帮助开发人员无需安装 Microsoft Word情况下,轻松快捷高效地创建、编辑、转换和打印 Microsoft Word 文档。拥有近10年专业开发经验Spire系列办公文档开发工具,专注于创建、编辑、转…

frp篇---frp-notify + Gotify 实现 FRP 用户上线通知

frp-notify Gotify 实现 FRP 用户上线通知1. 安装frp_notify2. Gotify 配置3. frp-notify 配置启动 frp_notify开机自启动1. 安装frp_notify 一个专注于消息通知的 frp server manager plugin 实现,让你对进入 frps 的连接了如指掌,不再裸奔。 项目链…