体验 Whisper

news2026/2/21 8:33:28

体验 Whisper

1. 什么是 Whisper
2. Github 地址
3. 创建虚拟环境
4. 安装 ffmpeg
5. 部署 Whisper
6. 使用 Whisper

1. 什么是 Whisper

Whisper 是一个通用的语音识别模型。它是在一个大型的不同音频数据集上训练出来的，也是一个多任务模型，可以进行多语言语音识别(multilingual speech recognition)、语音翻译(speech translation)和语言识别(language identification)。

2. Github 地址

https://github.com/openai/whisper

3. 创建虚拟环境

conda create -n whisper python==3.10.6
conda activate whisper

4. 安装 ffmpeg

sudo apt update && sudo apt install ffmpeg

5. 部署 Whisper

克隆代码库，

git clone https://github.com/openai/whisper.git; cd whisper/

安装依赖，

pip3 install -r requirements.txt
pip3 install -U openai-whisper
pip3 install git+https://github.com/openai/whisper.git 
pip3 install --upgrade --no-deps --force-reinstall git+https://github.com/openai/whisper.git
pip3 install setuptools-rust

(可选)我使用的是 WSL-Ubuntu 22.04，安装的 CUDA Toolkit 11.8，将 pytorch、torchvision、torchaudio 更新为兼容 CUDA Toolkit 11.8 的版本。

pip3 uninstall pytorch torchvision torchaudio && pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

6. 使用 Whisper

这里我录制了一句中文，测试一下效果，

whisper demo.wav --model medium --language Chinese

输出如下，

在这里插入图片描述
完结！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/501187.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

体验 Whisper

体验 Whisper

1. 什么是 Whisper

2. Github 地址

3. 创建虚拟环境

4. 安装 ffmpeg

5. 部署 Whisper

6. 使用 Whisper

相关文章

MySQL笔记（一）：设计范式、基础概念、数据库定义语言DDL

智能制造之路-从MES到MOM

【Java虚拟机】JVM日志分析和可视化工具实操

【Fluent】利用TUI命令在保存或导出文件时，给文件名加上时间步长、流动时间、迭代步数等求解过程变量的自动编码

JMeter介绍与安装教程

又开发好一个系统，详细记录软著申请过程

停车场收费系统

【网络技术】什么是CIDR

【设计模式】单例模式（懒汉和饿汉模式详解）

php+vue在线课程教育学习考试系统864t7

嵌入式软考备考_7 系统开发过程和项目管理

unity 基本寻径

红外遥控且自动避障的嵌入式智能小车系统

MySQL双写缓冲区(Doublewrite Buffer)

pip的常用操作命令

springboot+vue校园博客系统（源码+文档）

AD 域环镜本地管理员密码解决方案(LAPS)部署

06-引入SpringSecurity 尚筹网

【源码解析】Spring Cloud Gateway使用RedisRateLimiter实现限流

3BHB003154R0101确定每个控制器将如何知道设备地址、识别发给它的消息