1,项目简介
F5-TTS 于英文生成领域表现卓越,发音标准程度在本次评测软件中独占鳌头。再者,官方预设的多角色生成模式独具匠心,能够配置多个角色,一次性为多角色、多情绪生成对话式语音,别出心裁。
- 最低配置:无需显卡,CPU亦可推理生成
- 据说耗时是所有TTS中最低的
- 项目地址:https://github.com/SWivid/F5-TTS
2,项目启动
【傻瓜式启动】
conda create -n f5-tts python=3.10 conda activate f5-tts pip install torch==2.4.0+cu124 torchaudio==2.4.0+cu124 --extra-index-url https://download.pytorch.org/whl/cu124
pip install f5-tts f5-tts_infer-gradio --port 7860 --host 0.0.0.0
【部署式启动】
- 服务端:socket_server.py
- 客户端:socket_client.py
3,功能支持
E2/F5 TTS 只能功能:
- F5-TTS(通过流式匹配模仿流利、忠实语音的童话故事机)
- E2 TTS(令人尴尬的简单完全非自回归零样本 TTS)