Voxtral TTS — AI工具Logo

Voxtral TTS

AI工具

Mistral AI开源的40亿参数文本转语音模型,支持9种语言零样本语音克隆

💰 开源📱 api, cli👁 3 次浏览🔗 0 次点击📅 2026/4/1 收录

📊 CoolAI 编辑评分

4.0
满分 5.0
🔥 热度 3664
"开源项目,可自部署,社区活跃"
功能深度
4.0
易用性
4.0
性价比
3.7
生态丰富度
3.7

📖 详细介绍

Voxtral TTS 是 Mistral AI 于 2026 年 3 月发布的开源文本转语音模型。基于 40 亿参数架构,支持英语、法语、中文等 9 种语言。核心亮点包括:仅需 3-5 秒音频即可实现零样本语音克隆、90 毫秒超低首音延迟、6 倍实时生成速度。模型权重开放(Apache 2.0),可本地部署。适合企业级语音助手、客户服务、内容创作等场景。这是 Mistral 进军多模态 AI 的重要一步。

✅ 核心功能

  • 零样本语音克隆
  • 9种语言支持
  • 90ms超低延迟
  • 流式生成
  • 40亿参数
  • Apache 2.0开源