Voxtral TTS

AI工具

Mistral AI开源的40亿参数文本转语音模型，支持9种语言零样本语音克隆

💰 开源📱 api, cli👁 92 次浏览🔗 0 次点击📅 2026/4/1 收录

📊 CoolAI 编辑评分

4.0

满分 5.0

🔥 热度 3664

"开源项目，可自部署，社区活跃"

功能深度

4.0

易用性

4.0

性价比

3.7

生态丰富度

3.7

📖 详细介绍

Voxtral TTS 是 Mistral AI 于 2026 年 3 月发布的开源文本转语音模型。基于 40 亿参数架构，支持英语、法语、中文等 9 种语言。核心亮点包括：仅需 3-5 秒音频即可实现零样本语音克隆、90 毫秒超低首音延迟、6 倍实时生成速度。模型权重开放（Apache 2.0），可本地部署。适合企业级语音助手、客户服务、内容创作等场景。这是 Mistral 进军多模态 AI 的重要一步。