ElevenLabs 发布了全新一代语音生成工具 Voice Design v3,允许用户通过文本提示词创建符合角色设定的个性化语音。
- 新版本模型具备更高音质、更丰富的表达力。
- 支持 70+语言 和数百种本地口音,适合制作级用途。
- 重大更新包括:
- 对语音角色的个性和韵律(如语气、语速、语调变化、年龄和性别)拥有更细致控制;
- 支持 Eleven v3 和新音频标签;
- 提升口音识别处理;
- 更高保真音频输出;
Voice Design v3 支持 70 多种语言及多种地方口音,适合各种创意和商业用途。官方展示了多个生动的案例,包括日式战士、女巫、法式女声和滑稽外星人等角色,展示了系统的灵活性和表现力。
该功能现已面向所有用户开放。
在线体验:https://elevenlabs.io/voice-design
🎨 功能详解
📝 1. 基于描述的语音生成
你只需输入一段描述性文字,系统即可即时生成相应的语音。例如:
- 示例 Prompt:
“一个平静、坚毅又粗哑的老牛仔,带有浓重的美国南方口音。”
- 生成语音:
“Well, I’ll be damned. [laughs] Looks like it’s just me and you left…”
它可以解析Prompt 中涉及的情绪、语气、年龄、背景、口音等信息,从而生成拟人化语音。
🎛️ 2. 高度可调节参数
用户可以自定义以下语音特性:
🧠 3. 模型支持的角色风格
Voice Design 支持创造多种语音风格,无论是写实还是幻想:
- 真实风格:
- “一个20岁的印度女性,声音高、柔和,说话慢且温和。”
- “中年英国男性,声音有磁性,正式且清晰。”
- 角色风格:
- “一个粗鲁、愤怒的老海盗,常常大喊大叫。”
- “一个外星人,声音尖锐、咯咯作响、带有搞笑口癖。”
📚 4. 使用指南与提示库(Prompting Guide)
为了帮助用户更好地设计语音,ElevenLabs 提供了专门的提示语写作指南,其中包括数十种风格模板、构建技巧、最佳实践,让新手也能轻松开始创作。
⚙️ 5. 语音设计 API(开发者功能)
Voice Design 提供 API 接口(目前 Alpha 阶段,仅限控制台使用):
- 生成接口:输入 prompt 和文本,即可返回语音预览。
- 保存接口:将生成的语音保存到用户语音库中。
适用于产品集成、自动化创作、个性化内容生成等开发者场景。
声明:本站资源来自会员发布以及互联网公开收集,不代表本站立场,仅限学习交流使用,请遵循相关法律法规,请在下载后24小时内删除。 如有侵权争议、不妥之处请联系本站删除处理! 请用户仔细辨认内容的真实性,避免上当受骗!
![Black Forest Labs 宣布开源对标GPT 4o 的 FLUX.1 Kontext [dev]图像模型](https://www.chaoyal.com/wp-content/uploads/replace/f8a6ea85e75a4733674e5418a42e3dfd.png)






