ElevenLabs 发布了全新一代语音生成工具 Voice Design v3,允许用户通过文本提示词创建符合角色设定的个性化语音。

  • 新版本模型具备更高音质、更丰富的表达力。
  • 支持 70+语言 和数百种本地口音,适合制作级用途。
  • 重大更新包括:
    • 对语音角色的个性和韵律(如语气、语速、语调变化、年龄和性别)拥有更细致控制;
    • 支持 Eleven v3 和新音频标签;
    • 提升口音识别处理;
    • 更高保真音频输出;

Voice Design v3 支持 70 多种语言及多种地方口音,适合各种创意和商业用途。官方展示了多个生动的案例,包括日式战士、女巫、法式女声和滑稽外星人等角色,展示了系统的灵活性和表现力。

该功能现已面向所有用户开放。

在线体验:https://elevenlabs.io/voice-design

🎨 功能详解

📝 1. 基于描述的语音生成

你只需输入一段描述性文字,系统即可即时生成相应的语音。例如:

  • 示例 Prompt

    “一个平静、坚毅又粗哑的老牛仔,带有浓重的美国南方口音。”

  • 生成语音

    “Well, I’ll be damned. [laughs] Looks like it’s just me and you left…”

它可以解析Prompt 中涉及的情绪、语气、年龄、背景、口音等信息,从而生成拟人化语音。


🎛️ 2. 高度可调节参数

用户可以自定义以下语音特性:

🧠 3. 模型支持的角色风格

Voice Design 支持创造多种语音风格,无论是写实还是幻想:

  • 真实风格:
    • “一个20岁的印度女性,声音高、柔和,说话慢且温和。”
    • “中年英国男性,声音有磁性,正式且清晰。”
  • 角色风格:
    • “一个粗鲁、愤怒的老海盗,常常大喊大叫。”
    • “一个外星人,声音尖锐、咯咯作响、带有搞笑口癖。”

📚 4. 使用指南与提示库(Prompting Guide)

为了帮助用户更好地设计语音,ElevenLabs 提供了专门的提示语写作指南,其中包括数十种风格模板、构建技巧、最佳实践,让新手也能轻松开始创作。


⚙️ 5. 语音设计 API(开发者功能)

Voice Design 提供 API 接口(目前 Alpha 阶段,仅限控制台使用):

  • 生成接口:输入 prompt 和文本,即可返回语音预览。
  • 保存接口:将生成的语音保存到用户语音库中。

适用于产品集成、自动化创作、个性化内容生成等开发者场景。