人工智能初创公司 ElevenLabs 于周三推出了一项新功能,名为 GenFM,该功能允许用户上传不同类型的内容以生成多声道播客,类似于谷歌的 NotebookLM。
这项功能已在 ElevenLabs Reader 的 iOS 应用中上线,支持32种语言,包括英语、印地语、葡萄牙语、中文、西班牙语、法语、德语和日语等。
使用 GenFM 时,用户可以首先上传 YouTube 视频、文本或文档,应用程序会自动选择两个声音来创建播客。
ElevenLabs 提供了十多种声音供用户选择。应用程序在准备 AI 生成的播客时,用户可能会看到一些有趣的提示,比如 “添加一些停顿” 和 “插入一些填充词”。在当前许多工具帮助人们去除 “嗯” 和 “啊” 的背景下,ElevenLabs 却选择为其 AI 生成的播客添加一些人性化的元素。
ElevenLabs 的移动增长负责人 Jack McDermott 在接受 采访时表示:“我们讨论了在多大程度上引入‘嗯’、‘啊’、‘嗯哼’、笑声和呼吸等类似人类对话的填充词或覆盖声音。我们的目标是在自然人类对话和内容实用性之间找到适当的平衡。”
他还指出,优秀的长格式播客中往往干扰较少,更自然、更深入的对话流是他们追求的体验,旨在使音频叙事在不同声音和语言中更易于访问。
未来,ElevenLabs 计划支持更多的自定义选项,并允许用户添加多个来源来创建生成式 AI 播客。9月份,谷歌推出了 NotebookLM 的 AI 生成对话功能,并在一个月后新增了用户自定义播客输出的能力。
本月初,ElevenLabs 还宣布将投资1100万美元到波兰初创企业生态系统,并在华沙开设研发中心,以吸引当地 AI 人才。同时,该公司正在扩展到印度,已招聘了一名业务负责人并正在组建团队。此外,ElevenLabs 还为客户推出了对话 AI 代理。