ElevenLabs 推出语音设计 API 和 X to Voice 项目

By Amelia On 11 月 2, 2024

劳伦斯·詹格
2024 年 11 月 1 日 16:20

ElevenLabs 推出了 Voice Design API 和 X to Voice，使用户能够根据提示或 Twitter 配置文件创建独特的声音，从而扩展了语音合成的可能性。

据 ElevenLabs 称，ElevenLabs 推出了其语音设计 API，该工具允许用户根据提示生成独特的语音。这一创新功能可以创建具有特定特征的声音，例如年龄、口音和语气，甚至可以创建类似食人魔、女巫和海盗的奇幻声音。

API 特性和功能

语音设计 API 提供两个主要端点。第一个端点根据文本提示生成三个独特的语音预览，为用户提供多种选择。第二个端点允许用户将这些语音预览保存到他们的库中，从而提供对语音自定义的灵活性和控制。

为了展示语音设计 API 的潜力，ElevenLabs 开发了 X to Voice 项目。该演示项目根据用户的 X（以前称为 Twitter）个人资料创建独特的声音和头像。通过分析用户的个人资料，该工具生成个性化的语音，展示了 API 将社交媒体数据集成到语音合成中的能力。

ElevenLabs 还提供了 X to Voice 项目作为开源示例。开发人员可以访问 GitHub 上的项目，从而探索和扩展演示中演示的功能。此举旨在促进创新并鼓励利用语音设计 API 开发新应用程序。

语音设计 API 的发布标志着语音合成技术向前迈出了重要一步，为开发人员和用户等提供了创建高度个性化和多样化语音输出的工具。随着集成社交媒体资料的附加功能，在各个行业的应用可能性是巨大且有前途的。

图片来源：Shutterstock

关键词：人工智能,加密,区块链,新闻