超文本转语音 API

超越标准合成我们的高分辨率生成层提供自然呼吸、停顿和表达情感的声音

通过 MCP 从您的 AI 代理使用此 API

支持 OpenClaw、Claude Code/Desktop、Cursor、Windsurf、Cline 以及任何兼容 MCP 的 AI 客户端。

文档和设置

通过封装此 MCP 创建技能： https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

🚀 核心能力

1. 超真实“GenAI”声音

超越标准合成。我们的高清（HD）生成级别提供自然呼吸、停顿和情感表达的声音。

上下文感知交付：引擎分析文本以理解是否应该低声细语、喊出警告或以权威态度传达新闻。
自然语调：能够插入现实人类元素，如“嗯”、“呃”和呼吸，使对话代理听起来真诚自发。
情感智能：基于剧本的情感动态调整情感权重（喜悦、悲伤、紧迫感）。

2. 导演级风格控制

停止依赖僵化的代码标签。使用自然语言提示控制声音。

提示到语音：只需告诉API：“像疲惫的故事书旁白一样朗读”或“像体育评论员一样快速兴奋地说”。
细粒度节奏：将演讲的节奏精确到毫秒。伸展停顿以达到戏剧效果，或加速特定短语以模仿快速的闲聊。

3. 多说话者“对话”引擎

通过一次API调用生成复杂的音频场景。

无缝轮流交谈：模拟播客、采访或客服角色扮演，其中多个不同的声音互动。
统一上下文：系统保持不同说话者之间对话的语调和流畅性，确保没有突兀的过渡。

🌍 全球覆盖与规模

我们的基础设施为全球部署而设计，确保您的应用程序可以用客户的语言与其沟通——字面意思。

特性	规格
声音组合	访问380+种不同的声音角色，涵盖所有级别。
语言覆盖	对80+种语言及其变体（地区）提供原生支持。
区域口音	深度支持区域细微差别（例如，5种以上的英语、3种以上的西班牙语和法语变体）。
录音级别	由专业配音演员录制的专业声音，适用于长篇内容（有声书/新闻），以消除听众疲劳。

⚡ 技术规格

为追求可靠性和灵活性的开发人员而构建。

超低延迟：“闪电”模型架构在<300毫秒内提供音频，使AI代理能够进行实时可中断的语音对话。
高保真音频：
录音室质量：最高支持48 kHz采样率。
压缩输出：(MP3)供后期制作使用。
输入灵活性：接受纯文本和自然语言提示。
双向流：播放即时开始，而句子的其余部分仍在生成中。

🎯 理想用例

互动AI代理：提供同情心和人性化的客户支持机器人，而不是机械化的声音。
内容制作：自动化有声书旁白、播客创建和视频配音，成本仅为录音室的几分之一。
教育科技与电子学习：生成动态的语言学习课程，具备80多种语言的完美母语发音。
游戏与虚拟现实：创建动态的NPC（非玩家角色），能够即时生成独特对话而无需预先录制的台词。

API 文档

端点

声音列表

获取语音列表

                                                                            
GET https://pr140-testing.zylalabs.com/api/11558/ultra+text-to-speech+api/21834/list+of+voices

测试端点

API 示例响应

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {
	"data": [
		{
			"gender": "FEMALE",
			"language_code": "en-US",
			"language_name": "English (US)",
			"type": "Premium",
			"voice_id": "en-US-News-L"
		}
	],
	"message": "success",
	"success": true
}

声音列表 - 代码片段


curl --location --request GET 'https://zylalabs.com/api/11558/ultra+text-to-speech+api/21834/list+of+voices' --header 'Authorization: Bearer YOUR_API_KEY'

创建文本转语音

生成文本转语音

                                                                            
POST https://pr140-testing.zylalabs.com/api/11558/ultra+text-to-speech+api/21835/create+text-to-speech

创建文本转语音 - 端点功能

对象	描述
`请求体`	[必需] Json

请求体

测试端点

API 示例响应

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"data":"https://s3.us-east-1.amazonaws.com/invideo-uploads-us-east-1/speechen-US-News-L17664032245720.mp3","message":"success","success":true}

创建文本转语音 - 代码片段


curl --location --request POST 'https://zylalabs.com/api/11558/ultra+text-to-speech+api/21835/create+text-to-speech' --header 'Authorization: Bearer YOUR_API_KEY' 

--data-raw '{
	"gender": "FEMALE",
	"language_code": "en-US",
	"language_name": "English (US)",
	"voice_id": "en-US-News-L",
	"text": "Stand by... we have a major development coming into the newsroom right now. After weeks of uncertainty—and hours of intense speculation—the decision has finally been made. The result? It is absolutely not what anyone expected! Sources on the ground are describing the atmosphere as tense... yet strangely hopeful. We are working to confirm the details at this very moment, so please... do not go anywhere."
}'

API 访问密钥和身份验证

注册后，每个开发者都会被分配一个个人 API 访问密钥，这是一个唯一的字母和数字组合，用于访问我们的 API 端点。要使用超文本转语音 API 进行身份验证，只需在 Authorization 标头中包含您的 bearer token。

标头

标头	描述
`授权`	[必需] 应为 `Bearer access_key`. 订阅后，请查看上方的"您的 API 访问密钥"。

问题

简单透明的定价

无长期承诺。随时升级、降级或取消。免费试用包括最多 50 个请求。

月度年度

(年度计费可节省 2 个月 🎉)

💫Basic

$24.99/月

5,000 请求 / 月
然后 $0.0064974 如果超过限制，每次请求
速率限制: 60 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

Popular

⚡Pro

$49.99/月

10,000 请求 / 月
然后 $0.0064974 如果超过限制，每次请求
速率限制: 60 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

🔥Pro Plus

$99.99/月

25,000 请求 / 月
然后 $0.0064974 如果超过限制，每次请求
速率限制: 120 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

⚜️Premium

$199.99/月

100,000 请求 / 月
然后 $0.0064974 如果超过限制，每次请求
速率限制: 120 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

🌟Elite

$499.99/月

500,000 请求 / 月
然后 $0.0064974 如果超过限制，每次请求
速率限制: 240 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

💎Ultimate

$999.99/月

1,000,000 请求 / 月
然后 $0.0064974 如果超过限制，每次请求
速率限制: 240 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

💫Basic

$20.83/月

5,000 请求 / 月
然后 $0.0064974 如果超过限制，每次请求
速率限制: 60 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

Popular

⚡Pro

$41.66/月

10,000 请求 / 月
然后 $0.0064974 如果超过限制，每次请求
速率限制: 60 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

🔥Pro Plus

$83.33/月

25,000 请求 / 月
然后 $0.0064974 如果超过限制，每次请求
速率限制: 120 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

⚜️Premium

$166.66/月

100,000 请求 / 月
然后 $0.0064974 如果超过限制，每次请求
速率限制: 120 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

🌟Elite

$416.66/月

500,000 请求 / 月
然后 $0.0064974 如果超过限制，每次请求
速率限制: 240 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

💎Ultimate

$833.33/月

1,000,000 请求 / 月
然后 $0.0064974 如果超过限制，每次请求
速率限制: 240 reqs 每分钟
专业客户支持
实时 API 监控
包含无限数据传输

免费 7-天试用

无承诺。随时取消

🚀 企业版

起价
$ 10,000/年

自定义数量
自定义速率限制
专业客户支持
实时 API 监控

预约通话

客户喜爱的功能

✔︎ 仅支付成功请求
✔︎ 7 天免费试用
✔︎ 多语言支持
✔︎ 一个 API 密钥，所有 API。
✔︎ 直观的仪表板

✔︎ 全面的错误处理
✔︎ 开发者友好的文档
✔︎ Postman 集成
✔︎ 安全的 HTTPS 连接
✔︎ 可靠的正常运行时间

超文本转语音 API FAQs

每个端点返回什么类型的数据

获取语音列表的端点返回可用的语音角色列表，包括性别、语言代码和语音类型等属性创建文本转语音的POST端点返回生成的音频文件的URL链接和成功消息

响应数据中的关键字段是什么

获取语音列表的关键字段包括“性别”“语言代码”“语言名称”“类型”和“语音 ID” 创建文本转语音的关键字段是“数据”（音频 URL）“消息”和“成功”

该端点可以使用哪些参数

POST 创建文本转语音接口接受参数，如需转换的文本和可选的自然语言提示以进行声音调节。用户可以通过这些提示自定义传递风格和节奏

响应数据是如何组织的

获取语音列表的响应数据以JSON格式组织，其中在“data”键下有一个语音对象数组 POST创建文本到语音的响应包含一个具有“data”“message”和“success”键的单个对象

该数据的典型使用案例是什么

典型的用例包括为互动 AI 代理生成动态音频自动化有声书叙述创建引人入胜的教育内容以及通过真实的 NPC 对话增强游戏体验

数据准确性如何保持

数据准确性通过专业配音演员录音和先进的人工智能算法相结合来保持，从而确保高质量的语音合成持续的更新和用户反馈也有助于提高语音表现

用户如何有效利用返回的数据

用户可以利用POST创建文本到语音响应中返回的音频URL来播放或存储生成的音频。GET声音列表中的声音属性可以帮助用户选择最适合其应用程序的声音

预期的标准数据模式是什么

用户可以期待结构化的JSON响应，其中包含明确的成功指示。对于获取声音列表，数据通常会包含多个声音选项，而POST创建文本到语音将在成功处理后返回一个音频文件链接

用户如何自定义他们的语音选择

用户可以通过利用GET语音列表中返回的属性来定制他们的语音选择。他们可以根据性别、语言和类型过滤语音，以找到最适合其应用的语音角色

API支持哪些类型的音频格式

该API支持生成的文本到语音音频的MP3格式音频输出。该格式适合后期制作并易于集成到各种应用程序中

API如何处理语音中的不同情感语调

API的情感智能功能根据输入文本的情感动态调整演讲的情感权重，使得演讲更加引人入胜和符合上下文的交付

POST响应中“data”字段的意义是什么

POST创建文本转语音响应中的“数据”字段包含生成的音频文件的URL链接用户可以使用该链接播放或下载音频以供其应用程序使用

API如何确保多位演讲者之间的无缝对话

多语者“对话”引擎允许API模拟具有不同声音的对话，保持统一的上下文和语调，这对于在播客或客户服务场景中创建真实的互动至关重要

使用自然语言提示进行声音调节有什么好处

自然语言提示使用户能够直观地控制语音传递风格，从而实现像“兴奋地说”或“慢慢地读”等创造性表达。这种灵活性增强了音频的情感影响力和互动性

这个API如何支持地方口音

该API提供对地区口音的深入支持，为英语、西班牙语和法语等语言提供多种变体。这确保生成的语音与当地观众产生共鸣并增强相关性

用户收到空响应时应该怎么做

如果用户收到空响应，他们应该检查输入参数的准确性和完整性确保文本和提示有效可以帮助避免空结果并提高成功生成音频的可能性

一般常见问题

什么是 Zyla API Hub？

Zyla API Hub 就像一个大型 API 商店，您可以在一个地方找到数千个 API。我们还为所有 API 提供专门支持和实时监控。注册后，您可以选择要使用的 API。请记住，每个 API 都需要自己的订阅。但如果您订阅多个 API，您将为所有这些 API 使用相同的密钥，使事情变得更简单。

价格以 USD（美元）、EUR（欧元）、CAD（加元）、AUD（澳元）和 GBP（英镑）列出。我们接受所有主要的借记卡和信用卡。我们的支付系统使用最新的安全技术，由 Stripe 提供支持，Stripe 是世界上最可靠的支付公司之一。如果您在使用卡片付款时遇到任何问题，请通过 [email protected]

此外，如果您已经以这些货币中的任何一种（USD、EUR、CAD、AUD、GBP）拥有有效订阅，该货币将保留用于后续订阅。只要您没有任何有效订阅，您可以随时更改货币。

如果我在定价页面上看到本地货币，为什么不能用它付款？

定价页面上显示的本地货币基于您 IP 地址的国家/地区，仅供参考。实际价格以 USD（美元）为单位。当您付款时，即使您在我们的网站上看到以本地货币显示的等值金额，您的卡片对账单上也会以美元显示费用。这意味着您不能直接使用本地货币付款。

我的付款被拒绝，我该怎么办？

有时，银行可能会因其欺诈保护设置而拒绝收费。我们建议您首先联系您的银行，检查他们是否阻止了我们的收费。此外，您可以访问账单门户并更改关联的卡片以进行付款。如果这些方法不起作用并且您需要进一步帮助，请通过 [email protected]

我的 API 订阅将如何收费？

价格由月度或年度订阅决定，具体取决于所选计划。

我的 API 调用将如何从我的计划中扣除？

API 调用根据成功请求从您的计划中扣除。每个计划都包含您每月可以进行的特定数量的调用。只有成功的调用（由状态 200 响应指示）才会计入您的总数。这确保失败或不完整的请求不会影响您的月度配额。

您的计费周期如何工作？

Zyla API Hub 采用月度订阅系统。您的计费周期将从您购买付费计划的那一天开始，并在下个月的同一日期续订。因此，如果您想避免未来的费用，请提前取消订阅。

如何升级我当前的 API 订阅计划？

要升级您当前的订阅计划，只需转到 API 的定价页面并选择您要升级到的计划。升级将立即生效，让您立即享受新计划的功能。请注意，您之前计划中的任何剩余调用都不会转移到新计划，因此在升级时请注意这一点。您将被收取新计划的全部金额。

如何查看本月我可以进行的剩余 API 调用次数？

要检查您本月剩余多少 API 调用，请参考响应标头中的 "X-Zyla-API-Calls-Monthly-Remaining" 字段。例如，如果您的计划允许每月 1,000 个请求，而您已使用 100 个，则响应标头中的此字段将显示 900 个剩余调用。

如何找出我的订阅计划允许的最大 API 请求数？

要查看您的计划允许的最大 API 请求数，请检查 "X-Zyla-RateLimit-Limit" 响应标头。例如，如果您的计划包括每月 1,000 个请求，此标头将显示 1,000。

如何知道我的速率限制何时重置？

"X-Zyla-RateLimit-Reset" 标头显示您的速率限制重置之前的秒数。这告诉您何时您的请求计数将重新开始。例如，如果它显示 3,600，则意味着还有 3,600 秒直到限制重置。

我可以随时取消吗？

是的，您可以随时通过访问您的账户并在账单页面上选择取消选项来取消您的计划。请注意，升级、降级和取消会立即生效。此外，取消后，您将不再有权访问该服务，即使您的配额中还有剩余调用。

7 天免费试用如何工作？

为了让您有机会在没有任何承诺的情况下体验我们的 API，我们提供 7 天免费试用，允许您免费进行最多 50 次 API 调用。此试用只能使用一次，因此我们建议将其应用于您最感兴趣的 API。虽然我们的大多数 API 都提供免费试用，但有些可能不提供。试用在 7 天后或您进行了 50 次请求后结束，以先发生者为准。如果您在试用期间达到 50 次请求限制，您需要"开始您的付费计划"以继续发出请求。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。或者，如果您在第 7 天之前不取消订阅，您的免费试用将结束，您的计划将自动计费，授予您访问计划中指定的所有 API 调用的权限。请记住这一点以避免不必要的费用。