ULTRA Texto para Fala API

Vá além da síntese padrão Nossa Camada Generativa de Alta Definição (HD) oferece vozes que respiram pausam e emitem emoções naturalmente

Use esta API do seu agente de IA via MCP

Funciona com OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline e qualquer cliente de IA compatível com MCP.

Docs e configuração

Crie uma skill envolvendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

🚀 Capacidades Essenciais

1. Vozes "GenAI" Hiper-Reais

Vá além da síntese padrão. Nosso Tier Generativo de Alta Definição (HD) oferece vozes que respiram, pausam e expressam emoções de forma natural.

Entrega Consciente do Contexto: O motor analisa o texto para entender se deve sussurrar um segredo, gritar um aviso ou transmitir notícias com autoridade.
Desfluências Naturais: Capaz de inserir elementos humanos realistas como "ums," "uhs," e respirações para agentes conversacionais que soam genuinamente espontâneos.
Inteligência Afetiva: Ajusta dinamicamente o peso emocional (alegria, tristeza, urgência) com base no sentimento do seu roteiro.

2. Controle de Estilo em Nível de Diretor

Pare de depender de tags de código rígidas. Controle a voz usando comandos em linguagem natural.

Prompt para Fala: Basta dizer à API: *"Leia isso como um narrador de livro infantil cansado"* ou *"Fale isso rapidamente e animadamente como um comentarista esportivo."*
Ritmo Granular: Ajuste o ritmo da fala até o milissegundo. Prolongue pausas para efeito dramático ou acelere frases específicas para imitar uma conversa rápida.

3. Motor de "Diálogo" Multivocal

Gere cenas de áudio complexas com um único chamado à API.

Interação Sem Costura: Simule podcasts, entrevistas ou papéis de atendimento ao cliente onde várias vozes distintas interagem.
Contexto Unificado: O sistema mantém o tom e o fluxo da conversa entre diferentes falantes, garantindo que não haja transições abruptas.

🌍 Alcance Global & Escala

Nossa infraestrutura é projetada para implantação global, garantindo que sua aplicação fale a língua de seus clientes—literalmente.

Recurso	Especificação
Portfólio de Vozes	Acesso 380+ personalidades de voz distintas em todos os níveis.
Cobertura Linguística	Suporte nativo para 80+ idiomas e variantes (locais).
Acentos Regionais	Apoio profundo para nuances regionais (por exemplo, 5+ variantes de inglês, 3+ variantes de espanhol e francês).
Tier de Estúdio	vozes especializadas gravadas por atores de voz profissionais para conteúdo de longa duração (audiolivros/notícias) para eliminar a fadiga do ouvinte.

⚡ Especificações Técnicas

Construído para desenvolvedores que exigem confiabilidade e flexibilidade.

Latência Ultra-Baixa: Arquitetura do modelo "Flash" entrega áudio em <300ms, permitindo conversas de voz em tempo real e interrompíveis para agentes de IA.
Áudio de Alta Fidelidade:
Qualidade de Estúdio: Até 48 kHz de taxa de amostragem.
Saída Comprimida: (MP3) para pós-produção.
Flexibilidade de Entrada: Aceita Texto Simples e Comandos de Linguagem Natural.
Streaming Bidirecional: A reprodução começa instantaneamente enquanto o resto da frase ainda está sendo gerado.

🎯 Casos de Uso Ideais

Agentes de IA Interativos: Potencialize bots de suporte ao cliente que soem empáticos e humanos, não robóticos.
Produção de Conteúdo: Automatize a narração de audiolivros, criação de podcasts e dublagem de vídeos a uma fração do custo de um estúdio.
EdTech & E-Learning: Gere lições dinâmicas de aprendizado de idiomas com pronúncia nativa perfeita em mais de 80 idiomas.
Jogos & VR: Crie NPCs dinâmicos (Personagens Não Jogáveis) que possam gerar diálogos únicos em tempo real sem falas pré-gravadas.

Documentação da API

Endpoints

Lista de vozes

Obter lista de vozes

                                                                            
GET https://pr140-testing.zylalabs.com/api/11558/ultra+text-to-speech+api/21834/list+of+voices

Testar endpoint

RESPOSTA DE EXEMPLO DA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {
	"data": [
		{
			"gender": "FEMALE",
			"language_code": "en-US",
			"language_name": "English (US)",
			"type": "Premium",
			"voice_id": "en-US-News-L"
		}
	],
	"message": "success",
	"success": true
}

Lista de vozes - TRECHOS DE CÓDIGO


curl --location --request GET 'https://zylalabs.com/api/11558/ultra+text-to-speech+api/21834/list+of+voices' --header 'Authorization: Bearer YOUR_API_KEY'

Criar texto para fala

Gerar texto para fala

                                                                            
POST https://pr140-testing.zylalabs.com/api/11558/ultra+text-to-speech+api/21835/create+text-to-speech

Criar texto para fala - Recursos do endpoint

Objeto	Descrição
`Corpo da requisição`	[Obrigatório] Json

Corpo da requisição

Testar endpoint

RESPOSTA DE EXEMPLO DA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"data":"https://s3.us-east-1.amazonaws.com/invideo-uploads-us-east-1/speechen-US-News-L17664032245720.mp3","message":"success","success":true}

Criar texto para fala - TRECHOS DE CÓDIGO


curl --location --request POST 'https://zylalabs.com/api/11558/ultra+text-to-speech+api/21835/create+text-to-speech' --header 'Authorization: Bearer YOUR_API_KEY' 

--data-raw '{
	"gender": "FEMALE",
	"language_code": "en-US",
	"language_name": "English (US)",
	"voice_id": "en-US-News-L",
	"text": "Stand by... we have a major development coming into the newsroom right now. After weeks of uncertainty—and hours of intense speculation—the decision has finally been made. The result? It is absolutely not what anyone expected! Sources on the ground are describing the atmosphere as tense... yet strangely hopeful. We are working to confirm the details at this very moment, so please... do not go anywhere."
}'

Chave de acesso à API e autenticação

Após se cadastrar, cada desenvolvedor recebe uma chave de acesso à API pessoal, uma combinação única de letras e dígitos para acessar nosso endpoint de API. Para autenticar com a ULTRA Texto para Fala API basta incluir seu token Bearer no cabeçalho Authorization.

Cabeçalhos

Cabeçalho	Descrição
`Authorization`	[Obrigatório] Deve ser `Bearer access_key`. Veja "Sua chave de acesso à API" acima quando você estiver inscrito.

Perguntas

Preços simples e transparentes

Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.

Mensal Anual

(Economize 2 meses com cobrança anual 🎉)