ULTRA Texto para Fala API

Vá além da síntese padrão Nossa Camada Generativa de Alta Definição (HD) oferece vozes que respiram pausam e emitem emoções naturalmente
Use esta API do seu agente de IA via MCP
Funciona com OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline e qualquer cliente de IA compatível com MCP.
Docs e configuração
Crie uma skill envolvendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

🚀 Capacidades Essenciais

1. Vozes "GenAI" Hiper-Reais

Vá além da síntese padrão. Nosso Tier Generativo de Alta Definição (HD) oferece vozes que respiram, pausam e expressam emoções de forma natural.

  • Entrega Consciente do Contexto: O motor analisa o texto para entender se deve sussurrar um segredo, gritar um aviso ou transmitir notícias com autoridade.

  • Desfluências Naturais: Capaz de inserir elementos humanos realistas como "ums," "uhs," e respirações para agentes conversacionais que soam genuinamente espontâneos.

  • Inteligência Afetiva: Ajusta dinamicamente o peso emocional (alegria, tristeza, urgência) com base no sentimento do seu roteiro.

2. Controle de Estilo em Nível de Diretor

Pare de depender de tags de código rígidas. Controle a voz usando comandos em linguagem natural.

  • Prompt para Fala: Basta dizer à API: *"Leia isso como um narrador de livro infantil cansado"* ou *"Fale isso rapidamente e animadamente como um comentarista esportivo."*

  • Ritmo Granular: Ajuste o ritmo da fala até o milissegundo. Prolongue pausas para efeito dramático ou acelere frases específicas para imitar uma conversa rápida.

3. Motor de "Diálogo" Multivocal

Gere cenas de áudio complexas com um único chamado à API.

  • Interação Sem Costura: Simule podcasts, entrevistas ou papéis de atendimento ao cliente onde várias vozes distintas interagem.

  • Contexto Unificado: O sistema mantém o tom e o fluxo da conversa entre diferentes falantes, garantindo que não haja transições abruptas.


🌍 Alcance Global & Escala

Nossa infraestrutura é projetada para implantação global, garantindo que sua aplicação fale a língua de seus clientes—literalmente.

Recurso Especificação
Portfólio de Vozes Acesso 380+ personalidades de voz distintas em todos os níveis.
Cobertura Linguística Suporte nativo para 80+ idiomas e variantes (locais).
Acentos Regionais Apoio profundo para nuances regionais (por exemplo, 5+ variantes de inglês, 3+ variantes de espanhol e francês).
Tier de Estúdio vozes especializadas gravadas por atores de voz profissionais para conteúdo de longa duração (audiolivros/notícias) para eliminar a fadiga do ouvinte.

⚡ Especificações Técnicas

Construído para desenvolvedores que exigem confiabilidade e flexibilidade.

  • Latência Ultra-Baixa: Arquitetura do modelo "Flash" entrega áudio em <300ms, permitindo conversas de voz em tempo real e interrompíveis para agentes de IA.

  • Áudio de Alta Fidelidade:

  • Qualidade de Estúdio: Até 48 kHz de taxa de amostragem.

  • Saída Comprimida: (MP3) para pós-produção.

  • Flexibilidade de Entrada: Aceita Texto Simples e Comandos de Linguagem Natural.

  • Streaming Bidirecional: A reprodução começa instantaneamente enquanto o resto da frase ainda está sendo gerado.


🎯 Casos de Uso Ideais

  • Agentes de IA Interativos: Potencialize bots de suporte ao cliente que soem empáticos e humanos, não robóticos.

  • Produção de Conteúdo: Automatize a narração de audiolivros, criação de podcasts e dublagem de vídeos a uma fração do custo de um estúdio.

  • EdTech & E-Learning: Gere lições dinâmicas de aprendizado de idiomas com pronúncia nativa perfeita em mais de 80 idiomas.

  • Jogos & VR: Crie NPCs dinâmicos (Personagens Não Jogáveis) que possam gerar diálogos únicos em tempo real sem falas pré-gravadas.

Documentação da API

Endpoints


Obter lista de vozes



                                                                            
GET https://pr140-testing.zylalabs.com/api/11558/ultra+text-to-speech+api/21834/list+of+voices
                                                                            
                                                                        

Testar endpoint

RESPOSTA DE EXEMPLO DA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {
	"data": [
		{
			"gender": "FEMALE",
			"language_code": "en-US",
			"language_name": "English (US)",
			"type": "Premium",
			"voice_id": "en-US-News-L"
		}
	],
	"message": "success",
	"success": true
}
                                                                                                                                                                                                                    
                                                                                                    

Lista de vozes - TRECHOS DE CÓDIGO


curl --location --request GET 'https://zylalabs.com/api/11558/ultra+text-to-speech+api/21834/list+of+voices' --header 'Authorization: Bearer YOUR_API_KEY' 


    

Gerar texto para fala



                                                                            
POST https://pr140-testing.zylalabs.com/api/11558/ultra+text-to-speech+api/21835/create+text-to-speech
                                                                            
                                                                        

Criar texto para fala - Recursos do endpoint

Objeto Descrição
Corpo da requisição [Obrigatório] Json
Testar endpoint

RESPOSTA DE EXEMPLO DA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"data":"https://s3.us-east-1.amazonaws.com/invideo-uploads-us-east-1/speechen-US-News-L17664032245720.mp3","message":"success","success":true}
                                                                                                                                                                                                                    
                                                                                                    

Criar texto para fala - TRECHOS DE CÓDIGO


curl --location --request POST 'https://zylalabs.com/api/11558/ultra+text-to-speech+api/21835/create+text-to-speech' --header 'Authorization: Bearer YOUR_API_KEY' 

--data-raw '{
	"gender": "FEMALE",
	"language_code": "en-US",
	"language_name": "English (US)",
	"voice_id": "en-US-News-L",
	"text": "Stand by... we have a major development coming into the newsroom right now. After weeks of uncertainty—and hours of intense speculation—the decision has finally been made. The result? It is absolutely not what anyone expected! Sources on the ground are describing the atmosphere as tense... yet strangely hopeful. We are working to confirm the details at this very moment, so please... do not go anywhere."
}'

    

Chave de acesso à API e autenticação

Após se cadastrar, cada desenvolvedor recebe uma chave de acesso à API pessoal, uma combinação única de letras e dígitos para acessar nosso endpoint de API. Para autenticar com a ULTRA Texto para Fala API basta incluir seu token Bearer no cabeçalho Authorization.
Cabeçalhos
Cabeçalho Descrição
Authorization [Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito.

Preços simples e transparentes

Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.

🚀 Empresarial

A partir de
$ 10.000/Ano


  • Volume personalizado
  • Limite de taxa personalizado
  • Suporte ao cliente especializado
  • Monitoramento de API em tempo real

Recursos favoritos dos clientes

  • ✔︎ Pague apenas por requisições bem-sucedidas
  • ✔︎ Teste 7 dias gratis
  • ✔︎ Suporte multilíngue
  • ✔︎ Uma chave de API, todas as APIs.
  • ✔︎ Painel intuitivo
  • ✔︎ Tratamento de erros abrangente
  • ✔︎ Documentação amigável para desenvolvedores
  • ✔︎ Integração com Postman
  • ✔︎ Conexões HTTPS seguras
  • ✔︎ Alta disponibilidade

ULTRA Texto para Fala API FAQs

O endpoint GET Lista de vozes retorna uma lista de personas de voz disponíveis, incluindo atributos como gênero, código de idioma e tipo de voz. O endpoint POST Criar texto para fala retorna um link URL para o arquivo de áudio gerado junto com uma mensagem de sucesso

Para o GET Lista de vozes, os campos principais incluem "gênero", "código_da_língua", "nome_da_língua", "tipo" e "id_da_voz". Para o POST Criar texto-para-fala, os campos principais são "dados" (URL do áudio), "mensagem" e "sucesso"

O endpoint POST Create text-to-speech aceita parâmetros como o texto a ser convertido e prompts de linguagem natural opcionais para modulação da voz Os usuários podem personalizar o estilo de entrega e o ritmo através desses prompts

Os dados de resposta para o GET Lista de vozes estão organizados em um formato JSON com um array de objetos de voz sob a chave "data" A resposta POST Criar texto-para-fala inclui um único objeto com as chaves "data" "message" e "success"

Casos de uso típicos incluem gerar áudio dinâmico para agentes de IA interativos automatizar a narração de audiolivros criar conteúdo educacional envolvente e melhorar experiências de jogos com diálogos realistas de NPC

A precisão dos dados é mantida por meio de uma combinação de gravações de atores de voz profissionais e algoritmos avançados de IA que garantem síntese de voz de alta qualidade Atualizações contínuas e feedback dos usuários também contribuem para melhorar o desempenho da voz

Os usuários podem utilizar a URL de áudio retornada pela resposta POST Criar texto para fala para reproduzir ou armazenar o áudio gerado Os atributos de voz da solicitação GET Lista de vozes podem ajudar os usuários a selecionar a voz mais adequada para sua aplicação

Os usuários podem esperar respostas JSON estruturadas com indicadores de sucesso claros Para a lista GET de vozes os dados normalmente incluirão múltiplas opções de vozes enquanto o POST Criar texto-para-fala retornará um único link de arquivo de áudio após o processamento bem-sucedido

Os usuários podem personalizar sua seleção de voz utilizando os atributos retornados na LISTAGEM de vozes. Eles podem filtrar vozes com base em gênero, idioma e tipo para encontrar a persona de voz mais adequada para seu aplicativo

A API suporta saída de áudio em formato MP3 para o áudio gerado de texto para fala Este formato é adequado para pós-produção e fácil integração em várias aplicações

O recurso de Inteligência Afetiva da API ajusta dinamicamente o peso emocional do discurso com base no sentimento do texto de entrada permitindo uma entrega mais envolvente e contextual adequada

O campo "data" na resposta POST Create text-to-speech contém o link da URL para o arquivo de áudio gerado Os usuários podem usar esse link para reproduzir ou baixar o áudio para seus aplicativos

O Motor de "Diálogo" Multi-Falante permite que a API simule conversas com vozes distintas, mantendo o contexto e o tom unificados, o que é essencial para criar interações realistas em podcasts ou cenários de atendimento ao cliente

Os comandos em linguagem natural permitem que os usuários controlem o estilo de entrega da voz de forma intuitiva, permitindo expressões criativas como "fale com entusiasmo" ou "leia devagar" Essa flexibilidade aumenta o impacto emocional e o engajamento do áudio

A API oferece suporte profundo para sotaques regionais, fornecendo várias variantes para idiomas como inglês, espanhol e francês Isso garante que a fala gerada ressoe com o público local e aumente a relação

Se os usuários receberam uma resposta vazia, eles devem verificar os parâmetros de entrada quanto à precisão e completude Garantir texto e prompts válidos pode ajudar a evitar resultados vazios e melhorar a probabilidade de geração bem-sucedida de áudio

Perguntas Frequentes Gerais

O Zyla API Hub é como uma grande loja de APIs, onde você pode encontrar milhares delas em um só lugar. Também oferecemos suporte dedicado e monitoramento em tempo real de todas as APIs. Após se cadastrar, você pode escolher quais APIs deseja usar. Lembre-se apenas de que cada API precisa de sua própria assinatura. Mas se você se inscrever em várias, usará a mesma chave para todas elas, facilitando as coisas para você.

Os preços são listados em USD (Dólar Americano), EUR (Euro), CAD (Dólar Canadense), AUD (Dólar Australiano) e GBP (Libra Esterlina). Aceitamos todos os principais cartões de débito e crédito. Nosso sistema de pagamento usa a mais recente tecnologia de segurança e é operado pela Stripe, uma das empresas de pagamento mais confiáveis do mundo. Se tiver problemas para pagar com cartão, entre em contato conosco em [email protected]


Além disso, se você já tiver uma assinatura ativa em qualquer uma dessas moedas (USD, EUR, CAD, AUD, GBP), essa moeda será mantida para assinaturas subsequentes. Você pode alterar a moeda a qualquer momento, desde que não tenha assinaturas ativas.

A moeda local exibida na página de preços é baseada no país do seu endereço IP e é fornecida apenas como referência. Os preços reais são em USD (Dólar Americano). Ao efetuar o pagamento, a cobrança aparecerá no extrato do seu cartão em USD, mesmo que você veja o valor equivalente em sua moeda local em nosso site. Isso significa que você não pode pagar diretamente com sua moeda local.

Ocasionalmente, o banco pode recusar a cobrança devido às configurações de proteção contra fraude. Sugerimos contatar seu banco inicialmente para verificar se estão bloqueando nossas cobranças. Você também pode acessar o Portal de Cobrança e alterar o cartão associado para realizar o pagamento. Se isso não funcionar e precisar de mais ajuda, entre em contato com nossa equipe em [email protected]

Os preços são determinados por uma assinatura recorrente mensal ou anual, dependendo do plano escolhido.

As chamadas de API são descontadas do seu plano com base nas requisições bem-sucedidas. Cada plano possui um número específico de chamadas por mês. Apenas chamadas bem-sucedidas, indicadas por uma resposta com Status 200, serão contabilizadas, garantindo que falhas não afetem sua cota mensal.

O Zyla API Hub funciona com um sistema de assinatura mensal recorrente. Seu ciclo de cobrança começa no dia em que você compra um dos planos pagos e será renovado no mesmo dia do mês seguinte. Portanto, cancele sua assinatura com antecedência se quiser evitar cobranças futuras.

Para fazer upgrade do seu plano atual, acesse a página de preços da API e selecione o novo plano desejado. O upgrade é instantâneo, permitindo aproveitar imediatamente os recursos do novo plano. Observe que as chamadas restantes do plano anterior não serão transferidas; você será cobrado pelo valor integral do novo plano.

Para verificar quantas chamadas de API restam para o mês atual, consulte o campo 'X-Zyla-API-Calls-Monthly-Remaining' no cabeçalho da resposta. Por exemplo, se seu plano permite 1.000 requisições por mês e você usou 100, este campo no cabeçalho da resposta indicará 900 chamadas restantes.

Para ver o número máximo de requisições de API que seu plano permite, verifique o cabeçalho de resposta 'X-Zyla-RateLimit-Limit'. Por exemplo, se seu plano inclui 1.000 requisições por mês, este cabeçalho exibirá 1.000.

O cabeçalho 'X-Zyla-RateLimit-Reset' mostra o número de segundos até seu limite de taxa ser redefinido. Isso informa quando sua contagem de requisições começará do zero. Por exemplo, se exibir 3.600, significa que restam 3.600 segundos até o limite ser redefinido.

Sim, você pode cancelar seu plano a qualquer momento acessando sua conta e selecionando a opção de cancelamento na página de Cobrança. Observe que upgrades, downgrades e cancelamentos têm efeito imediato. Além disso, após o cancelamento, você não terá mais acesso ao serviço, mesmo que ainda tenha chamadas restantes na sua cota.

Você pode nos contatar via chat para receber assistência imediata. Estamos online de 8h às 17h (EST). Se nos contatar após esse horário, retornaremos o mais rápido possível. Além disso, você pode enviar um e-mail para [email protected]

Para oferecer a oportunidade de experimentar nossas APIs sem compromisso, oferecemos um teste gratuito de 7 dias que permite realizar até 50 chamadas de API sem custo. Esse teste pode ser usado apenas uma vez; recomendamos aplicá-lo à API que mais interessa. Embora a maioria das APIs ofereça teste gratuito, algumas podem não oferecer. O teste termina após 7 dias ou quando você atingir 50 requisições, o que ocorrer primeiro. Se atingir o limite, será necessário "Iniciar seu plano pago" para continuar. Você encontra esse botão no perfil em Assinatura -> Escolha a API -> aba Preços. Se não cancelar até o 7º dia, sua assinatura será cobrada automaticamente, liberando todas as chamadas do plano.

Após 7 dias, será cobrado o valor total do plano ao qual você estava inscrito durante o teste. Portanto, é importante cancelar antes do término do período. Solicitações de reembolso por esquecimento de cancelamento não são aceitas.

Ao assinar um teste gratuito de API, você pode fazer até 50 chamadas. Se desejar fazer chamadas adicionais além desse limite, a API solicitará que você "Inicie seu plano pago". Você encontra o botão no perfil em Assinatura -> Escolha a API -> aba Preços.

As Ordens de Pagamento são processadas entre os dias 20 e 30 de cada mês. Se você enviar sua solicitação antes do dia 20, seu pagamento será processado dentro desse período.


APIs relacionadas


Você também pode gostar