ULTRA Texto a voz API

Ve más allá de la síntesis estándar Nuestro Nivel Generativo de Alta Definición (HD) ofrece voces que respiran pausas y expresan emociones de forma natural

Usa esta API desde tu agente de IA vía MCP

Funciona con OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline y cualquier cliente de IA compatible con MCP.

Docs y configuración

Crea un skill envolviendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

🚀 Capacidades Básicas

1. Voces "GenAI" Hiper-Reales

Vaya más allá de la síntesis estándar. Nuestro nivel generativo de alta definición (HD) ofrece voces que respiran, hacen pausas y emiten emociones de manera natural.

Entrega Consciente del Contexto: El motor analiza el texto para entender si debe susurrar un secreto, gritar una advertencia o entregar noticias con autoridad.
Disfluencias Naturales: Capaz de insertar elementos humanos realistas como "ums," "uhs," y respiraciones para agentes conversacionales que suenan genuinamente espontáneos.
Inteligencia Afectiva: Ajusta dinámicamente el peso emocional (alegría, tristeza, urgencia) basado en el sentimiento de su guion.

2. Control de Estilo a Nivel de Director

Deje de depender de etiquetas de código rígidas. Controle la voz utilizando indicaciones en lenguaje natural.

Indicación a Voz: Simplemente dígale a la API: *"Lea esto como un narrador de cuento cansado"* o *"Hable esto rápidamente y con emoción como un comentarista deportivo."*
Pacing Granular: Ajuste el ritmo del habla hasta el milisegundo. Alargue pausas para un efecto dramático o acelere frases específicas para imitar un intercambio rápido.

3. Motor de "Diálogo" Multi-Altavoz

Genere escenas de audio complejas con una sola llamada a la API.

Intercambio de Turnos Sin Problemas: Simule pódcast, entrevistas o roles de servicio al cliente donde múltiples voces distintas interactúan.
Contexto Unificado: El sistema mantiene el tono y el flujo de la conversación a través de diferentes altavoces, asegurando que no haya transiciones abruptas.

🌍 Alcance Global y Escala

Nuestra infraestructura está diseñada para un despliegue global, asegurando que su aplicación hable el idioma de sus clientes—literalmente.

Característica	Especificación
Cartera de Voces	Acceso a 380+ personas de voz distintas en todos los niveles.
Cobertura de Idiomas	Soporte nativo para 80+ idiomas y variantes (locales).
Accentos Regionales	Profundo soporte para matices regionales (por ejemplo, 5+ variantes de inglés, 3+ variantes de español y francés).
Nivel de Estudio	voces especializadas grabadas por actores de voz profesionales para contenido de formato largo (audiolibros/noticias) para eliminar la fatiga del oyente.

⚡ Especificaciones Técnicas

Construido para desarrolladores que exigen confiabilidad y flexibilidad.

Latencia Ultra-Baja: La arquitectura del modelo "Flash" entrega audio en <300ms, habilitando conversaciones de voz interrumpibles en tiempo real para agentes de IA.
Audio de Alta Fidelidad:
Calidad de Estudio: Hasta 48 kHz de tasa de muestreo.
Salida Comprimida: (MP3) para post-producción.
Flexibilidad de Entrada: Acepta texto plano y indicaciones en lenguaje natural.
Transmisión Bidireccional: La reproducción comienza instantáneamente mientras el resto de la oración aún se está generando.

🎯 Casos de Uso Ideales

Agentes de IA Interactivos: Potencie bots de soporte al cliente que suenan empáticos y humanos, no robóticos.
Producción de Contenidos: Automatice la narración de audiolibros, creación de pódcast y doblaje de videos a una fracción del costo de un estudio.
EdTech y E-Learning: Genere lecciones dinámicas de aprendizaje de idiomas con pronunciación nativa perfecta en 80+ idiomas.
Juegos y VR: Cree NPCs (Personajes No Jugadores) dinámicos que puedan generar diálogo único sobre la marcha sin líneas pregrabadas.

Documentación de la API

Endpoints

Lista de voces

Obtener lista de voces

                                                                            
GET https://pr140-testing.zylalabs.com/api/11558/ultra+text-to-speech+api/21834/list+of+voices

Probar Endpoint

RESPUESTA DE EJEMPLO DE LA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {
	"data": [
		{
			"gender": "FEMALE",
			"language_code": "en-US",
			"language_name": "English (US)",
			"type": "Premium",
			"voice_id": "en-US-News-L"
		}
	],
	"message": "success",
	"success": true
}

Lista de voces - CÓDIGOS DE EJEMPLO


curl --location --request GET 'https://zylalabs.com/api/11558/ultra+text-to-speech+api/21834/list+of+voices' --header 'Authorization: Bearer YOUR_API_KEY'

Crear texto a voz

Generar texto a voz

                                                                            
POST https://pr140-testing.zylalabs.com/api/11558/ultra+text-to-speech+api/21835/create+text-to-speech

Crear texto a voz - Características del Endpoint

Objeto	Descripción
`Cuerpo de la Solicitud`	[Requerido] Json

Cuerpo de la Solicitud

Probar Endpoint

RESPUESTA DE EJEMPLO DE LA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"data":"https://s3.us-east-1.amazonaws.com/invideo-uploads-us-east-1/speechen-US-News-L17664032245720.mp3","message":"success","success":true}

Crear texto a voz - CÓDIGOS DE EJEMPLO


curl --location --request POST 'https://zylalabs.com/api/11558/ultra+text-to-speech+api/21835/create+text-to-speech' --header 'Authorization: Bearer YOUR_API_KEY' 

--data-raw '{
	"gender": "FEMALE",
	"language_code": "en-US",
	"language_name": "English (US)",
	"voice_id": "en-US-News-L",
	"text": "Stand by... we have a major development coming into the newsroom right now. After weeks of uncertainty—and hours of intense speculation—the decision has finally been made. The result? It is absolutely not what anyone expected! Sources on the ground are describing the atmosphere as tense... yet strangely hopeful. We are working to confirm the details at this very moment, so please... do not go anywhere."
}'

Clave de Acceso a la API y Autenticación

Después de registrarte, a cada desarrollador se le asigna una clave de acceso a la API personal, una combinación única de letras y dígitos proporcionada para acceder a nuestro endpoint de la API. Para autenticarte con el ULTRA Texto a voz API simplemente incluye tu token de portador en el encabezado de Autorización.

Encabezados

Encabezado	Descripción
`Autorización`	[Requerido] Debería ser `Bearer access_key`. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito.

Preguntas

Precios Simples y Transparentes

Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.

Mensual Anual

(Ahorra 2 meses pagando anualmente 🎉)