ULTRA Texto a voz API

Ve más allá de la síntesis estándar Nuestro Nivel Generativo de Alta Definición (HD) ofrece voces que respiran pausas y expresan emociones de forma natural
Usa esta API desde tu agente de IA vía MCP
Funciona con OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline y cualquier cliente de IA compatible con MCP.
Docs y configuración
Crea un skill envolviendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

🚀 Capacidades Básicas

1. Voces "GenAI" Hiper-Reales

Vaya más allá de la síntesis estándar. Nuestro nivel generativo de alta definición (HD) ofrece voces que respiran, hacen pausas y emiten emociones de manera natural.

  • Entrega Consciente del Contexto: El motor analiza el texto para entender si debe susurrar un secreto, gritar una advertencia o entregar noticias con autoridad.

  • Disfluencias Naturales: Capaz de insertar elementos humanos realistas como "ums," "uhs," y respiraciones para agentes conversacionales que suenan genuinamente espontáneos.

  • Inteligencia Afectiva: Ajusta dinámicamente el peso emocional (alegría, tristeza, urgencia) basado en el sentimiento de su guion.

2. Control de Estilo a Nivel de Director

Deje de depender de etiquetas de código rígidas. Controle la voz utilizando indicaciones en lenguaje natural.

  • Indicación a Voz: Simplemente dígale a la API: *"Lea esto como un narrador de cuento cansado"* o *"Hable esto rápidamente y con emoción como un comentarista deportivo."*

  • Pacing Granular: Ajuste el ritmo del habla hasta el milisegundo. Alargue pausas para un efecto dramático o acelere frases específicas para imitar un intercambio rápido.

3. Motor de "Diálogo" Multi-Altavoz

Genere escenas de audio complejas con una sola llamada a la API.

  • Intercambio de Turnos Sin Problemas: Simule pódcast, entrevistas o roles de servicio al cliente donde múltiples voces distintas interactúan.

  • Contexto Unificado: El sistema mantiene el tono y el flujo de la conversación a través de diferentes altavoces, asegurando que no haya transiciones abruptas.


🌍 Alcance Global y Escala

Nuestra infraestructura está diseñada para un despliegue global, asegurando que su aplicación hable el idioma de sus clientes—literalmente.

Característica Especificación
Cartera de Voces Acceso a 380+ personas de voz distintas en todos los niveles.
Cobertura de Idiomas Soporte nativo para 80+ idiomas y variantes (locales).
Accentos Regionales Profundo soporte para matices regionales (por ejemplo, 5+ variantes de inglés, 3+ variantes de español y francés).
Nivel de Estudio voces especializadas grabadas por actores de voz profesionales para contenido de formato largo (audiolibros/noticias) para eliminar la fatiga del oyente.

⚡ Especificaciones Técnicas

Construido para desarrolladores que exigen confiabilidad y flexibilidad.

  • Latencia Ultra-Baja: La arquitectura del modelo "Flash" entrega audio en <300ms, habilitando conversaciones de voz interrumpibles en tiempo real para agentes de IA.

  • Audio de Alta Fidelidad:

  • Calidad de Estudio: Hasta 48 kHz de tasa de muestreo.

  • Salida Comprimida: (MP3) para post-producción.

  • Flexibilidad de Entrada: Acepta texto plano y indicaciones en lenguaje natural.

  • Transmisión Bidireccional: La reproducción comienza instantáneamente mientras el resto de la oración aún se está generando.


🎯 Casos de Uso Ideales

  • Agentes de IA Interactivos: Potencie bots de soporte al cliente que suenan empáticos y humanos, no robóticos.

  • Producción de Contenidos: Automatice la narración de audiolibros, creación de pódcast y doblaje de videos a una fracción del costo de un estudio.

  • EdTech y E-Learning: Genere lecciones dinámicas de aprendizaje de idiomas con pronunciación nativa perfecta en 80+ idiomas.

  • Juegos y VR: Cree NPCs (Personajes No Jugadores) dinámicos que puedan generar diálogo único sobre la marcha sin líneas pregrabadas.

Documentación de la API

Endpoints


Obtener lista de voces



                                                                            
GET https://pr140-testing.zylalabs.com/api/11558/ultra+text-to-speech+api/21834/list+of+voices
                                                                            
                                                                        

Probar Endpoint

RESPUESTA DE EJEMPLO DE LA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {
	"data": [
		{
			"gender": "FEMALE",
			"language_code": "en-US",
			"language_name": "English (US)",
			"type": "Premium",
			"voice_id": "en-US-News-L"
		}
	],
	"message": "success",
	"success": true
}
                                                                                                                                                                                                                    
                                                                                                    

Lista de voces - CÓDIGOS DE EJEMPLO


curl --location --request GET 'https://zylalabs.com/api/11558/ultra+text-to-speech+api/21834/list+of+voices' --header 'Authorization: Bearer YOUR_API_KEY' 


    

Generar texto a voz


                                                                            
POST https://pr140-testing.zylalabs.com/api/11558/ultra+text-to-speech+api/21835/create+text-to-speech
                                                                            
                                                                        

Crear texto a voz - Características del Endpoint

Objeto Descripción
Cuerpo de la Solicitud [Requerido] Json
Probar Endpoint

RESPUESTA DE EJEMPLO DE LA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"data":"https://s3.us-east-1.amazonaws.com/invideo-uploads-us-east-1/speechen-US-News-L17664032245720.mp3","message":"success","success":true}
                                                                                                                                                                                                                    
                                                                                                    

Crear texto a voz - CÓDIGOS DE EJEMPLO


curl --location --request POST 'https://zylalabs.com/api/11558/ultra+text-to-speech+api/21835/create+text-to-speech' --header 'Authorization: Bearer YOUR_API_KEY' 

--data-raw '{
	"gender": "FEMALE",
	"language_code": "en-US",
	"language_name": "English (US)",
	"voice_id": "en-US-News-L",
	"text": "Stand by... we have a major development coming into the newsroom right now. After weeks of uncertainty—and hours of intense speculation—the decision has finally been made. The result? It is absolutely not what anyone expected! Sources on the ground are describing the atmosphere as tense... yet strangely hopeful. We are working to confirm the details at this very moment, so please... do not go anywhere."
}'

    

Clave de Acceso a la API y Autenticación

Después de registrarte, a cada desarrollador se le asigna una clave de acceso a la API personal, una combinación única de letras y dígitos proporcionada para acceder a nuestro endpoint de la API. Para autenticarte con el ULTRA Texto a voz API simplemente incluye tu token de portador en el encabezado de Autorización.
Encabezados
Encabezado Descripción
Autorización [Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito.

Precios Simples y Transparentes

Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.

🚀 PLAN CORPORATIVO A MEDIDA

Comienza en
$ 10.000/Año


  • Volumen Personalizado
  • Límite de solicitudes personalizado
  • Soporte al Cliente Especializado
  • Monitoreo de API en Tiempo Real

Funciones favoritas de los clientes

  • ✔︎ Paga Solo por Solicitudes Exitosas
  • ✔︎ Prueba 7 días gratis
  • ✔︎ Soporte Multilenguaje
  • ✔︎ Una Clave API, Todas las APIs.
  • ✔︎ Panel de Control Intuitivo
  • ✔︎ Manejo de Errores Integral
  • ✔︎ Documentación Amigable para Desarrolladores
  • ✔︎ Integración con Postman
  • ✔︎ Conexiones HTTPS Seguras
  • ✔︎ Tiempo de Actividad Fiable

ULTRA Texto a voz API FAQs

El endpoint GET List of voices devuelve una lista de personas de voz disponibles incluyendo atributos como género código de idioma y tipo de voz El endpoint POST Create text-to-speech devuelve un enlace URL al archivo de audio generado junto con un mensaje de éxito

Para la lista de voces GET, los campos clave incluyen "género," "código de idioma," "nombre del idioma," "tipo," y "id de voz." Para el POST Crear texto a voz, los campos clave son "datos" (URL de audio), "mensaje," y "éxito"

El endpoint POST Crear texto a voz acepta parámetros como el texto que se va a convertir y señales de lenguaje natural opcionales para la modulación de la voz. Los usuarios pueden personalizar el estilo de entrega y el ritmo a través de estas señales

Los datos de respuesta para la solicitud GET Lista de voces están organizados en un formato JSON con un array de objetos de voz bajo la clave "data". La respuesta del POST Crear texto a voz incluye un único objeto con las claves "data", "message" y "success"

Los casos de uso típicos incluyen generar audio dinámico para agentes de IA interactivos automatizar la narración de audiolibros crear contenido educativo atractivo y mejorar las experiencias de juego con diálogos realistas de NPC

La precisión de los datos se mantiene a través de una combinación de grabaciones de actores de voz profesionales y algoritmos de IA avanzados que aseguran una síntesis de voz de alta calidad Las actualizaciones continuas y la retroalimentación de los usuarios también contribuyen a mejorar el rendimiento de la voz

Los usuarios pueden utilizar la URL de audio devuelta en la respuesta POST Crear texto a voz para reproducir o almacenar el audio generado. Los atributos de voz de la GET Lista de voces pueden ayudar a los usuarios a seleccionar la voz más adecuada para su aplicación

Los usuarios pueden esperar respuestas JSON estructuradas con indicadores de éxito claros Para la solicitud GET de la lista de voces los datos incluirán típicamente múltiples opciones de voz mientras que el POST de crear texto a voz devolverá un único enlace de archivo de audio tras un procesamiento exitoso

Los usuarios pueden personalizar su selección de voz utilizando los atributos devueltos en la lista GET de voces. Pueden filtrar las voces según el género el idioma y el tipo para encontrar la persona de voz más adecuada para su aplicación

La API admite salida de audio en formato MP3 para el audio de texto a voz generado Este formato es adecuado para la postproducción y la fácil integración en diversas aplicaciones

La característica de Inteligencia Afectiva de la API ajusta dinámicamente el peso emocional del discurso según el sentimiento del texto de entrada permitiendo una entrega más atractiva y contextualmente adecuada

El campo "data" en la respuesta POST Crear texto a voz contiene el enlace URL al archivo de audio generado Los usuarios pueden usar este enlace para reproducir o descargar el audio para sus aplicaciones

El motor de "diálogo" de múltiples hablantes permite a la API simular conversaciones con voces distintas manteniendo un contexto y tono unificados lo cual es esencial para crear interacciones realistas en podcasts o escenarios de atención al cliente

Las indicaciones en lenguaje natural permiten a los usuarios controlar el estilo de entrega de voz de manera intuitiva, lo que permite expresiones creativas como "habla con emoción" o "lee despacio" Esta flexibilidad mejora el impacto emocional y la participación del audio

La API ofrece un profundo soporte para acentos regionales proporcionando múltiples variantes para idiomas como inglés español y francés Esto asegura que el discurso generado resuene con las audiencias locales y mejore la conexión

Si los usuarios reciben una respuesta vacía, deben verificar la precisión y completitud de sus parámetros de entrada Asegurarse de que el texto y las indicaciones sean válidos puede ayudar a evitar resultados vacíos y mejorar la probabilidad de una generación de audio exitosa

General FAQs

Zyla API Hub es como una gran tienda de APIs, donde puedes encontrar miles de ellas en un solo lugar. También ofrecemos soporte dedicado y monitoreo en tiempo real de todas las APIs. Una vez que te registres, puedes elegir qué APIs quieres usar. Solo recuerda que cada API necesita su propia suscripción. Pero si te suscribes a varias, usarás la misma clave para todas, lo que hace todo más fácil para ti.

Los precios se muestran en USD (dólar estadounidense), EUR (euro), CAD (dólar canadiense), AUD (dólar australiano) y GBP (libra esterlina). Aceptamos todas las principales tarjetas de débito y crédito. Nuestro sistema de pago utiliza la última tecnología de seguridad y está respaldado por Stripe, una de las compañías de pago más confiables del mundo. Si tienes algún problema para pagar con tarjeta, contáctanos en [email protected]


Además, si ya tienes una suscripción activa en cualquiera de estas monedas (USD, EUR, CAD, AUD, GBP), esa moneda se mantendrá para suscripciones posteriores. Puedes cambiar la moneda en cualquier momento siempre que no tengas suscripciones activas.

La moneda local que aparece en la página de precios se basa en el país de tu dirección IP y se proporciona solo como referencia. Los precios reales están en USD (dólar estadounidense). Cuando realices un pago, el cargo aparecerá en tu estado de cuenta en USD, incluso si ves el monto equivalente en tu moneda local en nuestro sitio web. Esto significa que no puedes pagar directamente en tu moneda local.

Ocasionalmente, un banco puede rechazar el cargo debido a sus configuraciones de protección contra fraude. Te sugerimos comunicarte con tu banco primero para verificar si están bloqueando nuestros cargos. También puedes acceder al Portal de Facturación y cambiar la tarjeta asociada para realizar el pago. Si esto no funciona y necesitas más ayuda, por favor contacta a nuestro equipo en [email protected]

Los precios se determinan mediante una suscripción recurrente mensual o anual, dependiendo del plan elegido.

Las llamadas a la API se descuentan de tu plan en base a solicitudes exitosas. Cada plan incluye una cantidad específica de llamadas que puedes realizar por mes. Solo las llamadas exitosas, indicadas por una respuesta con estado 200, se contarán en tu total. Esto asegura que las solicitudes fallidas o incompletas no afecten tu cuota mensual.

Zyla API Hub funciona con un sistema de suscripción mensual recurrente. Tu ciclo de facturación comenzará el día en que compres uno de los planes de pago, y se renovará el mismo día del mes siguiente. Así que recuerda cancelar tu suscripción antes si quieres evitar futuros cargos.

Para actualizar tu plan de suscripción actual, simplemente ve a la página de precios de la API y selecciona el plan al que deseas actualizarte. La actualización será instantánea, permitiéndote disfrutar inmediatamente de las funciones del nuevo plan. Ten en cuenta que las llamadas restantes de tu plan anterior no se transferirán al nuevo plan, por lo que debes considerar esto al actualizar. Se te cobrará el monto total del nuevo plan.

Para verificar cuántas llamadas a la API te quedan en el mes actual, revisa el campo 'X-Zyla-API-Calls-Monthly-Remaining' en el encabezado de la respuesta. Por ejemplo, si tu plan permite 1,000 solicitudes por mes y has usado 100, este campo mostrará 900 llamadas restantes.

Para ver el número máximo de solicitudes a la API que permite tu plan, revisa el encabezado de la respuesta 'X-Zyla-RateLimit-Limit'. Por ejemplo, si tu plan incluye 1,000 solicitudes por mes, este encabezado mostrará 1,000.

El encabezado 'X-Zyla-RateLimit-Reset' muestra el número de segundos hasta que tu límite se restablezca. Esto te indica cuándo tu conteo de solicitudes se reiniciará. Por ejemplo, si muestra 3,600, significa que faltan 3,600 segundos para que el límite se restablezca.

Sí, puedes cancelar tu plan en cualquier momento desde tu cuenta, seleccionando la opción de cancelación en la página de Facturación. Ten en cuenta que las actualizaciones, degradaciones y cancelaciones tienen efecto inmediato. Además, al cancelar ya no tendrás acceso al servicio, incluso si te quedaban llamadas en tu cuota.

Puedes contactarnos a través de nuestro canal de chat para recibir asistencia inmediata. Siempre estamos en línea de 8 a. m. a 5 p. m. (EST). Si nos contactas fuera de ese horario, te responderemos lo antes posible. Además, puedes escribirnos por correo electrónico a [email protected]

Para darte la oportunidad de probar nuestras APIs sin compromiso, ofrecemos una prueba gratuita de 7 días que te permite realizar hasta 50 llamadas a la API sin costo. Esta prueba solo se puede usar una vez, por lo que recomendamos aplicarla a la API que más te interese. Aunque la mayoría de nuestras APIs ofrecen prueba gratuita, algunas pueden no hacerlo. La prueba finaliza después de 7 días o cuando realices 50 solicitudes, lo que ocurra primero. Si alcanzas el límite de 50 solicitudes durante la prueba, deberás "Iniciar tu Plan de Pago" para continuar haciendo solicitudes. Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios. Alternativamente, si no cancelas tu suscripción antes del día 7, tu prueba gratuita finalizará y tu plan se cobrará automáticamente, otorgándote acceso a todas las llamadas a la API especificadas en tu plan. Ten esto en cuenta para evitar cargos no deseados.

Después de 7 días, se te cobrará el monto total del plan al que estabas suscrito durante la prueba. Por lo tanto, es importante cancelar antes de que finalice el periodo de prueba. No se aceptan solicitudes de reembolso por olvidar cancelar a tiempo.

Cuando te suscribes a una prueba gratuita de una API, puedes realizar hasta 50 llamadas. Si deseas realizar más llamadas después de este límite, la API te pedirá que "Inicies tu Plan de Pago". Puedes encontrar el botón "Iniciar tu Plan de Pago" en tu perfil bajo Suscripción -> Elige la API a la que estás suscrito -> Pestaña de Precios.

Las Órdenes de Pago se procesan entre el día 20 y el 30 de cada mes. Si envías tu solicitud antes del día 20, tu pago será procesado dentro de ese período.


APIs Relacionadas


También te puede interesar