La API de Análisis de Voz convierte con precisión el audio en texto, ofreciendo una integración fluida en varias aplicaciones. Utiliza tecnología avanzada de reconocimiento de voz e IA para proporcionar transcripciones precisas para diversas industrias y casos de uso. Ya sea procesando discurso en vivo o archivos de audio pregrabados, esta API garantiza una conversión fiable y minimizada de errores.
Una característica destacada de esta API es su soporte multilingüe, que permite una transcripción de alta precisión en múltiples idiomas. Esto la convierte en una herramienta esencial para los usuarios que requieren transcripciones en diferentes contextos lingüísticos.
Para usar este endpoint, debes indicar la URL de un audio en el parámetro.
Obtener texto - Características del Endpoint
| Objeto | Descripción |
|---|---|
url |
[Requerido] Indicates a URL |
{"success":true,"audio_file":"https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3","output":{"text":"Oggi che il sole.","result":{"text":"Oggi che il sole.","word_count":4,"vtt":"WEBVTT\n\n00.000 --> 01.120\nOggi che il sole.","words":[{"word":"Oggi","start":0,"end":0.3400000035762787},{"word":"che","start":0.3400000035762787,"end":0.5400000214576721},{"word":"il","start":0.5400000214576721,"end":0.7200000286102295},{"word":"sole.","start":0.7200000286102295,"end":1.1200000047683716}]}}}
curl --location --request POST 'https://zylalabs.com/api/6371/speech+analysis+api/9136/obtain+text?url=https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| Encabezado | Descripción |
|---|---|
Autorización
|
[Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito. |
Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.
La API de Análisis de Voz devuelve texto transcrito a partir de la entrada de audio. La salida incluye el discurso reconocido en formato de texto, que puede ser utilizado para diversas aplicaciones como subtítulos, documentación o análisis.
Los campos clave en los datos de respuesta típicamente incluyen "transcripción" para el texto convertido, "idioma" que indica el idioma detectado, y "confianza" que refleja la precisión de la transcripción.
El parámetro principal para el endpoint POST Obtener Texto es el "audio_url", que especifica la URL del archivo de audio que se va a transcribir. Los parámetros adicionales pueden incluir "idioma" para especificar el idioma deseado para la transcripción.
Los datos de respuesta están organizados en un formato JSON, que contiene pares clave-valor. La estructura principal incluye campos para la transcripción, el idioma y la puntuación de confianza, lo que permite un fácil análisis e integración en aplicaciones.
Los casos de uso típicos incluyen generar subtítulos para videos, crear transcripciones para reuniones o entrevistas, mejorar la accesibilidad para usuarios con discapacidades auditivas y analizar el contenido hablado en busca de conocimientos en diversas industrias.
La precisión de los datos se mantiene a través de avanzados algoritmos de reconocimiento de voz y entrenamiento continuo en conjuntos de datos diversos. La API también emplea controles de calidad para minimizar errores y mejorar la fiabilidad de la transcripción.
Los usuarios pueden personalizar sus solicitudes especificando el parámetro "idioma" para dirigirse a idiomas específicos para la transcripción. Esto permite obtener resultados personalizados según el contexto lingüístico del contenido de audio.
Los patrones de datos estándar incluyen oraciones coherentes con la puntuación y capitalización adecuadas. Los usuarios pueden esperar variaciones en la precisión basadas en la calidad del audio, los acentos de los hablantes y los niveles de ruido de fondo.
Nivel de Servicio:
100%
Tiempo de Respuesta:
2.147ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
220ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
575ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
295ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
752ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.134ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
689ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
620ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
508ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
327ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
2.877ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
4.295ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
280ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.224ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.593ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
747ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
4.368ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.654ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.293ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.406ms