PresentID Speaker verification API checks whether two voices belong to the same person or not. This capability is potentially useful in call centers.
We have proposed a deep learning-based method for speaker verification. Our team worked on this project for more than 1 year and the accuracy has passed over benchmarks such as the accuracy of the paper by Andrew Zisserman Group at Oxford University. In contrast with other methods that are text-dependent, our model is text and language-independent. On the other hand, the processing speed of our model is less than 1 sec and the model verifies a person by just two voices with a length of 4 secs. We have trained the model on tracks with English, French, Spanish, German, Persian, and Arabic languages. Our model is robust to the environment and virtual noises.
**Input:**
- Voice file
- Voice URL link
- Base64 Voice
**Output:**
- Result index
- Result message
**Features:**
- Accuracy over 90%.
- Less than 1 second processing time.
- No need for GPU.
- Language & text-independent.
- Easy integration with your app.
- Support IOS, Android, Windows, and Mac devices.
- Easy integration with your app.
**Use Cases:**
- Call center
**Rules & Restrictions:**
- Send data via Base64 or a voice URL or voice file.
- The voice must be between three seconds and one minute.
- The voices must not exceed 5 MB.
- Supported file types: WAV, MP3, M4A, FLAC, AAC, OGG.
Speaker verification API checks whether two voices belong to one person or not
The voice must be between three seconds and one minute
The voices must not exceed 5 MB
Supported file types: wav, mp3, m4a, FLAC, aac, ogg
Send voice with voice file - Características del Endpoint
| Objeto | Descripción |
|---|
{
"data": {
"resultIndex": 0,
"resultMessage": "The two voices don't belong to the same person."
},
"hasError": false,
"statusCode": 200,
"statusMessage": "Login Successfull"
}
curl --location --request POST 'https://zylalabs.com/api/4004/speaker+verification/4784/send+voice+with+voice+file' --header 'Authorization: Bearer YOUR_API_KEY'
Speaker verification API checks whether two voices belong to one person or not
The voice must be between three seconds and one minute
The voices must not exceed 5 MB
Supported file types: wav, mp3, m4a, FLAC, aac, ogg
Send voice with Base64 - Características del Endpoint
| Objeto | Descripción |
|---|
{"statusCode":400,"statusMessage":"You must upload a sound file.","hasError":true,"features":null}
curl --location --request POST 'https://zylalabs.com/api/4004/speaker+verification/4785/send+voice+with+base64' --header 'Authorization: Bearer YOUR_API_KEY'
Speaker verification API checks whether two voices belong to one person or not.
The voice must be between three seconds and one minute
The voices must not exceed 5 MB
Supported file types: wav, mp3, m4a, FLAC, aac, ogg
Send voice with Voice URL - Características del Endpoint
| Objeto | Descripción |
|---|
{"statusCode":400,"statusMessage":"You must upload a sound file.","hasError":true,"features":null}
curl --location --request POST 'https://zylalabs.com/api/4004/speaker+verification/4786/send+voice+with+voice+url' --header 'Authorization: Bearer YOUR_API_KEY'
| Encabezado | Descripción |
|---|---|
Autorización
|
[Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito. |
Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.
The PresentID Speaker Verification API is designed to confirm whether two voice samples originate from the same person. This functionality is essential for applications requiring secure identity verification through voice, such as in banking, access control, and remote authentication scenarios.
To use the API, you will need to submit two separate audio clips via a POST request. The API analyzes the voice characteristics of both samples, comparing features such as pitch, tone, and modulation to determine if they match. It then returns a confidence score or a binary result indicating whether the voices are from the same individual.
The API accepts common audio file formats, including WAV, MP3, and AAC. For best results, ensure that the recordings are clear, with minimal background noise, and that the spoken content is similar in both samples.
Yes, the API has limitations that vary depending on the subscription plan you select. These limitations may involve the size of the audio files you can upload and the number of verification requests you can make per day or month. For specific details, please refer to the pricing page or your user dashboard.
You might encounter several common errors: 400 Bad Request: This error often occurs if the audio files are too large, corrupted, or in an incorrect format. Ensure your files are within the required size limits and properly formatted. 401 Unauthorized: This happens if your API key is missing, incorrect, or expired. Make sure your API key is valid and included correctly in your request headers. 429 Too Many Requests: This indicates that you have exceeded the API usage limits set by your subscription plan. Consider upgrading your plan or managing your request rate more effectively.
Cada punto final devuelve una respuesta JSON que contiene un objeto `data` con un `resultIndex` y `resultMessage`. El `resultIndex` indica si las voces coinciden (0 para no coincidir, 1 para coincidir), mientras que el `resultMessage` proporciona un resultado descriptivo del proceso de verificación
Los campos clave en los datos de respuesta incluyen `resultIndex`, que indica el estado de coincidencia, `resultMessage`, que describe el resultado, `hasError`, que indica si ocurrió un error, y `statusCode` y `statusMessage` para el estado general de la solicitud
Los puntos finales aceptan parámetros como el archivo de audio (archivo de voz, Base64 o URL de voz) El audio debe tener entre 3 segundos y 1 minuto de duración no exceder 5 MB y estar en formatos soportados como WAV MP3 o AAC
Los datos de respuesta están organizados en un formato JSON Incluye un objeto `data` con resultados de verificación y campos adicionales para el manejo de errores y el estado Esta estructura permite un fácil análisis e integración en aplicaciones
Los casos de uso típicos incluyen la verificación de identidad en centros de llamadas la prevención de fraudes en la banca y los sistemas de control de acceso seguro La API puede mejorar la seguridad al confirmar la identidad de los usuarios en función de muestras de voz
Los usuarios pueden utilizar los datos devueltos verificando el `resultIndex` para determinar si las voces coinciden y usando el `resultMessage` para obtener comentarios detallados Esta información puede guiar acciones futuras como permitir el acceso o marcar posibles fraudes
La API emplea un modelo de aprendizaje profundo entrenado con diversas muestras de voz en múltiples idiomas asegurando alta precisión y robustez contra el ruido ambiental Las pruebas continuas contra los estándares ayudan a mantener la calidad de los datos
Si la API devuelve un error o resultados vacíos verifica el formato del archivo de audio tamaño y duración Asegúrate de que la entrada cumpla con los requisitos especificados Implementa manejo de errores en tu aplicación para gestionar estos escenarios con gracia
Nivel de Servicio:
57%
Tiempo de Respuesta:
1.057ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.148ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.940ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
4.645ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
7.632ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.477ms
Nivel de Servicio:
96%
Tiempo de Respuesta:
735ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
13.953ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
0ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
65ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.402ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
608ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
234ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.877ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.429ms
Nivel de Servicio:
90%
Tiempo de Respuesta:
721ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
648ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.463ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
4.933ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
823ms