La API de Extracción utiliza inteligencia artificial para extraer información clave de texto no estructurado, como nombres, correos electrónicos, fechas, montos y más. Simplemente envía un bloque de texto y una lista de campos que deseas extraer; la API devuelve un JSON limpio y estructurado.
Construida con FastAPI y OpenAI, esta API es ideal para automatizar el procesamiento de documentos, el llenado de formularios, la enriquecimiento de CRM y más.
Soporta definiciones de campos flexibles y funciona con todo, desde correos electrónicos y mensajes hasta recibos e informes. Ya sea que estés extrayendo un campo o muchos, la respuesta es rápida, precisa y lista para integrarse en tus aplicaciones.
No es necesario entrenar ningún modelo; la inteligencia está incorporada.
https://www.dataextractorapi.com
Visita para más información y documentación
Extrae campos específicos como nombre, correo electrónico, fecha, cantidad o cualquier clave-valor personalizada del texto en bruto utilizando IA. Envía un bloque de texto y una lista de campos que deseas extraer, y la API devuelve un JSON estructurado.
Extraer - Características del Endpoint
| Objeto | Descripción |
|---|---|
text |
[Requerido] The unstructured text to extract information from |
fields |
[Requerido] A list of field names to extract (e.g. name, email, amount) |
Cuerpo de la Solicitud |
[Requerido] Json |
{
"message": "Data extracted successfully",
"data": {
"name": "Jane Doe",
"email": "[email protected]",
"amount": "$300",
"date": "May 12th"
}
}
curl --location --request POST 'https://zylalabs.com/api/8379/ai+data+extraction+api/14640/extract?text="John Doe lives at 123 Main St, NYC, phone: (555) 123-4567"&fields="name,address,phone"' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"text": "John Doe lives at 123 Main St, NYC, phone: (555) 123-4567",
"fields": "name,address,phone"
}'
Este endpoint analiza un bloque de texto y lo clasifica en una o más categorías predefinidas (etiquetas) utilizando IA. Proporcionas el texto de entrada y una lista de posibles etiquetas, y la API devuelve cuáles etiquetas describen mejor el contenido. Es útil para etiquetar automáticamente tickets de soporte, comentarios de usuarios, reseñas o cualquier texto no estructurado.
Clasifica - Características del Endpoint
| Objeto | Descripción |
|---|---|
text |
[Requerido] The text you want to classify (e.g., a support message or user feedback). |
labels |
[Requerido] An array of possible categories (labels) to classify the text into. The API will return the most relevant ones based on the text. |
Cuerpo de la Solicitud |
[Requerido] Json |
{
"message": "Data classified successfully",
"data": {
"labels": [
"Bug",
"Feature Request"
]
}
curl --location --request POST 'https://zylalabs.com/api/8379/ai+data+extraction+api/14847/classify?text="The app crashes when I try to upload a file. Also, I think it would be nice to have dark mode."&labels="Bug, Feature Request, Login Issue"' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"text": "The app crashes when I try to upload a file. Also, I think it would be nice to have dark mode.",
"labels": ["Bug", "Feature Request", "Login Issue"]
}'
Este punto final de la API extrae múltiples registros estructurados de la entrada de texto no estructurada utilizando los modelos GPT de OpenAI. Soporta textos que contienen uno o varios registros y devuelve datos JSON consistentes y bien estructurados para un consumo fácil.
Cambia automáticamente el modo de extracción según la longitud del texto:
Si la longitud del texto ≤ 2000 caracteres, utiliza una extracción de una sola toma.
Si la longitud del texto > 2000 caracteres, divide el texto en fragmentos y extrae registros de cada fragmento.
Valida que el texto de entrada no esté vacío y que sea inferior a una longitud máxima (5000 caracteres).
Devuelve mensajes de error detallados en caso de fallo.
Solicitud:
Respuesta:
Extraer múltiples registros - Características del Endpoint
| Objeto | Descripción |
|---|---|
text |
[Requerido] The unstructured text to extract information from |
fields |
Opcional A list of fields names to extract (e.g. name, email, amount) |
Cuerpo de la Solicitud |
[Requerido] Json |
{
"message": "Records extracted successfully",
"data": [
{"from": "John", "amount": "$50", "to": "Alice"},
{"from": "Bob", "amount": "$40", "to": "Sarah"},
{"from": "Chris", "amount": "$80", "to": "Megan"}
]
}
curl --location --request POST 'https://zylalabs.com/api/8379/ai+data+extraction+api/14848/extract+multiple+records?text=Required' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"text": "Order #123: Pizza $15, delivered to 123 Main St. Order #124: Burger $12, delivered to 456 Oak Ave.",
"fields": ["order_id", "item", "price", "address"]
}'
| Encabezado | Descripción |
|---|---|
Autorización
|
[Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito. |
Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.
El endpoint de Extracción devuelve datos estructurados en formato JSON, incluidos campos clave como nombres, correos electrónicos, montos y fechas extraídas del texto proporcionado.
Los campos clave en los datos de respuesta suelen incluir "nombre", "correo electrónico", "monto" y "fecha". También se pueden especificar campos personalizados adicionales según los requisitos del usuario.
Los usuarios pueden personalizar sus solicitudes de datos especificando una lista de campos que desean extraer del texto de entrada. Esto permite una extracción de datos adaptada a necesidades específicas.
Los datos de respuesta están organizados en una estructura JSON, que contiene un campo "mensaje" que indica éxito y un campo "datos" que sostiene los pares clave-valor extraídos.
Los casos de uso típicos incluyen la automatización del procesamiento de documentos, la mejora de los sistemas CRM, el llenado de formularios y la extracción de información de correos electrónicos, recibos e informes.
La precisión de los datos se mantiene a través del uso de algoritmos de inteligencia artificial avanzados que están integrados, garantizando una extracción confiable de texto no estructurado sin la necesidad de capacitación del usuario.
Los patrones de datos estándar incluyen formatos reconocibles para nombres, correos electrónicos, fechas y montos monetarios. Los usuarios pueden esperar resultados de extracción consistentes en varios tipos de texto.
El endpoint de extracción puede extraer varios tipos de información, incluyendo identificadores personales (nombres, correos electrónicos), cifras financieras (cantidades) y datos temporales (fechas) de texto no estructurado.
Nivel de Servicio:
100%
Tiempo de Respuesta:
726ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.585ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
2.195ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.497ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
830ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
6.629ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.450ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
1.134ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
3.812ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
44ms