Esta API utiliza algoritmos que pueden ser utilizados para la comparación de similitud de cadenas, como Levenshtein, Jaro-Winkler y Dice. Estos algoritmos comparan los caracteres o palabras en dos cadenas y asignan una puntuación basada en su similitud. Por ejemplo, el algoritmo de distancia de Levenshtein calcula el número mínimo de inserciones, eliminaciones o sustituciones necesarias para transformar una cadena en otra. El algoritmo de distancia Jaro-Winkler calcula una puntuación de similitud basada en el número de caracteres coincidentes y la cantidad de transposiciones requeridas para transformar una cadena en otra.
Una API de Similitud de Texto puede ser utilizada para una variedad de propósitos, como la deduplicación de datos, el enlace de registros y la coincidencia difusa. Por ejemplo, en la deduplicación de datos, se puede usar una API para comparar dos registros en una base de datos para determinar si representan la misma entidad, como un cliente o un producto. En el enlace de registros, una API puede ser utilizada para vincular registros de diferentes fuentes de datos que representan la misma entidad. En la coincidencia difusa, una API puede ser utilizada para emparejar cadenas de texto que pueden contener errores tipográficos, faltas de ortografía o variaciones de formato.
Una de las principales ventajas de usar una API de Similitud de Texto es que proporciona alta precisión para la coincidencia de cadenas. Además, las APIs pueden ser utilizadas para comparar palabras de manera rápida y eficiente, facilitando el procesamiento de datos o flujos de datos en tiempo real. La API ofrece una funcionalidad poderosa con precisión. Esto facilita a sus usuarios encontrar mediciones exactas y descubrir el porcentaje de texto similar encontrado en sus cadenas. Esto le permite adaptar los resultados de búsqueda a sus necesidades específicas, lo que convierte a esta API en una herramienta flexible y versátil para sus aplicaciones o servicios relacionados con cadenas.
En resumen, la API de Similitud de Texto es una herramienta útil para comparar cadenas de texto y determinar su similitud. Al utilizar una API, los desarrolladores pueden crear aplicaciones que dependen de la comparación de similitud de cadenas, como la deduplicación de datos, el registro, etc.
Recibirá parámetros y le proporcionará un JSON.
Deduplicación de Datos: Puede ser utilizada para identificar registros duplicados en una base de datos, como entradas duplicadas de clientes o listados duplicados de productos.
Coincidencia difusa: Puede ser utilizada para emparejar cadenas de texto similares, como nombres o direcciones, incluso si contienen errores tipográficos o variaciones.
Enlace de registros: Esta API puede ser utilizada para diferenciar registros de diferentes fuentes de datos que representan una entidad similar, como un cliente o paciente.
Optimización de motores de búsqueda: Esto puede ser utilizado para identificar contenido duplicado en un sitio web, lo que puede afectar negativamente las clasificaciones en los motores de búsqueda.
Detección de fraude: Puede ser utilizada para identificar actividades fraudulentas, como detectar cuentas de usuario o patrones de transacciones similares.
1 solicitud por segundo en el plan gratuito.
Para utilizar este punto final, solo tienes que insertar 2 cadenas en los parámetros.
Obtener comparación de texto - Características del Endpoint
| Objeto | Descripción |
|---|---|
string1 |
[Requerido] |
string2 |
[Requerido] |
{"string1":"Arun","string2":"Kumar","results":{"jaro-wrinkler":0.48333333333333334,"levenshtein-inverse":0.2,"dice":0}}
curl --location --request GET 'https://zylalabs.com/api/1961/text+similarity+api/1711/get+text+comparison?string1=twitter&string2=twitte' --header 'Authorization: Bearer YOUR_API_KEY'
Para usar este endpoint, todo lo que tienes que hacer es insertar 2 cadenas en los parámetros.
Obtener comparación - Características del Endpoint
| Objeto | Descripción |
|---|---|
Cuerpo de la Solicitud |
[Requerido] Json |
{"string1":"Arun","string2":"Kumar","results":{"jaro-wrinkler":0.48333333333333334,"levenshtein-inverse":0.2,"dice":0}}
curl --location --request POST 'https://zylalabs.com/api/1961/text+similarity+api/1712/get+comparison' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"string1": "twitter",
"string2": "twitte"
}'
| Encabezado | Descripción |
|---|---|
Autorización
|
[Requerido] Debería ser Bearer access_key. Consulta "Tu Clave de Acceso a la API" arriba cuando estés suscrito. |
Sin compromiso a largo plazo. Mejora, reduce o cancela en cualquier momento. La Prueba Gratuita incluye hasta 50 solicitudes.
Cada punto final devuelve un objeto JSON que contiene las cadenas de entrada y un objeto de resultados con puntajes de similitud calculados utilizando varios algoritmos, como Jaro-Winkler, Levenshtein y Dice.
Los campos clave en los datos de respuesta incluyen "string1," "string2," y un objeto "results" que contiene puntajes de similitud para cada algoritmo utilizado, como "jaro-winkler," "levenshtein-inverso," y "dice."
Los puntos finales requieren dos parámetros: "string1" y "string2", que son las cadenas de texto a comparar. Los usuarios pueden personalizar sus solicitudes proporcionando diferentes entradas de texto para la comparación.
Los datos de respuesta están organizados en un formato JSON, con las cadenas de entrada en el nivel superior y un objeto "resultados" anidado que contiene las puntuaciones de similitud para cada algoritmo, lo que facilita el acceso y la interpretación.
Los casos de uso típicos incluyen la deduplicación de datos para identificar registros duplicados, la coincidencia difusa para corregir errores de ortografía, la vinculación de registros entre fuentes de datos y la detección de fraudes al analizar patrones de transacciones similares.
La precisión de los datos se mantiene a través del uso de algoritmos establecidos como Levenshtein y Jaro-Winkler, que están diseñados para proporcionar puntuaciones de similitud confiables basadas en comparaciones de caracteres y palabras.
Los usuarios pueden esperar puntajes de similitud que varían de 0 (sin similitud) a 1 (cadenas idénticas) para cada algoritmo. Los puntajes pueden variar según la naturaleza de las cadenas de entrada, como la longitud y las diferencias de caracteres.
Los usuarios pueden utilizar los datos devueltos analizando los puntajes de similitud para determinar cuán relacionadas están las cadenas de entrada, lo que permite aplicaciones como la deduplicación, la vinculación de registros y la mejora de las funcionalidades de búsqueda.
Nivel de Servicio:
100%
Tiempo de Respuesta:
449ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
393ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
542ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
162ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
393ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
250ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
381ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
308ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
127ms
Nivel de Servicio:
100%
Tiempo de Respuesta:
820ms