Similaridade de Dados Otimizada API API ID: 11920

API de Similaridade de Dados Otimizados: Melhore suas aplicações com soluções de similaridade de dados eficientes adaptadas para desempenho

Use esta API do seu agente de IA via MCP

Funciona com OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline e qualquer cliente de IA compatível com MCP.

Docs e configuração

Crie uma skill envolvendo este MCP: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

Descrição longa (balanceada, amigável para o mercado)

API de Similaridade de Dados Otimizada é uma API de correspondência difusa e deduplicação de alta velocidade construída para dados reais e desordenados Ajuda você a identificar registros quase duplicados e reconciliar entidades mesmo quando os valores não correspondem exatamente—erros de digitação, diferenças de maiúsculas, pontuação ausente, problemas de espaçamento, abreviações e pequenas mudanças na ordem das palavras

Em vez de construir e ajustar seu próprio pipeline de correspondência difusa você envia suas strings (ou registros) para a API e recebe de volta correspondências pontuadas por similaridade em que você pode confiar Saídas típicas incluem pares correspondentes (por exemplo, “Apple” ↔ “apple inc.”) pontuações de similaridade e resultados estruturados que são fáceis de integrar em fluxos de trabalho de limpeza de dados CRMs trabalhos de ETL e pipelines de análise

Casos de uso comuns:

Deduplicar listas: encontrar duplicatas dentro de um conjunto de dados (correspondência tudo-a-tudo) e retornar pares prováveis de duplicatas
Reconciliação contra uma lista mestre: corresponder uma lista de entrada a um conjunto canônico (lista-para-mestre)
Higiene de dados de CRM e clientes: limpar leads/contas/empresas onde duplicatas prejudicam relatórios e abordagens
Resolução de entidades e vinculação de registros: conectar referências à mesma entidade do mundo real em diferentes fontes

Por que as equipes o usam:

Funciona com texto desordenado imediatamente (sem regras manuais para cada caso extremo)
Pontuações de similaridade para classificação e limites (você escolhe o quão rigoroso deseja ser)
Construído para escala e automação (projetado para funcionar em pipelines não apenas em scripts pontuais)

Documentação da API

Endpoints

Dedupe Endpoint ID: 22654

Dedupe é um endpoint de correspondência difusa para encontrar duplicatas dentro de uma única lista de strings. Em vez de comparar apenas duas entradas por chamada de API, você envia um conjunto de dados e ele retorna pares semelhantes e/ou grupos deduplicados em todo o conjunto.

Por que você usaria

Aumento de velocidade massivo: tipicamente ~300× a 1.000× mais rápido do que abordagens “regulares” que as pessoas tentam primeiro (comparações par-a-par, scorers difusos em loop, etc.) uma vez que você ultrapassa listas pequenas.
Limpeza opcional embutida: você pode ativar a limpeza comum de texto (minúsculas, remoção de pontuação, ordenação de tokens). Isso economiza horas (ou dias) de desenvolvimento + manutenção contínua.
Sufixos de empresa tratados automaticamente: terminações comuns como “Inc”, “LLC”, “Ltd”, etc. são removidas para que você combine o nome real.

Benchmarks: similarity-api/blog/speed-benchmarks (1M registros em ~7 minutos; mais rápido do que bibliotecas de correspondência difusa comuns em Python).

Limites rígidos no Zyla

Máximo de 1.000 strings por solicitação (aplicado).

Precisa de maior / ilimitado?

Use a versão completa em similarity-api/docs

Parâmetros (requisição POST)

data (obrigatório)

Uma string contendo um array JSON de strings.

Exemplo de valor para data:
["Acme Inc","ACME LLC","Globex GmbH"]

similarity_threshold (opcional, 0.0 a 1.0, padrão 0.75)

Maior = correspondência mais rigorosa (menos pares). Típico: 0.80–0.90 para deduplicação de empresas.

remove_punctuation (opcional, verdadeiro/falso, padrão verdadeiro)

Remove diferenças de pontuação (por exemplo, “A.C.M.E.” vs “ACME”).

to_lowercase (opcional, verdadeiro/falso, padrão verdadeiro)

Torna a correspondência insensível a maiúsculas e minúsculas.

use_token_sort (opcional, verdadeiro/falso, padrão falso)

Ajuda quando a ordem das palavras muda (por exemplo, “Banco da América” vs “América Banco de”).
output_format (opcional, padrão string_pairs)

Este endpoint pode retornar dados em múltiplos formatos. Por favor, selecione um dos seguintes:
- string_pairs:
  - Retorna as correspondências duplicadas como texto, para que você possa lê-las imediatamente.
    Cada linha é: [string_A, string_B, similarity]
    Use quando: você quiser ver quais nomes combinaram com quais nomes.
- index_pairs:
  - Mesma ideia que string_pairs, mas retorna posições na sua lista de entrada em vez das strings.
    Cada linha é: [index_A, index_B, similarity]
    Use quando: você quiser juntar os resultados de volta às suas linhas de origem com segurança (bancos de dados, planilhas, exportações de CRM).
- deduped_strings:
  - Retorna uma lista limpa com duplicatas removidas (mantém um representante de cada grupo de duplicatas).
    Use quando: você quiser uma lista final para exportar/utilizar, sem se preocupar em mapear de volta.
- deduped_indices:
  - Mesma ideia que deduped_strings, mas retorna os índices dos itens mantidos.
    Use quando: você quiser manter as linhas originais (por índice) e descartar as duplicatas.
- membership_map:
  - Retorna uma lista do mesmo comprimento que sua entrada onde cada posição informa o índice representativo para esse item.
    Exemplo: [0,0,0,3,3] significa que as linhas 0/1/2 são um grupo (rep=0) e as linhas 3/4 são outro (rep=3).
    Use quando: você quiser IDs de agrupamento / grupo por linha.
- row_annotations:
  - Retorna um objeto por linha de entrada com uma explicação do que pertence a ela (linha rep + similaridade).
    Use quando: você quiser um resultado legível para humanos, por linha, para depuração ou exibição na interface do usuário.
top_k (opcional, inteiro ou "todos", padrão "todos")

todos = encontrar todas as correspondências acima do limite.

Ou um inteiro (por exemplo, 50) para limitar correspondências por linha (mais rápido, menos resultados).

Solicitação de exemplo em python

import requests, json

API_KEY = "YOUR_ZYLA_KEY"
URL = "API_URL/dedupe"

data_list = ["Microsoft","Micsrosoft","Apple Inc","Apple","Google LLC","9oogle"]

params = {
"data": json.dumps(data_list),
"similarity_threshold": "0.75",
"remove_punctuation": "true",
"to_lowercase": "true",
"use_token_sort": "false",
"output_format": "string_pairs",
"top_k": "all"
}

headers = {"Authorization": f"Bearer {API_KEY}"}
r = requests.post(URL, headers=headers, params=params, timeout=60)
print(r.status_code)
print(r.json())

                                                                            
POST https://pr140-testing.zylalabs.com/api/11920/optimized+data+similarity+api/22654/dedupe

Dedupe - Recursos do endpoint

Objeto	Descrição
`data`	[Obrigatório] JSON array of strings to deduplicate (max 1000). Example: ["a","b","c"]
`similarity_threshold`	Opcional Similarity cutoff from 0 to 1. Higher values are stricter (fewer matches). Default is 0.75.
`remove_punctuation`	Opcional If true, punctuation is removed before matching. Default is true.
`to_lowercase`	Opcional If true, strings are lowercased before matching. Default is true.
`use_token_sort`	Opcional If true, tokens in each string are sorted before matching. Useful when word order varies. Default is false.
`output_format`	Opcional Default: string_pairs Allowed values (and what each means): index_pairs List of matches as [i, j, score] where i and j are indices in the input list. string_pairs List of matches as [string_i, string_j, score] using original strings. deduped_strings List of strings with duplicates removed (one representative per group). deduped_indices List of indices representing the deduplicated set (one representative per group). membership_map Array of length N where entry i is the representative index for the group of data[i]. row_annotations Array of objects (one per input row) with fields: index, original_string, rep_index, rep_string, similarity_to_rep.
`top_k`	Opcional Limits how many neighbors are returned per input string. Use all for full dedupe, or a positive integer for top matches per row.

Testar endpoint

RESPOSTA DE EXEMPLO DA API

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"status":"success","response_data":[["Apple","appl!e",1.0]]}

Dedupe - TRECHOS DE CÓDIGO


curl --location --request POST 'https://zylalabs.com/api/11920/optimized+data+similarity+api/22654/dedupe?data=["Apple", "appl!e"]' --header 'Authorization: Bearer YOUR_API_KEY'

Chave de acesso à API e autenticação

Após se cadastrar, cada desenvolvedor recebe uma chave de acesso à API pessoal, uma combinação única de letras e dígitos para acessar nosso endpoint de API. Para autenticar com a Similaridade de Dados Otimizada API basta incluir seu token Bearer no cabeçalho Authorization.

Cabeçalhos

Cabeçalho	Descrição
`Authorization`	[Obrigatório] Deve ser `Bearer access_key`. Veja "Sua chave de acesso à API" acima quando você estiver inscrito.

Perguntas

Preços simples e transparentes

Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento.

💫Basic

$24,99/Mês

50 Requisições / Mês
Então $0,6497400 por requisição se o limite for excedido.
Limite de taxa: 60 reqs por minuto
Suporte ao cliente especializado
Monitoramento de API em tempo real
Transferência de Dados Ilimitada Incluída

$24,99 / Mês

Sem compromisso. Cancele a qualquer momento

Popular

⚡Pro

$49,99/Mês

100 Requisições / Mês
Então $0,6497400 por requisição se o limite for excedido.
Limite de taxa: 60 reqs por minuto
Suporte ao cliente especializado
Monitoramento de API em tempo real
Transferência de Dados Ilimitada Incluída

$49,99 / Mês

Sem compromisso. Cancele a qualquer momento

🔥Pro Plus

$99,99/Mês

200 Requisições / Mês
Então $0,6497400 por requisição se o limite for excedido.
Limite de taxa: 120 reqs por minuto
Suporte ao cliente especializado
Monitoramento de API em tempo real
Transferência de Dados Ilimitada Incluída

$99,99 / Mês

Sem compromisso. Cancele a qualquer momento

🚀 Empresarial

A partir de
$ 10.000/Ano

Volume personalizado
Limite de taxa personalizado
Suporte ao cliente especializado
Monitoramento de API em tempo real

Agendar uma chamada

Recursos favoritos dos clientes

✔︎ Pague apenas por requisições bem-sucedidas
✔︎ Teste 7 dias gratis
✔︎ Suporte multilíngue
✔︎ Uma chave de API, todas as APIs.
✔︎ Painel intuitivo

✔︎ Tratamento de erros abrangente
✔︎ Documentação amigável para desenvolvedores
✔︎ Integração com Postman
✔︎ Conexões HTTPS seguras
✔︎ Alta disponibilidade

Similaridade de Dados Otimizada API FAQs

Que tipo de dados o endpoint Dedupe retorna

O endpoint Dedupe retorna um objeto JSON contendo pares de strings correspondentes, pontuações de similaridade e resultados deduplicados opcionais A saída pode ser formatada como pares de strings, pares de índices ou strings deduplicadas, dependendo da configuração especificada

Quais são os campos-chave nos dados de resposta

Os campos principais nos dados de resposta incluem "status" (indicando sucesso ou erro) e "response_data," que contém os resultados formatados de acordo com a solicitação do usuário, como pares correspondentes ou strings deduplicadas

Como os usuários podem personalizar seus pedidos de dados

Os usuários podem personalizar as solicitações ajustando parâmetros no objeto "config", como "similarity_threshold" para a estrictez das correspondências, "remove_punctuation" para pré-processamento e "output_format" para escolher a estrutura de resultado desejada

Como os dados de resposta estão organizados

Os dados de resposta estão organizados como um array de resultados onde cada entrada corresponde a uma correspondência ou string deduplicada Dependendo do formato de saída as entradas podem incluir strings originais índices e pontuações de similaridade facilitando a fácil integração em fluxos de trabalho

Quais são os casos de uso típicos para esses dados

Casos de uso típicos incluem a deduplicação de listas de clientes a reconciliação de registros contra uma lista mestra a limpeza de dados de CRM e a realização de resolução de entidades entre diferentes fontes de dados para garantir a integridade e a precisão dos dados

Como a precisão dos dados é mantida

A precisão dos dados é mantida por meio de algoritmos avançados de correspondência difusa que levam em conta problemas comuns de dados, como erros de digitação e diferenças de maiúsculas e minúsculas A API é projetada para lidar com dados desordenados de forma eficaz garantindo resultados de correspondência confiáveis

Quais são os valores de parâmetro aceitos para o endpoint Dedupe

Os valores de parâmetro aceitos incluem "similarity_threshold" (0 a 1), "remove_punctuation" (booleano), "to_lowercase" (booleano), "use_token_sort" (booleano) e "top_k" (inteiro ou "todos"). Esses parâmetros permitem que os usuários personalizem o processo de correspondência de acordo com suas necessidades específicas

Como lidar com resultados parciais ou vazios

Se o endpoint Dedupe retornar resultados parciais ou vazios os usuários devem verificar os dados de entrada em busca de problemas de qualidade como duplicatas excessivas ou limiares de similaridade muito baixos Ajustar o "similarity_threshold" ou revisar a lista de entrada pode ajudar a melhorar os resultados

Perguntas Frequentes Gerais

O que é o Zyla API Hub?

O Zyla API Hub é como uma grande loja de APIs, onde você pode encontrar milhares delas em um só lugar. Também oferecemos suporte dedicado e monitoramento em tempo real de todas as APIs. Após se cadastrar, você pode escolher quais APIs deseja usar. Lembre-se apenas de que cada API precisa de sua própria assinatura. Mas se você se inscrever em várias, usará a mesma chave para todas elas, facilitando as coisas para você.

Quais moedas e métodos de pagamento são aceitos?

Os preços são listados em USD (Dólar Americano), EUR (Euro), CAD (Dólar Canadense), AUD (Dólar Australiano) e GBP (Libra Esterlina). Aceitamos todos os principais cartões de débito e crédito. Nosso sistema de pagamento usa a mais recente tecnologia de segurança e é operado pela Stripe, uma das empresas de pagamento mais confiáveis do mundo. Se tiver problemas para pagar com cartão, entre em contato conosco em [email protected]

Além disso, se você já tiver uma assinatura ativa em qualquer uma dessas moedas (USD, EUR, CAD, AUD, GBP), essa moeda será mantida para assinaturas subsequentes. Você pode alterar a moeda a qualquer momento, desde que não tenha assinaturas ativas.

Por que não posso pagar com minha moeda local mesmo vendo-a na página de preços?

A moeda local exibida na página de preços é baseada no país do seu endereço IP e é fornecida apenas como referência. Os preços reais são em USD (Dólar Americano). Ao efetuar o pagamento, a cobrança aparecerá no extrato do seu cartão em USD, mesmo que você veja o valor equivalente em sua moeda local em nosso site. Isso significa que você não pode pagar diretamente com sua moeda local.

Meu pagamento foi recusado, o que devo fazer?

Ocasionalmente, o banco pode recusar a cobrança devido às configurações de proteção contra fraude. Sugerimos contatar seu banco inicialmente para verificar se estão bloqueando nossas cobranças. Você também pode acessar o Portal de Cobrança e alterar o cartão associado para realizar o pagamento. Se isso não funcionar e precisar de mais ajuda, entre em contato com nossa equipe em [email protected]

Como serei cobrado pela minha assinatura de API?

Os preços são determinados por uma assinatura recorrente mensal ou anual, dependendo do plano escolhido.

Como as chamadas da minha API serão descontadas do meu plano?

As chamadas de API são descontadas do seu plano com base nas requisições bem-sucedidas. Cada plano possui um número específico de chamadas por mês. Apenas chamadas bem-sucedidas, indicadas por uma resposta com Status 200, serão contabilizadas, garantindo que falhas não afetem sua cota mensal.

Como funciona o ciclo de cobrança?

O Zyla API Hub funciona com um sistema de assinatura mensal recorrente. Seu ciclo de cobrança começa no dia em que você compra um dos planos pagos e será renovado no mesmo dia do mês seguinte. Portanto, cancele sua assinatura com antecedência se quiser evitar cobranças futuras.

Como faço upgrade do meu plano atual com uma API?

Para fazer upgrade do seu plano atual, acesse a página de preços da API e selecione o novo plano desejado. O upgrade é instantâneo, permitindo aproveitar imediatamente os recursos do novo plano. Observe que as chamadas restantes do plano anterior não serão transferidas; você será cobrado pelo valor integral do novo plano.

Como posso ver o número restante de chamadas de API que posso fazer este mês?

Para verificar quantas chamadas de API restam para o mês atual, consulte o campo 'X-Zyla-API-Calls-Monthly-Remaining' no cabeçalho da resposta. Por exemplo, se seu plano permite 1.000 requisições por mês e você usou 100, este campo no cabeçalho da resposta indicará 900 chamadas restantes.

Como descubro o número máximo de requisições de API permitidas no meu plano de assinatura?

Para ver o número máximo de requisições de API que seu plano permite, verifique o cabeçalho de resposta 'X-Zyla-RateLimit-Limit'. Por exemplo, se seu plano inclui 1.000 requisições por mês, este cabeçalho exibirá 1.000.

Como sei quando meu limite de taxa será redefinido?

O cabeçalho 'X-Zyla-RateLimit-Reset' mostra o número de segundos até seu limite de taxa ser redefinido. Isso informa quando sua contagem de requisições começará do zero. Por exemplo, se exibir 3.600, significa que restam 3.600 segundos até o limite ser redefinido.

Posso cancelar a qualquer momento?

Sim, você pode cancelar seu plano a qualquer momento acessando sua conta e selecionando a opção de cancelamento na página de Cobrança. Observe que upgrades, downgrades e cancelamentos têm efeito imediato. Além disso, após o cancelamento, você não terá mais acesso ao serviço, mesmo que ainda tenha chamadas restantes na sua cota.

Como funciona o teste gratuito de 7 dias?

Para oferecer a oportunidade de experimentar nossas APIs sem compromisso, oferecemos um teste gratuito de 7 dias que permite realizar até 50 chamadas de API sem custo. Esse teste pode ser usado apenas uma vez; recomendamos aplicá-lo à API que mais interessa. Embora a maioria das APIs ofereça teste gratuito, algumas podem não oferecer. O teste termina após 7 dias ou quando você atingir 50 requisições, o que ocorrer primeiro. Se atingir o limite, será necessário "Iniciar seu plano pago" para continuar. Você encontra esse botão no perfil em Assinatura -> Escolha a API -> aba Preços. Se não cancelar até o 7º dia, sua assinatura será cobrada automaticamente, liberando todas as chamadas do plano.

O que acontece se eu esquecer de cancelar meu teste gratuito?

Após 7 dias, será cobrado o valor total do plano ao qual você estava inscrito durante o teste. Portanto, é importante cancelar antes do término do período. Solicitações de reembolso por esquecimento de cancelamento não são aceitas.

Quantas chamadas posso fazer durante o teste gratuito?

Ao assinar um teste gratuito de API, você pode fazer até 50 chamadas. Se desejar fazer chamadas adicionais além desse limite, a API solicitará que você "Inicie seu plano pago". Você encontra o botão no perfil em Assinatura -> Escolha a API -> aba Preços.

Quando as Ordens de Pagamento são processadas?

As Ordens de Pagamento são processadas entre os dias 20 e 30 de cada mês. Se você enviar sua solicitação antes do dia 20, seu pagamento será processado dentro desse período.

Se eu tiver algum problema, com quem devo falar?

Você pode nos contatar via chat para receber assistência imediata. Estamos online de 8h às 17h (EST). Se nos contatar após esse horário, retornaremos o mais rápido possível. Além disso, você pode enviar um e-mail para [email protected]

Assinar

Nível de serviço

100%

Tempo de resposta

3.110ms

Categoria:

Processamento de Linguagem Natural NLP

Tags:

#Combinação Difusa

A API de Comparação de Imagens Semelhantes usa IA para comparar imagens identificar conteúdo vis...

A API Geradora de Apelidos Desencadeie criatividade ilimitada gere nomes de usuário únicos melho...

Mídias Sociais e Networking Teste 7 dias gratis

Nível de serviço:

100%

Tempo de resposta:

523ms

Similaridade de Dados Otimizada API API ID: 11920

Descrição longa (balanceada, amigável para o mercado)

O que você gostaria de ver? Veja as informações ou confira a documentação?

Documentação da API

Endpoints

RESPOSTA DE EXEMPLO DA API

Dedupe - TRECHOS DE CÓDIGO

Chave de acesso à API e autenticação

Perguntas

Preços simples e transparentes

💫Basic

$24,99/Mês

⚡Pro

$49,99/Mês

🔥Pro Plus

$99,99/Mês

🚀 Empresarial

A partir de $ 10.000/Ano

Recursos favoritos dos clientes

Similaridade de Dados Otimizada API FAQs

Que tipo de dados o endpoint Dedupe retorna

Quais são os campos-chave nos dados de resposta

Como os usuários podem personalizar seus pedidos de dados

Como os dados de resposta estão organizados

Quais são os casos de uso típicos para esses dados

Como a precisão dos dados é mantida

Quais são os valores de parâmetro aceitos para o endpoint Dedupe

Como lidar com resultados parciais ou vazios

Perguntas Frequentes Gerais

O que é o Zyla API Hub?

Quais moedas e métodos de pagamento são aceitos?

Por que não posso pagar com minha moeda local mesmo vendo-a na página de preços?

Meu pagamento foi recusado, o que devo fazer?

Como serei cobrado pela minha assinatura de API?

Como as chamadas da minha API serão descontadas do meu plano?

Como funciona o ciclo de cobrança?

Como faço upgrade do meu plano atual com uma API?

Como posso ver o número restante de chamadas de API que posso fazer este mês?

Como descubro o número máximo de requisições de API permitidas no meu plano de assinatura?

Como sei quando meu limite de taxa será redefinido?

Posso cancelar a qualquer momento?

Como funciona o teste gratuito de 7 dias?

O que acontece se eu esquecer de cancelar meu teste gratuito?

Quantas chamadas posso fazer durante o teste gratuito?

Quando as Ordens de Pagamento são processadas?

Se eu tiver algum problema, com quem devo falar?

Nível de serviço

Tempo de resposta

Categoria:

Tags:

APIs relacionadas

Correspondência Eficiente de Similaridade API

Alta performance de similaridade API

Buscador Avançado de Sósias de Celebridades API

Semelhança em Tempo Real API

Melhor Encontrador de Sósias de Celebridades API

Buscador Rápido de Celebridades Semelhantes API

Encontrador de Sósias de Celebridades Preciso API

Encontrador Inteligente de Semelhança com Celebridades API

Encontrador de Semelhanças de Celebridades em Tempo Real API

Correspondência de Imagens Semelhantes API

Você também pode gostar

Título Forjar API

Forja de Palavras-chave API

Gerador de nomes de jogos API

Gerador de Nome de Empresa API

Gerador de Nome de Usuário API

Nomeação de Entidades API

Criador do Nome da Empresa API

Gerador de Alias API

Nome da Conta Criador API

Gerador de Alias API

A partir de
$ 10.000/Ano