यह API ऐसे एल्गोरिदम का उपयोग करती है जो स्ट्रिंग समानता की तुलना के लिए उपयोग किया जा सकता है जैसे लेवेंस्ट्राइन, जारो-विंकलर और डाइस। ये एल्गोरिदम दो स्ट्रिंग्स में वर्णों या शब्दों की तुलना करते हैं और उनके समानता के आधार पर एक स्कोर तय करते हैं। उदाहरण के लिए, लेवेंस्ट्राइन दूरी एल्गोरिदम न्यूनतम संख्या की सम्मिलन, विलोपन या प्रतिस्थापन की गणना करता है जो एक स्ट्रिंग को दूसरी में बदलने के लिए आवश्यक है। जारो-विंकलर दूरी एल्गोरिदम मिलते-जुलते वर्णों की संख्या और एक स्ट्रिंग को दूसरी में बदलने के लिए आवश्यक प्रसरण की संख्या के आधार पर एक समानता स्कोर की गणना करता है।
एक टेक्स्ट समानता API का उपयोग विभिन्न उद्देश्यों के लिए किया जा सकता है, जैसे डेटा डीडुप्लीकेशन, रिकॉर्ड लिंकिंग और फजी मिलान। उदाहरण के लिए, डेटा डीडुप्लीकेशन में, एक API का उपयोग एक डेटाबेस में दो रिकॉर्ड की तुलना करने के लिए किया जा सकता है यह निर्धारित करने के लिए कि क्या वे एक ही इकाई को दर्शाते हैं, जैसे कि एक ग्राहक या एक उत्पाद। रिकॉर्ड लिंकिंग में, एक API का उपयोग विभिन्न डेटा स्रोतों से रिकॉर्ड को लिंक करने के लिए किया जा सकता है जो एक ही इकाई को दर्शाते हैं। फजी मिलान में, एक API का उपयोग उन टेक्स्ट स्ट्रिंग्स का मिलान करने के लिए किया जा सकता है जिनमें गलत वर्तनी, टाइपिंग गलतियाँ, या फॉर्मेटिंग भिन्नताएँ हो सकती हैं।
टेक्स्ट समानता API का उपयोग करने का एक मुख्य लाभ यह है कि यह स्ट्रिंग मिलान के लिए उच्च सटीकता प्रदान करता है। इसके अतिरिक्त, APIs का उपयोग शब्दों की त्वरित और प्रभावी तुलना करने के लिए किया जा सकता है जिससे डेटा या डेटा स्ट्रीम को वास्तविक समय में प्रोसेस करना आसान हो जाता है। API सटीकता के साथ शक्तिशाली कार्यक्षमता प्रदान करता है। यह आपके उपयोगकर्ताओं के लिए आपके स्ट्रिंग्स में पाए गए समान पाठ के प्रतिशत का पता लगाना और सटीक माप खोजना आसान बनाता है। यह आपको अपनी विशिष्ट आवश्यकताओं के अनुसार खोज परिणामों को अनुकूलित करने की अनुमति देता है, जिससे यह API आपके अनुप्रयोगों या स्ट्रिंग-संबंधित सेवाओं के लिए एक लचीला और बहुपरकारी उपकरण बन जाता है।
संक्षेप में, टेक्स्ट समानता API टेक्स्ट स्ट्रिंग्स की तुलना करने और उनकी समानता निर्धारित करने के लिए एक उपयोगी उपकरण है। API का उपयोग करके, डेवलपर्स ऐसे अनुप्रयोग बना सकते हैं जो स्ट्रिंग समानता की तुलना पर निर्भर करते हैं, जैसे डेटा डीडुप्लीकेशन, लॉगिंग, आदि।
यह पैरामीटर्स प्राप्त करेगा और आपको एक JSON प्रदान करेगा।
डेटा डीडुप्लीकेशन: इसे डेटाबेस में डुप्लिकेट रिकॉर्ड की पहचान करने के लिए उपयोग किया जा सकता है जैसे डुप्लिकेट ग्राहक प्रविष्टियाँ या डुप्लिकेट उत्पाद सूची।
फजी मिलान: इसका उपयोग समान टेक्स्ट स्ट्रिंग्स का मिलान करने के लिए किया जा सकता है जैसे नाम या पते, भले ही उनमें गलत वर्तनी या भिन्नताएँ हों।
रिकॉर्ड लिंकिंग: यह API अलग-अलग डेटा स्रोतों से रिकॉर्ड को भिन्न करने के लिए उपयोग किया जा सकता है जो एक समान इकाई का प्रतिनिधित्व करते हैं जैसे ग्राहक या रोगी।
सर्च इंजन ऑप्टिमाइजेशन: इसका उपयोग एक वेब साइट पर डुप्लिकेट सामग्री की पहचान करने के लिए किया जा सकता है, जो सर्च इंजन रैंकिंग को नकारात्मक रूप से प्रभावित कर सकता है।
धोखाधड़ी का पता लगाना: इसका उपयोग धोखाधड़ी गतिविधियों की पहचान के लिए किया जा सकता है जैसे समान उपयोगकर्ता खातों या लेन-देन के पैटर्न का पता लगाना।
फ्री प्लान में 1 अनुरोध प्रति सेकंड।
पाठ तुलना प्राप्त करें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
string1 |
[आवश्यक] |
string2 |
[आवश्यक] |
{"string1":"Arun","string2":"Kumar","results":{"jaro-wrinkler":0.48333333333333334,"levenshtein-inverse":0.2,"dice":0}}
curl --location --request GET 'https://zylalabs.com/api/1961/text+similarity+api/1711/get+text+comparison?string1=twitter&string2=twitte' --header 'Authorization: Bearer YOUR_API_KEY'
तुलना प्राप्त करें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
रिक्वेस्ट बॉडी |
[आवश्यक] Json |
{"string1":"Arun","string2":"Kumar","results":{"jaro-wrinkler":0.48333333333333334,"levenshtein-inverse":0.2,"dice":0}}
curl --location --request POST 'https://zylalabs.com/api/1961/text+similarity+api/1712/get+comparison' --header 'Authorization: Bearer YOUR_API_KEY'
--data-raw '{
"string1": "twitter",
"string2": "twitte"
}'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
प्रत्येक एंडपॉइंट एक JSON ऑब्जेक्ट लौटाता है जिसमें इनपुट स्ट्रिंग्स और एक परिणाम ऑब्जेक्ट होता है जिसमें विभिन्न एल्गोरिदम जैसे जारो-विंक्लर, लेवेनस्टीन और डाइस का उपयोग करके समानता स्कोर की गणना की गई होती है।
प्रतिक्रिया डेटा में महत्वपूर्ण क्षेत्र "string1," "string2," और एक "results" वस्तु शामिल है जिसमें प्रयोग किए गए प्रत्येक एल्गोरिदम के लिए समानता स्कोर होते हैं जैसे "jaro-winkler," "levenshtein-inverse," और "dice"
एंडपॉइंट्स को दो पैरामीटर की आवश्यकता होती है: "string1" और "string2" जो कि उन टेक्स्ट स्ट्रिंग्स हैं जिन्हें तुलना की जानी है उपयोगकर्ता तुलना के लिए विभिन्न टेक्स्ट इनपुट प्रदान करके अपने अनुरोधों को अनुकूलित कर सकते हैं
प्रतिक्रिया डेटा को JSON प्रारूप में व्यवस्थित किया गया है जिसमें इनपुट स्ट्रिंग्स शीर्ष स्तर पर हैं और एक नेस्टेड "परिणाम" वस्तु है जो प्रत्येक एल्गोरिदम के लिए समानता स्कोर को शामिल करती है जिससे इसे एक्सेस करना और समझना आसान है
सामान्य उपयोग के मामलों में डाटा डीडुप्लिकेशन शामिल है ताकि डुप्लीकेट रिकॉर्ड की पहचान की जा सके फजी मैचिंग गलत स्पेलिंग को सही करने के लिए डेटा स्रोतों के बीच रिकॉर्ड लिंकिंग और समान लेनदेन पैटर्न का विश्लेषण करके धोखाधड़ी का पता लगाने के लिए
डेटा की सटीकता मान्यता प्राप्त एल्गोरिदम जैसे लेवेन्स्टीन और जारो-विंकलर के उपयोग के माध्यम से बनाए रखी जाती है जो वर्ण और शब्द की तुलना के आधार पर विश्वसनीय समानता स्कोर प्रदान करने के लिए डिज़ाइन किए गए हैं
उपयोगकर्ता प्रत्येक एल्गोरिदम के लिए 0 (कोई समानता नहीं) से 1 (समान स्ट्रिंग्स) के बीच समानता स्कोर की अपेक्षा कर सकते हैं स्कोर इनपुट स्ट्रिंग्स की प्रकृति जैसे लंबाई और वर्ण भिन्नताओं के आधार पर भिन्न हो सकते हैं
उपयोगकर्ता लौटाए गए डेटा का उपयोग समानता स्कोर का विश्लेषण करके कर सकते हैं यह निर्धारित करने के लिए कि इनपुट स्ट्रिंग्स कितनी निकटता से संबंधित हैं जिससे डीडुप्लिकेशन रिकॉर्ड लिंकिंग और खोज कार्यक्षमताओं को बढ़ाने जैसी एप्लिकेशनों को सक्षम किया जा सके
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,641ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
459ms
सर्विस लेवल:
90%
रिस्पॉन्स टाइम:
721ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,199ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
678ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,591ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,815ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,610ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,340ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
866ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
38ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
15,377ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
14ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
5,255ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
889ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,158ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,465ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,680ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
8,798ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
495ms