PresentID स्पीकर वेरिफिकेशन API यह जाँच करता है कि दो आवाजें एक ही व्यक्ति की हैं या नहीं यह क्षमता कॉल सेंटर में संभावित रूप से उपयोगी हो सकती है
हमने स्पीकर वेरिफिकेशन के लिए एक गहन शिक्षा-आधारित विधि का प्रस्ताव रखा है हमारी टीम ने इस प्रोजेक्ट पर एक साल से अधिक समय तक काम किया और सटीकता ऑक्सफ़ोर्ड विश्वविद्यालय में एंड्रयू ज़िसरस्मैन ग्रुप द्वारा प्रकाशित पेपर की सटीकता जैसे मानकों को पार कर गई है अन्य विधियों की तुलना में जो टेक्स्ट-निर्भर हैं हमारा मॉडल टेक्स्ट और भाषा-स्वतंत्र है दूसरी ओर हमारे मॉडल की प्रोसेसिंग स्पीड 1 सेकंड से कम है और यह मॉडल केवल 4 सेकंड की लंबाई की दो आवाजों के साथ एक व्यक्ति की पुष्टि करता है हमने मॉडल को अंग्रेजी फ्रेंच स्पेनिश जर्मन फारसी और अरबी भाषाओं में ट्रैक पर प्रशिक्षित किया है हमारा मॉडल पर्यावरण और वर्चुअल शोर के प्रति मजबूत है
**इनपुट:**
- आवाज फ़ाइल
- आवाज URL लिंक
- बेस64 आवाज
**आउटपुट:**
- परिणाम सूची
- परिणाम संदेश
**विशेषताएँ:**
- 90% से अधिक सटीकता
- 1 सेकंड से कम प्रोसेसिंग समय
- GPU की आवश्यकता नहीं है
- भाषा और टेक्स्ट-स्वतंत्र
- आपके ऐप के साथ आसान एकीकरण
- आईओएस एंड्रॉइड विंडोज और मैक उपकरणों का समर्थन
- आपके ऐप के साथ आसान एकीकरण
**उपयोग के मामले:**
- कॉल सेंटर
**नियम और प्रतिबंध:**
- डेटा को बेस64 या आवाज URL या आवाज फ़ाइल के माध्यम से भेजें
- आवाज तीन सेकंड से एक मिनट के बीच होनी चाहिए
- आवाज 5 MB से अधिक नहीं होनी चाहिए
- समर्थित फ़ाइल प्रकार: WAV MP3 M4A FLAC AAC OGG
स्पीकर वेरीफिकेशन एपीआई यह जांचता है कि दो आवाजें एक व्यक्ति की हैं या नहीं
आवाज तीन सेकंड से एक मिनट के बीच होनी चाहिए
आवाजों का आकार 5 एमबी से अधिक नहीं होना चाहिए
समर्थित फ़ाइल प्रकार: wav, mp3, m4a, FLAC, aac, ogg
वॉयस फाइल के साथ वॉयस भेजें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|
{
"data": {
"resultIndex": 0,
"resultMessage": "The two voices don't belong to the same person."
},
"hasError": false,
"statusCode": 200,
"statusMessage": "Login Successfull"
}
curl --location --request POST 'https://zylalabs.com/api/4004/speaker+verification/4784/send+voice+with+voice+file' --header 'Authorization: Bearer YOUR_API_KEY'
स्पीकर सत्यापन एपीआई जांचता है कि क्या दो आवाजें एक ही व्यक्ति की हैं या नहीं
आवाज तीन सेकंड से एक मिनट के बीच होनी चाहिए
आवाज 5 एमबी से अधिक नहीं होनी चाहिए
समर्थित फ़ाइल प्रकार: wav, mp3, m4a, FLAC, aac, ogg
Base64 के साथ आवाज़ भेजें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|
{"statusCode":400,"statusMessage":"You must upload a sound file.","hasError":true,"features":null}
curl --location --request POST 'https://zylalabs.com/api/4004/speaker+verification/4785/send+voice+with+base64' --header 'Authorization: Bearer YOUR_API_KEY'
स्पीकर वेरिफिकेशन एपीआई यह जांचता है कि दो आवाजें एक व्यक्ति की हैं या नहीं
आवाज तीन सेकंड से लेकर एक मिनट के बीच होनी चाहिए
आवाजों का आकार 5 एमबी से अधिक नहीं होना चाहिए
समर्थित फ़ाइल प्रकार: wav, mp3, m4a, FLAC, aac, ogg
वॉइस यूआरएल के साथ आवाज़ भेजें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|
{"statusCode":400,"statusMessage":"You must upload a sound file.","hasError":true,"features":null}
curl --location --request POST 'https://zylalabs.com/api/4004/speaker+verification/4786/send+voice+with+voice+url' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
प्रेजेंटआईडी स्पीकर वेरिफिकेशन एपीआई को यह सत्यापित करने के लिए डिज़ाइन किया गया है कि क्या दो आवाज़ के नमूने एक ही व्यक्ति से उत्पन्न होते हैं यह कार्यक्षमता उन अनुप्रयोगों के लिए आवश्यक है जो आवाज़ के माध्यम से सुरक्षित पहचान सत्यापन की आवश्यकता होते हैं जैसे कि बैंकिंग, एक्सेस नियंत्रण और दूरस्थ प्रमाणीकरण परिदृश्यों में
API का उपयोग करने के लिए आपको एक POST अनुरोध के माध्यम से दो अलग-अलग ऑडियो क्लिप प्रस्तुत करनी होगी API दोनों नमूनों की आवाज़ की विशेषताओं का विश्लेषण करता है और यह निर्धारित करने के लिए पिच, टोन और मडुलेशन जैसे लक्षणों की तुलना करता है कि क्या वे मेल खाते हैं फिर यह एक विश्वास स्कोर या बाइनरी परिणाम लौटाता है जो दर्शाता है कि क्या आवाज़ें एक ही व्यक्ति की हैं
एपीआई सामान्य ऑडियो फ़ाइल प्रारूपों को स्वीकार करता है जिसमें WAV MP3 और AAC शामिल हैं सर्वश्रेष्ठ परिणामों के लिए सुनिश्चित करें कि रिकॉर्डिंग स्पष्ट हों कम से कम पृष्ठभूमि शोर हो और बोला गया सामग्री दोनों नमूनों में समान हो
हाँ, एपीआई के कुछ सीमाएँ हैं जो आपके द्वारा चयनित सदस्यता योजना के आधार पर भिन्न होती हैं ये सीमाएँ उन ऑडियो फ़ाइलों के आकार से संबंधित हो सकती हैं जिन्हें आप अपलोड कर सकते हैं और प्रतिदिन या माह में आप कितनी सत्यापन अनुरोध कर सकते हैं विशेष विवरण के लिए कृपया मूल्य निर्धारण पृष्ठ या अपने उपयोगकर्ता डैशबोर्ड को देखें
आपको कई सामान्य त्रुटियों का सामना करना पड़ सकता है 400 बुरा अनुरोध: यह त्रुटि अक्सर तब होती है जब ऑडियो फ़ाइलें बहुत बड़ी होती हैं, corrupted होती हैं, या गलत प्रारूप में होती हैं सुनिश्चित करें कि आपकी फ़ाइलें आवश्यक आकार सीमाओं के भीतर हैं और ठीक से प्रारूपित हैं 401 अधिकृत नहीं: यह तब होता है जब आपका एपीआई कुंजी गायब होती है, गलत होती है, या समाप्त हो जाती है सुनिश्चित करें कि आपकी एपीआई कुंजी मान्य है और आपके अनुरोध शीर्षकों में सही ढंग से शामिल है 429 बहुत सारे अनुरोध: यह बताता है कि आपने अपनी सदस्यता योजना द्वारा निर्धारित एपीआई उपयोग सीमाओं को पार कर लिया है अपने योजना को अपग्रेड करने पर विचार करें या अपने अनुरोध दर को अधिक प्रभावी ढंग से प्रबंधित करें
प्रत्येक एंडपॉइंट एक JSON प्रतिक्रिया लौटाता है जिसमें एक `data` ऑब्जेक्ट होता है जिसमें `resultIndex` और `resultMessage` होता है `resultIndex` यह दर्शाता है कि आवाजें मेल खाती हैं या नहीं (कोई मेल नहीं के लिए 0 मेल के लिए 1) जबकि `resultMessage` प्रमाणन प्रक्रिया के एक वर्णनात्मक परिणाम को प्रदान करता है
प्रतिक्रिया डेटा में प्रमुख क्षेत्र शामिल हैं `resultIndex`, जो मैच स्थिति को इंगित करता है, `resultMessage`, जो परिणाम का वर्णन करता है, `hasError`, जो इंगीत करता है कि क्या कोई त्रुटि हुई है, और `statusCode` और `statusMessage` कुल अनुरोध स्थिति के लिए
एंडपॉइंट्स ऐसे पैरामीटर्स स्वीकार करते हैं जैसे ऑडियो फ़ाइल (वॉयस फ़ाइल, Base64, या वॉयस URL) ऑडियो की लंबाई 3 सेकंड से 1 मिनट के बीच होनी चाहिए अधिकतम 5 एमबी होनी चाहिए और समर्थित फ़ॉर्मेट जैसे WAV MP3 या AAC में होना चाहिए
प्रतिक्रिया डेटा एक JSON प्रारूप में व्यवस्थित है इसमें सत्यापन परिणामों के साथ एक `डेटा` ऑब्जेक्ट और त्रुटि हैंडलिंग और स्थिति के लिए अतिरिक्त फ़ील्ड शामिल हैं यह संरचना एप्लिकेशनों में आसान पार्सिंग और एकीकरण की अनुमति देती है
प्रतिकृत उपयोग के मामलों में कॉल केंद्रों में पहचान सत्यापन बैंकिंग में धोखाधड़ी रोकने और सुरक्षित पहुंच नियंत्रण प्रणालियाँ शामिल हैं एपीआई उपयोगकर्ताओं की आवाज़ के नमूनों के आधार पर पहचान की पुष्टि करके सुरक्षा को बढ़ा सकता है
उपयोगकर्ता लौटाए गए डेटा का उपयोग `resultIndex` की जांच करके कर सकते हैं यह निर्धारित करने के लिए कि क्या आवाज़ें मिलती हैं और `resultMessage` का उपयोग करके विस्तृत फीडबैक के लिए यह जानकारी आगे की कार्रवाई में मार्गदर्शन कर सकती है जैसे कि एक्सेस की अनुमति देना या संभावित धोखाधड़ी को झंडी दिखाना
एपीआई एक गहरे शिक्षण मॉडल का उपयोग करता है जो विभिन्न भाषाओं में विविध आवाज़ के नमूनों पर प्रशिक्षित है जिससे उच्च सटीकता और परिवेशीय शोर के खिलाफ मजबूती सुनिश्चित होती है बेंचमार्क के खिलाफ निरंतर परीक्षण डेटा गुणवत्ता को बनाए रखने में मदद करता है
यदि एपीआई एक त्रुटि या खाली परिणाम लौटाता है तो ऑडियो फ़ाइल के फ़ॉर्मेट, आकार और लंबाई की जांच करें सुनिश्चित करें कि इनपुट निर्दिष्ट आवश्यकताओं को पूरा करता है अपने एप्लेशन में त्रुटि प्रबंधन लागू करें ताकि इन परिस्थितियों को सुचारू रूप से संभाला जा सके
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
7,535ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
656ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
0ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,948ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,124ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,293ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
0ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
0ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
5,980ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,955ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
0ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
8,184ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,630ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
23ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,847ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,720ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,373ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,815ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,371ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
9,187ms