वॉइस टू टेक्स्ट API API ID: 4919

वॉइस टू टेक्स्ट एपीआई बोली गई भाषा को सटीकता से लिखित पाठ में परिवर्तित करता है वास्तविक समय में ट्रांसक्रिप्शन प्रदान करता है और विभिन्न एप्लिकेशनों के लिए वॉयस कमांड सुविधाओं को सक्षम बनाता है

इस API को अपने AI एजेंट से MCP के माध्यम से उपयोग करें

OpenClaw, Claude Code/Desktop, Cursor, Windsurf, Cline और किसी भी MCP-संगत AI क्लाइंट के साथ काम करता है।

डॉक्स और सेटअप

इस MCP को रैप करके एक स्किल बनाएं: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

एपीआई के बारे में:

वॉयस टू टेक्स्ट एपीआई एक उन्नत तकनीकी समाधान है जिसे बोले गए भाषा को लिखित पाठ में सहजता से परिवर्तित करने के लिए डिज़ाइन किया गया है। यह एपीआई भाषण की व्याख्या करने और सटीक पाठ प्रतिनिधित्व उत्पन्न करने में उत्कृष्ट है, जिसमें न्यूरल नेटवर्क और व्यापक डेटा सेट का उपयोग किया जाता है, जिससे यह कई भाषाओं, उच्चारणों और बोलियों का ट्रांसक्राइब कर सकता है।

स्केलेबिलिटी को ध्यान में रखते हुए निर्मित, यह एपीआई संक्षिप्त आवाज कमांड से लेकर लंबे संवाद तक की भिन्न मात्रा के भाषण डेटा को कुशलतापूर्वक प्रबंधित करता है। इसकी लचीलापन व्यक्तिगत अनुरोधों और बड़े पैमाने पर कार्यान्वयन दोनों का समर्थन करता है, जिससे यह विभिन्न अनुप्रयोगों के लिए एक बहुपरकारी उपकरण बनता है।

संक्षेप में, वॉयस टू टेक्स्ट एपीआई प्राकृतिक भाषा प्रोसेसिंग और भाषण पहचान में एक महत्वपूर्ण प्रगति दिखाता है। आधुनिक तकनीक को उपयोगकर्ता की आवश्यकताओं पर ध्यान केंद्रित करते हुए मिलाकर, यह भाषण को पाठ में परिवर्तित करने के लिए एक मजबूत समाधान प्रस्तुत करता है। इसकी सटीकता, अनुकूलता, और व्यापक अनुप्रयोगिता इसे दैनिक संचार से लेकर विशेष उद्योग कार्यों तक के लिए एक मूल्यवान संपत्ति बनाती है।

यह एपीआई क्या प्राप्त करता है और आपकी एपीआई क्या प्रदान करती है (इनपुट/आउटपुट)?

एपीआई एक ऑडियो फ़ाइल प्राप्त करती है और एक पाठ लौटाती है।

इस एपीआई के सबसे सामान्य उपयोग के मामले क्या हैं?

वॉइस असिस्टेंट: वर्चुअल असिस्टेंट जैसे सिरी, अलेक्सा, और गूगल असिस्टेंट की कार्यक्षमता को बढ़ाना, ताकि वे उपयोगकर्ता के आदेशों और प्रश्नों को प्राकृतिक भाषा में समझ सकें और प्रक्रिया कर सकें।

ट्रांसक्रिप्शन सेवाएँ: बैठकों, साक्षात्कारों और व्याख्यानों से ऑडियो को स्वचालित रूप से पाठ में परिवर्तित करना, दस्तावेजीकरण और रिकॉर्ड-कीपिंग के उद्देश्यों के लिए।

ग्राहक सेवा: ग्राहकों और सेवा एजेंटों के बीच भाषण इंटरैक्शन का ट्रांसक्रिप्शन करके ग्राहक सहायता में सुधार करना, जिसके माध्यम से बेहतर विश्लेषण और फॉलो-अप संभव हो सके।

भाषण विश्लेषण: कॉल सेंटरों में या मार्केटिंग अभियानों के दौरान ग्राहक की भावना, व्यवहार पैटर्न, और संलग्नता के स्तर के लिए बोली जाने वाली इंटरैक्शनों का विश्लेषण करना।

भाषा सीखना: भाषा शिक्षार्थियों का समर्थन करना, बोली गई अभ्यास सत्रों का ट्रांसक्रिप्शन करके और उच्चारण और प्रवाह पर फीडबैक प्रदान करना।

सामग्री निर्माण: सामग्री निर्माताओं और पत्रकारों की सहायता करना, साक्षात्कारों, पोडकास्ट, या भाषणों का ट्रांसक्रिप्शन करके, जिसे फिर लेख, ब्लॉग, या अन्य लिखित सामग्री के लिए उपयोग किया जा सकता है।

क्या आपकी योजना में कोई सीमाएँ हैं?

एपीआई कॉल की संख्या के अलावा, कोई अन्य सीमा नहीं है।

API डॉक्यूमेंटेशन

एंडपॉइंट्स

पाठ प्राप्त करें Endpoint ID: 6191

इस अंत बिंदु का उपयोग करने के लिए आपको ऑडियो पाठ प्राप्त करने के लिए एक MP3 फ़ाइल निर्दिष्ट करनी होगी

                                                                            
POST https://pr140-testing.zylalabs.com/api/4919/voice+to+text+api/6191/get+text

पाठ प्राप्त करें - एंडपॉइंट फीचर्स

ऑब्जेक्ट	विवरण
`रिक्वेस्ट बॉडी`	[आवश्यक] फाइल बाइनरी

एंडपॉइंट टेस्ट करें

API उदाहरण प्रतिक्रिया

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {
  "text": "Hola a todos, espero que se encuentren bien."
}

पाठ प्राप्त करें - कोड स्निपेट्स


    curl --location 'https://zylalabs.com/api/4919/voice+to+text+api/6191/get+text' \
    --header 'Content-Type: multipart/form-data' \ 
    --form 'image=@"FILE_PATH"'

API एक्सेस कुंजी और प्रमाणीकरण

साइन अप करने के बाद, प्रत्येक डेवलपर को एक पर्सनल API एक्सेस की असाइन की जाती है, जो अक्षरों और अंकों का एक यूनिक संयोजन होता है, जिसका उपयोग हमारे API एंडपॉइंट तक पहुंचने के लिए किया जाता है। प्रमाणीकरण के लिए वॉइस टू टेक्स्ट API के साथ बस अपने बेयरर टोकन को Authorization हेडर में शामिल करें।

हेडर्स

हेडर	विवरण
`Authorization`	[आवश्यक] होना चाहिए `Bearer access_key`. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें।

प्रश्न

सरल पारदर्शी प्राइसिंग

कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।

मासिक वार्षिक

(वार्षिक बिलिंग के साथ 2 महीने बचाएँ 🎉)