एचटीएमएल कोड एक्सट्रैक्शन एपीआई डेवलपर्स को किसी भी वेबपेज के कच्चे एचटीएमएल को प्राप्त और प्रोसेस करने का एक सरल लेकिन शक्तिशाली तरीका प्रदान करता है स्क्रैपर्स को मैन्युअली सेट करने, यूजर एजेंट संभालने या ब्लॉकिंग के बारे में चिंता करने के बजाय यह एपीआई साफ और सुसंगत एचटीएमएल डेटा प्रदान करता है जिसे आपके अनुप्रयोगों में सीधे इंटीग्रेट किया जा सकता है
इस एपीआई के साथ, आप:
किसी भी सार्वजनिक रूप से सुलभ यूआरएल से पूरा एचटीएमएल स्रोत कोड प्राप्त करें
डेटा पाइपलाइनों, क्रॉलर्स और सामग्री विश्लेषक को अतिरिक्त सेटअप के बिना पावर करें
निकाले गए एचटीएमएल का उपयोग वेब स्क्रैपर्स, सर्च इंजन्स, एसईओ टूल या एआई-चालित विश्लेषण बनाने के लिए आधार के रूप में करें
मेटाडेटा एक्सट्रैक्शन, डोम पार्सिंग और संरचित सामग्री जनरेशन जैसे वर्कफ़्लो को स्वचालित करें
चाहे आप डेटा खनन, वेबसाइटों की निगरानी या एसईओ टूल को बढ़ाने पर काम कर रहे हों एचटीएमएल एक्स्ट्रैक्शन एपीआई एचटीटीपी अनुरोधों, हैडर और साइट फ़ेचिंग का सारा भारी काम संभालकर समय बचाता है यह तेज, विश्वसनीय है और आपकी जरूरतों के साथ स्केल करने के लिए डिजाइन किया गया है
उपयोगकर्ताओं को एक यूआरएल इनपुट करने और फॉर्मेटेड एचटीएमएल कोड तथा अतिरिक्त मेटा डेटा निकालने की अनुमति देता है
एचटीएमएल निकालें - एंडपॉइंट फीचर्स
| ऑब्जेक्ट | विवरण |
|---|---|
url |
[आवश्यक] The URL of the page you want to extract the HTML code from. |
{"link_count":1,"image_count":0,"heading_tag_count":{"h1":1,"h2":0,"h3":0,"h4":0,"h5":0,"h6":0},"p_count":2,"character_encoding":"utf-8","page_language":null,"total_size_kb":1.25,"character_count":1283,"word_count":127,"line_count":54,"title":"Example Domain","description":null,"keywords":null,"final_url":"https://www.example.com/","status_code":200,"headers":{"headers":{"date":"Fri, 05 Sep 2025 14:58:16 GMT","content-length":"648","vary":"Accept-Encoding","content-encoding":"gzip","last-modified":"Mon, 13 Jan 2025 20:11:20 GMT","content-range":"bytes 0-647/648","content-type":"text/html","etag":"\"84238dfc8092e5d9c0dac8ef93371a07:1736799080.121134\"","connection":"keep-alive","accept-ranges":"bytes","cache-control":"max-age=86000","alt-svc":"h3=\":443\"; ma=93600,h3-29=\":443\"; ma=93600","x-status-normalized":"206->200"}},"html_code":"<html>"}
curl --location --request GET 'https://zylalabs.com/api/10189/html+code+extractor+api/19560/extract+html?url=https://forkthis.io/' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
HTML निष्कर्षण एपीआई किसी भी सार्वजनिक रूप से सुलभ वेबपृष्ठ का कच्चा HTML स्रोत कोड एकल एपीआई कॉल के साथ प्राप्त करता है
आपको बस एक मान्य यूआरएल प्रदान करने की आवश्यकता है एपीआई पृष्ठ का एचटीएमएल लाएगा और वापस करेगा
API एक JSON प्रतिक्रिया लौटाता है जिसमें पूर्ण HTML सामग्री एक स्ट्रिंग के रूप में होती है अतिरिक्त डेटा जैसे लिंक_गिनती इमेज_गिनती हेडिंग_टैग_गिनती p_गिनती कैरेक्टर_एनकोडिंग पृष्ठ_भाषा कुल_आकार_kb कैरेक्टर_गिनती शब्द_गिनती पंक्ति_गिनती शीर्षक विवरण कीवर्ड अंतिम_यूआरएल स्थिति कोड और हेडर शामिल हैं
एपीआई संरचित एचटीएमएल लौटाता है जिसे ब्यूटीफुलसूप लाइब्रेरी के माध्यम से पार्स किया जाता है
बिल्कुल यह HTML से मेटाडेटा हेडिंग्स टैग्स और ऑन-पेज SEO तत्वों का विश्लेषण करने के लिए इस्तेमाल किया जा सकता है
वर्तमान संस्करण प्रति अनुरोध एक पृष्ठ निकालता है लेकिन आप अपनी एप्लिकेशन में कई URL को संभालने के लिए अनुरोधों को बैच कर सकते हैं
एपीआई को गति के लिए अनुकूलित किया गया है आमतौर पर इसे साइट की जटिलता और लोड समय के आधार पर मिलीसेकंड में प्रतिक्रिया मिलती है
वेब स्क्रैपिंग और डेटा संग्रहण एसईओ ऑडिटिंग और मेटाडेटा विश्लेषण सामग्री निगरानी और संग्रहण शोध और मशीन लर्निंग डेटा सेट खोज या क्रॉलर उपकरण बनाना
हाँ, एपीआई रीडायरेक्ट (301/302) का पालन करता है और अंतिम गंतव्य पृष्ठ का एचटीएमएल लौटाता है
एपीआई केवल सार्वजनिक रूप से उपलब्ध डेटा लाता है उपयोगकर्ता लक्ष्य वेबसाइट की सेवा की शर्तों और robots.txt का पालन करने के लिए जिम्मेदार हैं
एक्सट्रैक्ट एचटीएमएल एंडपॉइंट एक JSON ऑब्जेक्ट लौटाता है जिसमें अनुरोधित वेबपेज का पूरा एचटीएमएल कोड होता है साथ ही मेटाडेटा जैसे लिंक की संख्या इमेज की संख्या हेडिंग टैग्स कैरेक्टर एन्कोडिंग और अधिक
मुख्य क्षेत्रों में `link_count`, `image_count`, `heading_tag_count`, `title`, `description`, `final_url`, `status_code`, और `html_code` शामिल हैं ये पृष्ठ की संरचना और सामग्री के बारे में अंतर्दृष्टि प्रदान करते हैं
उत्तर को नेस्टेड फ़ील्ड्स के साथ एक JSON ऑब्जेक्ट के रूप में संरचित किया गया है मुख्य विशेषताओं में HTML सामग्री और मेटाडेटा शामिल हैं जो `title` और `link_count` जैसे विशिष्ट डेटा प्रोफाइल तक पहुँच की अनुमति देते हैं
यह एन्डपॉइंट वेबपेज की संरचना के बारे में जानकारी प्रदान करता है जिसमें लिंक, छवियों, शीर्षकों और अनुच्छेदों की गिनती शामिल है इसके साथ ही HTML सामग्री स्वयं और HTTP प्रतिक्रिया की जानकारी भी शामिल है
उपयोगकर्ता विभिन्न पृष्ठों से HTML निकालने के लिए विभिन्न URL निर्दिष्ट करके अनुरोधों को अनुकूलित कर सकते हैं API स्वचालित रूप से प्रदान किए गए URL को लाने और पार्स करने का प्रबंधन करता है
उदाहरण के लिए, `link_count` पृष्ठ पर हाइपरलिंक की संख्या को इंगित करता है, जबकि `heading_tag_count` विभिन्न शीर्षक स्तरों (h1, h2, आदि) का विवरण प्रदान करता है, जिससे उपयोगकर्ताओं को पृष्ठ की सामग्री की पदानुक्रम को समझने में मदद मिलती है
API निर्दिष्ट URLs से सीधे लाइव डेटा लाता है यह सुनिश्चित करते हुए कि HTML और मेटाडेटा वेबपेज की वर्तमान स्थिति को दर्शाते हैं साइट की उपलब्धता के अधीन
विशिष्ट उपयोग के मामलों में डेटा विश्लेषण के लिए वेब स्क्रैपिंग SEO ऑडिट्स जो ऑन-पेज तत्वों का मूल्यांकन करने के लिए हैं परिवर्तन के लिए सामग्री मॉनिटरिंग और खोज इंजनों या क्रॉलर्स के लिए उपकरण बनाना शामिल है
विशिष्ट उपयोग के मामलों में डेटा विश्लेषण के लिए वेब स्क्रैपिंग सामग्री अनुकूलन के लिए एसईओ ऑडिट और उन क्रॉलर या सर्च इंजन का निर्माण करना शामिल है जिन्हें प्रसंस्करण के लिए संरचित एचटीएमएल डेटा की आवश्यकता होती है
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
137ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
74ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
54ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
81ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,463ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
241ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
127ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
196ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
87ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
82ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,005ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,132ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
4,967ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
8,868ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
365ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,075ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,896ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,245ms
सर्विस लेवल:
75%
रिस्पॉन्स टाइम:
1,498ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,812ms