文本净化 API API ID: 4949

文本净化API通过去除广告和无关内容从网页中提取干净文本,便于自动阅读和处理
通过 MCP 从您的 AI 代理使用此 API
支持 OpenClaw、Claude Code/Desktop、Cursor、Windsurf、Cline 以及任何兼容 MCP 的 AI 客户端。
文档和设置
通过封装此 MCP 创建技能: https://mcp.zylalabs.com/mcp?apikey=YOUR_ZYLA_API_KEY

关于API:  

文本净化API旨在改变您与网页内容的互动方式,提供一种强大而高效的解决方案,用于从文章和网页中提取相关文本。在信息泛滥的世界中,该API成为寻求获取干净、有意义数据的用户的必备工具,能够去除广告、菜单和其他不需要的元素。
文本净化API是一项基于云的服务,允许用户以高精度提取网页文章的核心内容。该API非常适合需要收集和分析新闻、博客、研究等内容的应用程序。它使用先进的自然语言处理(NLP)和机器学习技术来识别和提取相关文本,确保只向用户提供有价值的信息。该API配备了复杂的算法,可以识别和提取网页的主体文本。这包括识别文章的主要文本,并自动排除广告、菜单、侧边栏和其他非必要元素。

它可以处理各种网页格式和布局样式,确保无论网站设计如何,内容提取都有效。该API旨在处理不同语言的内容,使其在全球应用中具有多样性。提供简单且文档齐全的应用程序编程接口(API),便于与现有应用程序和工作流程集成。该API提供快速响应,这对实时应用程序和大规模数据分析至关重要。这确保了流畅和高效的用户体验。

 

此API接收什么以及您的API提供什么(输入/输出)?

文本净化API接收一个URL和可选设置,并提供文章的干净文本,排除广告,以及诸如标题和作者等元数据。

 

此API最常见的使用案例是什么?

  1. 使用该API从多个新闻来源提取文章的主要文本,并在统一平台上呈现,通过避免广告和无关内容优化用户体验。

    便利从学术和研究文章中收集信息,允许研究人员提取进行分析和审核所需的基本内容,而不受到广告的干扰。

    创建应用程序,通过仅提取主要、相关内容生成网页文章的简明摘要,为用户提供更易消化的长文本版本。

    使内容策展人能够提取和呈现文章和出版物中最相关的文本,确保其观众获得高质量的信息,而不受干扰。

    从在线评论和文章中提取相关内容以执行情感分析,帮助公司更好地理解公众对其产品或服务的看法。

     

您的计划是否有任何限制?

基础计划:每分钟50个请求。

专业计划:每分钟100个请求。

专业PLUS计划:每分钟240个请求。

高级计划:每分钟360个请求。

API 文档

端点


要使用此端点,请提供要提取其主要内容的文章的URL,清除广告和不相关的元素。

 

word_per_minute(可选):该参数会影响“阅读时间”的计算。默认设置为每分钟300个单词。根据需要调整此值以匹配您期望的阅读速度估算

desc_truncate_len(可选):控制生成描述的最大长度。默认值为210个字符。如果提取的描述超过此限制,它将被截断以确保简洁

desc_len_min(可选):设置描述的最小字符数要求。默认值为180个字符。如果提取的描述低于此阈值,API将返回“null”

content_len_min(可选):定义提取内容的最小字符数要求。默认值为200个字符。如果内容低于此最小值,API将返回“null”



                                                                            
GET https://pr140-testing.zylalabs.com/api/4949/text+purify+api/6229/article+extract
                                                                            
                                                                        

错误 - 端点功能

对象 描述
url [必需]
word_per_minute 可选
desc_truncate_len 可选
desc_len_min 可选
content_len_min 可选
测试端点

API 示例响应

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"error":0,"message":"Article extraction success","data":{"url":"https://ellzey.house.gov/2024/10/congressman-jake-ellzey-s-statement-on-fema-aid","title":"Congressman Jake Ellzey's Statement on FEMA Aid","description":"The Department of Homeland Security, under Secretary Mayorkas, has taken actions that make illegal immigration more attractive by reallocating funds that should be prioritized for disaster relief efforts. At...","links":["https://ellzey.house.gov/2024/10/congressman-jake-ellzey-s-statement-on-fema-aid"],"image":"https://ellzey.house.gov/vendor/_accounts/jakeellzey/_skins/062422/images/social_card.png","content":"<div>\n<article>\n<a></a>\n<div><p>The Department of Homeland Security, under Secretary Mayorkas, has taken actions that make illegal immigration more attractive by reallocating funds that should be prioritized for disaster relief efforts. At a time when FEMA is warning that they do not have enough funding to cover the rest of the hurricane season, money has been funneled into programs that provide aid to noncitizen migrants.</p>\r\n<p>Over $1 billion has been directed to programs like the Shelter and Services Program (SSP) and the Emergency Food and Shelter Program, which have been repurposed to support illegal immigrants. With 150,000 households already relying on FEMA aid after devastating hurricanes, this is a gross misallocation of resources.</p>\r\n<p>The current Administration needs to stop diverting taxpayer money to initiatives that encourage illegal immigration and instead focus on supporting the American people and their immediate needs during natural disasters.</p>\r\n<p>Here is what we know: </p>\r\n<ul>\r\n<li>Homeland Security Secretary Alejandro Mayorkas said Federal Emergency Management Agency (FEMA) can meet immediate needs but does not have enough funds for the rest of Hurricane season.</li>\r\n<ul>\r\n<li>Congress recently granted $20 Billion for FEMA’s disaster relief fund as part of the September continuing resolution.</li>\r\n<li>The Biden Administration has granted North Carolina additional aid in the recovery effort with a 100 percent federal cost share for debris removal and emergency protective measures for six months.</li>\r\n<li>150,000 households have registered for FEMA aid.</li>\r\n</ul>\r\n<li>The Shelter and Services Program (SSP) administered by FEMA provides financial support to non-federal agencies to provide humanitarian services to “noncitizen migrants.”</li>\r\n<ul>\r\n<li>FEMA, on their website, said they have funneled at least $1 billion into the program between FY23 and FY24.</li>\r\n<li>New York City’s Department of Homeless Services has given $4,000 in grants to 150 families to help illegal immigrants settle into permanent homes.</li>\r\n<li>The Emergency Food and Shelter Program, also under FEMA, was repurposed into a fund for Illegal immigrants. Many of these funds went to Catholic Charities on the border, totaling $13,937,331 in 2023.</li>\r\n</ul>\r\n</ul>\r\n<ul>\r\n<li>Secretary Mayorkas’ response is that SSP is a separate appropriated account from disaster relief and is not associated with those funding streams.</li>\r\n<ul>\r\n<li>On FEMA’s website, they claim, “No money is being diverted from disaster response needs. FEMA’s disaster response efforts and individual assistance are funded through the Disaster Relief Fund, which is a dedicated fund for disaster efforts. Disaster Relief Fund money has not been diverted to other, non-disaster related efforts.”</li>\r\n<li>The December 2022 consolidated funding bill authorizing the split-off program for spending on migrants vaguely described the purpose as for “providing shelter and other services to families and individuals encountered by the Department of Homeland Security.”</li>\r\n</ul>\r\n</ul>\n<p>######</p></div>\n</article>\n</div>","author":"@RepEllzey","favicon":"https://ellzey.house.gov/vendor/_accounts/jakeellzey/_skins/062422/images/favicon.ico","source":"ellzey.house.gov","published":"2024-10-07T04:00:00Z","ttr":86,"type":"article"}}
                                                                                                                                                                                                                    
                                                                                                    

错误 - 代码片段


curl --location --request GET 'https://zylalabs.com/api/4949/text+purify+api/6229/article+extract?url=https://css-tricks.com/empathetic-animation/&word_per_minute=300&desc_truncate_len=210&desc_len_min=180&content_len_min=200' --header 'Authorization: Bearer YOUR_API_KEY' 


    

要使用此端点,它提供了文章的URL,通过代理提取其主要内容,从而方便提取具有访问限制的网站。

此额外的端点对于从基于用户地理位置或会话限制访问的网站提取文章非常有帮助。

当您调用此端点时,提取引擎将从我们的代理池中随机选择一个代理,然后尝试通过所选代理加载目标网页。

由于代理服务器的特性,加载时间可能会因所选代理的位置和性能而有所不同。

 



                                                                            
GET https://pr140-testing.zylalabs.com/api/4949/text+purify+api/6230/article+proxy+extract
                                                                            
                                                                        

文章代理提取 - 端点功能

对象 描述
url [必需]
word_per_minute 可选
desc_truncate_len 可选
desc_len_min 可选
content_len_min 可选
测试端点

API 示例响应

       
                                                                                                        
                                                                                                                                                                                                                                                                                                                                        {"error":0,"message":"Article extraction success","data":{"url":"https://cryptobriefing.com/fidelity-ethereum-etf-dtcc-listing/","title":"Fidelity's Ethereum spot ETF listed on DTCC under ticker $FETH","description":"Fidelity's spot Ethereum fund is now listed on DTCC under ticker $FETH following SEC's approval of multiple Ethereum ETFs.","links":["https://cryptobriefing.com/fidelity-ethereum-etf-dtcc-listing/"],"image":"https://static.cryptobriefing.com/wp-content/uploads/2024/05/29232455/img-HBnmOBf0yYWOnnbZiut1I8BO-800x457.jpg","content":"<div>\n            <section>\n            <h2>SEC's approval process for Ethereum ETFs underway, trading awaits S-1 filings.</h2>\n        </section>\n            <section>\n            <picture>\n                <source media=\"(min-width: 850px)\" srcset=\"https://static.cryptobriefing.com/wp-content/uploads/2024/05/29232455/img-HBnmOBf0yYWOnnbZiut1I8BO-800x457.jpg\"></source>\n                <img src=\"https://static.cryptobriefing.com/wp-content/uploads/2024/05/29232455/img-HBnmOBf0yYWOnnbZiut1I8BO-400x228.jpg\" alt=\"Fidelity's spot Ethereum ETF listed on DTCC under ticker $FETH\" title=\"Fidelity’s spot Ethereum ETF listed on DTCC under ticker $FETH\" />\n            </picture>\n        </section>\n    <section>\n        <p>Fidelity’s Ethereum spot ETF has been listed on the Depository Trust and Clearing Corporation (DTCC) under the ticker symbol $FETH. This development comes on the heels of the US Securities and Exchange Commission’s (SEC) <a href=\"https://cryptobriefing.com/sec-ethereum-etf-approval/\" target=\"_blank\">approval of spot Ethereum exchange-traded funds</a> (ETFs) on May 23.</p><figure><img src=\"https://static.cryptobriefing.com/wp-content/uploads/2024/05/29225708/Fidelity-Ethereum-ETF-on-DTCC.jpg\" /><figcaption>Fidelity’s Ethereum spot ETF is now listed on <a href=\"https://www.dtcc.com/products/cs/exchange_traded_funds_plain_new.php\" target=\"_blank\">DTCC</a></figcaption></figure><p>BlackRock’s Ethereum fund, iShares Ethereum Trust, is listed on the DTCC <a href=\"https://cryptobriefing.com/blackrock-ethereum-etf-dtcc/\" target=\"_blank\">under ticker $ETHA</a>. VanEck’s Ethereum ETF is listed <a href=\"https://cryptobriefing.com/vaneck-dtcc-ethereum-etf-listing/\" target=\"_blank\">under ticker $ETHV</a> and Franklin Templeton’s <a href=\"https://cryptobriefing.com/franklin-templeton-ethereum-etf-dtcc-listing/\" target=\"_blank\">under ticker $EZET</a>.</p><p>The SEC’s acceptance of the 19b-4 forms for the spot Ethereum ETFs marks a major step, although the commencement of trading awaits the approval of each ETF’s S-1 filing.</p><p>Discussions between the SEC and ETF issuers about the S-1 forms are reportedly <a href=\"https://cryptobriefing.com/sec-engages-ethereum-etf-issuers-s-1-forms/\" target=\"_blank\">underway</a>. However, the timeframe for the trading approval is uncertain, with projections ranging from weeks to months.</p><p>VanEck was among the first to submit an amended S-1 form on May 23, with BlackRock following suit with an <a href=\"https://cryptobriefing.com/blackrock-ethereum-etf-launch/\" target=\"_blank\">updated S-1 filing</a> today. The S-1 form serves as an initial registration document that must be filed with the SEC before a security can be offered to the public.</p>\n                                </section>\n    <section>\n                    <a href=\"https://cryptobriefing.com/disclaimer/\" target=\"_blank\">\n                Disclaimer            </a>\n    </section>\n</div>","author":"@crypto_briefing","favicon":"https://static.cryptobriefing.com/wp-content/uploads/2020/02/02093517/ios-144.png","source":"cryptobriefing.com","published":"2024-05-30T17:14:47+00:00","ttr":40,"type":"article"}}
                                                                                                                                                                                                                    
                                                                                                    

文章代理提取 - 代码片段


curl --location --request GET 'https://zylalabs.com/api/4949/text+purify+api/6230/article+proxy+extract?url=https://cryptobriefing.com/fidelity-ethereum-etf-dtcc-listing/&word_per_minute=300&desc_truncate_len=210&desc_len_min=180&content_len_min=200' --header 'Authorization: Bearer YOUR_API_KEY' 


    

API 访问密钥和身份验证

注册后,每个开发者都会被分配一个个人 API 访问密钥,这是一个唯一的字母和数字组合,用于访问我们的 API 端点。要使用 文本净化 API 进行身份验证,只需在 Authorization 标头中包含您的 bearer token。
标头
标头 描述
授权 [必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。

简单透明的定价

无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。

🚀 企业版

起价
$ 10,000/年


  • 自定义数量
  • 自定义速率限制
  • 专业客户支持
  • 实时 API 监控

客户喜爱的功能

  • ✔︎ 仅支付成功请求
  • ✔︎ 7 天免费试用
  • ✔︎ 多语言支持
  • ✔︎ 一个 API 密钥,所有 API。
  • ✔︎ 直观的仪表板
  • ✔︎ 全面的错误处理
  • ✔︎ 开发者友好的文档
  • ✔︎ Postman 集成
  • ✔︎ 安全的 HTTPS 连接
  • ✔︎ 可靠的正常运行时间

文本净化 API FAQs

通过提供一个网址使用API以提取文章的主要内容 设置可选参数以自定义提取和格式化

文本净化API清理并提取网页中的相关文本,去除广告和不需要的内容,仅提供文章的主要文本

有不同的计划适合每个人,包括针对少量请求的免费试用,但其速率受到限制以防止滥用服务

Zyla提供了几乎所有编程语言的广泛集成方法。您可以根据需要使用这些代码与您的项目集成

该API返回有关域名的年龄和历史的详细信息,包括自创建以来的年、月和天,以及过期和更新时间。

GET文章提取端点返回文章的主要内容,包括标题、描述、内容和像URL和图片这样的元数据 GET文章代理提取端点提供类似的数据,但通过代理访问受限网站

响应中的关键字段包括“url”(文章链接) “title”(文章标题) “description”(简要摘要) “content”(主要文本)和“image”(相关图片URL)

响应数据以JSON格式构建,其中包含一个"error"字段指示成功或失败,一个"message"字段用于状态更新,以及一个"data"对象包含提取的文章详细信息

参数包括“每分钟字数”用于阅读速度,“描述截断长度”用于最大描述长度,“描述长度最小值”用于最小描述长度,以及“内容长度最小值”用于最小内容长度

用户可以通过调整可选参数来定制请求,以控制阅读速度、描述长度和内容长度,从而根据特定需求提供量身定制的输出

每个端点提供主要文章文本、标题、描述、图片和链接,使用户能够访问没有广告或不相关元素的综合内容

数据准确性通过先进的自然语言处理和机器学习技术得以保持,这些技术能够识别和提取相关内容,同时过滤掉广告和非必要元素

典型的使用案例包括内容策展 学术研究 情感分析 和创建文章摘要 使用户能够专注于重要信息而不受干扰

一般常见问题

Zyla API Hub 就像一个大型 API 商店,您可以在一个地方找到数千个 API。我们还为所有 API 提供专门支持和实时监控。注册后,您可以选择要使用的 API。请记住,每个 API 都需要自己的订阅。但如果您订阅多个 API,您将为所有这些 API 使用相同的密钥,使事情变得更简单。
价格以 USD(美元)、EUR(欧元)、CAD(加元)、AUD(澳元)和 GBP(英镑)列出。我们接受所有主要的借记卡和信用卡。我们的支付系统使用最新的安全技术,由 Stripe 提供支持,Stripe 是世界上最可靠的支付公司之一。如果您在使用卡片付款时遇到任何问题,请通过 [email protected]

此外,如果您已经以这些货币中的任何一种(USD、EUR、CAD、AUD、GBP)拥有有效订阅,该货币将保留用于后续订阅。只要您没有任何有效订阅,您可以随时更改货币。
定价页面上显示的本地货币基于您 IP 地址的国家/地区,仅供参考。实际价格以 USD(美元)为单位。当您付款时,即使您在我们的网站上看到以本地货币显示的等值金额,您的卡片对账单上也会以美元显示费用。这意味着您不能直接使用本地货币付款。
有时,银行可能会因其欺诈保护设置而拒绝收费。我们建议您首先联系您的银行,检查他们是否阻止了我们的收费。此外,您可以访问账单门户并更改关联的卡片以进行付款。如果这些方法不起作用并且您需要进一步帮助,请通过 [email protected]
价格由月度或年度订阅决定,具体取决于所选计划。
API 调用根据成功请求从您的计划中扣除。每个计划都包含您每月可以进行的特定数量的调用。只有成功的调用(由状态 200 响应指示)才会计入您的总数。这确保失败或不完整的请求不会影响您的月度配额。
Zyla API Hub 采用月度订阅系统。您的计费周期将从您购买付费计划的那一天开始,并在下个月的同一日期续订。因此,如果您想避免未来的费用,请提前取消订阅。
要升级您当前的订阅计划,只需转到 API 的定价页面并选择您要升级到的计划。升级将立即生效,让您立即享受新计划的功能。请注意,您之前计划中的任何剩余调用都不会转移到新计划,因此在升级时请注意这一点。您将被收取新计划的全部金额。
要检查您本月剩余多少 API 调用,请参考响应标头中的 "X-Zyla-API-Calls-Monthly-Remaining" 字段。例如,如果您的计划允许每月 1,000 个请求,而您已使用 100 个,则响应标头中的此字段将显示 900 个剩余调用。
要查看您的计划允许的最大 API 请求数,请检查 "X-Zyla-RateLimit-Limit" 响应标头。例如,如果您的计划包括每月 1,000 个请求,此标头将显示 1,000。
"X-Zyla-RateLimit-Reset" 标头显示您的速率限制重置之前的秒数。这告诉您何时您的请求计数将重新开始。例如,如果它显示 3,600,则意味着还有 3,600 秒直到限制重置。
是的,您可以随时通过访问您的账户并在账单页面上选择取消选项来取消您的计划。请注意,升级、降级和取消会立即生效。此外,取消后,您将不再有权访问该服务,即使您的配额中还有剩余调用。
为了让您有机会在没有任何承诺的情况下体验我们的 API,我们提供 7 天免费试用,允许您免费进行最多 50 次 API 调用。此试用只能使用一次,因此我们建议将其应用于您最感兴趣的 API。虽然我们的大多数 API 都提供免费试用,但有些可能不提供。试用在 7 天后或您进行了 50 次请求后结束,以先发生者为准。如果您在试用期间达到 50 次请求限制,您需要"开始您的付费计划"以继续发出请求。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。或者,如果您在第 7 天之前不取消订阅,您的免费试用将结束,您的计划将自动计费,授予您访问计划中指定的所有 API 调用的权限。请记住这一点以避免不必要的费用。
7 天后,您将被收取试用期间订阅的计划的全额费用。因此,在试用期结束前取消很重要。因忘记及时取消而提出的退款请求不被接受。
当您订阅 API 免费试用时,您可以进行最多 50 次 API 调用。如果您希望超出此限制进行额外的 API 调用,API 将提示您执行"开始您的付费计划"。您可以在个人资料中的订阅 -> 选择您订阅的 API -> 定价标签下找到"开始您的付费计划"按钮。
付款订单在每月 20 日至 30 日之间处理。如果您在 20 日之前提交请求,您的付款将在此时间范围内处理。
您可以通过我们的聊天渠道联系我们以获得即时帮助。我们始终在线,时间为上午 8 点至下午 5 点(EST)。如果您在该时间之后联系我们,我们将尽快回复您。此外,您可以通过 [email protected]

相关 API


您可能还喜欢