语音分析API准确地将音频转换为文本,提供无缝集成于各种应用程序中。它利用先进的语音识别和人工智能技术,为各个行业和使用案例提供精确的转录。无论是处理实时语音还是预录音频文件,该API都确保可靠且错误最小化的转换
该API的一个突出特性是其多语言支持,能够以多种语言进行高精度转录。这使其成为需要在不同语言环境下进行转录的用户的重要工具
要使用此端点,您必须在参数中指明音频的 URL
获取文本 - 端点功能
| 对象 | 描述 |
|---|---|
url |
[必需] Indicates a URL |
{"success":true,"audio_file":"https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3","output":{"text":"Oggi che il sole.","result":{"text":"Oggi che il sole.","word_count":4,"vtt":"WEBVTT\n\n00.000 --> 01.120\nOggi che il sole.","words":[{"word":"Oggi","start":0,"end":0.3400000035762787},{"word":"che","start":0.3400000035762787,"end":0.5400000214576721},{"word":"il","start":0.5400000214576721,"end":0.7200000286102295},{"word":"sole.","start":0.7200000286102295,"end":1.1200000047683716}]}}}
curl --location --request POST 'https://zylalabs.com/api/6371/speech+analysis+api/9136/obtain+text?url=https://s19.aconvert.com/convert/p3r68-cdx67/c2iut-davq3.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| 标头 | 描述 |
|---|---|
授权
|
[必需] 应为 Bearer access_key. 订阅后,请查看上方的"您的 API 访问密钥"。 |
无长期承诺。随时升级、降级或取消。 免费试用包括最多 50 个请求。
语音分析API从音频输入中返回转录文本。输出包括以文本格式识别的语音,可以用于字幕、文档或分析等各种应用
响应数据中的关键字段通常包括“转录”表示转换后的文本 “语言”指示检测到的语言和“置信度”反映转录的准确性
POST获取文本端点的主要参数是“audio_url”,它指定要转录的音频文件的URL。附加参数可能包括“language”,用于指定所需的转录语言
响应数据以JSON格式组织,包括键值对。主要结构包含用于转录、语言和置信分数的字段,便于解析和集成到应用程序中
典型的使用案例包括为视频生成字幕、为会议或采访创建记录、增强听障用户的无障碍性,以及分析口语内容以获取各个行业的见解
通过先进的语音识别算法和对多样化数据集的持续训练来保持数据的准确性 该API还采用质量检查以最小化错误并提高转录的可靠性
用户可以通过指定“语言”参数来定制他们的请求,以针对特定的转录语言。这允许根据音频内容的语言上下文提供定制的输出
标准数据模式包括连贯的句子,具有正确的标点符号和大写字母。用户可以根据音频质量、说话者口音和背景噪音水平预期准确性的变化
服务级别:
100%
响应时间:
620ms
服务级别:
100%
响应时间:
327ms
服务级别:
100%
响应时间:
2,147ms
服务级别:
100%
响应时间:
295ms
服务级别:
100%
响应时间:
13ms
服务级别:
100%
响应时间:
1,771ms
服务级别:
100%
响应时间:
828ms
服务级别:
100%
响应时间:
14ms
服务级别:
100%
响应时间:
46ms
服务级别:
100%
响应时间:
220ms