腾讯云:一句话语音识别API接入步骤和说明
语音识别 API 升级到 3.0 版本。全新的 API 接口文档更加规范和全面,统一的参数风格和公共错误码,统一的 SDK/CLI 版本与 API 文档严格一致,给您带来简单快捷的使用体验。支持全地域就近接入让您更快连接腾讯云产品。 相关接口接口名称:SentenceRecognition 接口功能:一句话识别, 对60秒之内的短音频文件进行识别,达到快速准确识别较短语音的效果,可应用于语音消息转写等场景。 接口描述接口请求域名: asr.tencentcloudapi.com 。 本接口用于对60秒之内的短音频文件进行识别,支持本地语音文件上传和语音URL上传两种请求方式。 当音频文件通过请求中body内容上传时,请求大小不能超过600KB;当音频以url方式传输时,音频时长不可超过60s。 所有请求参数放在POST请求的body中,编码类型采用x-www-form-urlencoded,参数进行urlencode编码后传输。 现暂只支持中文普通话和带有一定方言口音的中文普通话识别,支持识别8k16bit和16k16bit的mp3或者wav格式的单声道音频。 默认接口请求频率限制:25次/秒。 输入参数以下请求参数列表仅列出了接口请求参数和部分公共参数,完整公共参数列表见:cloud.tencent.com/document/api/1093/35640 输出参数 示例通过语音URL形式调用接口: 用户通过语音url(http%3A%2F%2Ftest-1256085166.cos.ap-guangzhou.myqcloud.com%2Fcase13.wav)的方式(SourceType为0)请求一句话识别服务,服务的引擎模型为:电话 8k (EngSerViceType = 8k),一句话语音的采样率为8k,声道数为单声道,长度为159768字节。 输入: https://asr.tencentcloudapi.com/?Action=SentenceRecognition &ProjectId=0 &SubServiceType=2 &EngSerViceType=8k &SourceType=0 &Url=http%3A%2F%2Ftest-1256085166.cos.ap-guangzhou.myqcloud.com%2Fcase13.wav &SecretId=111 &Timestamp=111 &VoiceFormat=wav &UsrAudioKey=www &DataLen=159768 &<公共请求参数> 输出: { "Response": { "Result": "张先生,您好。那个为了规范保险从业人员的销售行为,也为了更好的保护您的合法权益。", "RequestId": "8984d9a9-343f-4c67-8fd9-5c79510a12da" } }开发者资源 API Explorer:该工具提供了在线调用、签名验证、SDK 代码生成和快速检索接口等能力,能显著降低使用云 API 的难度,推荐使用:console.cloud.tencent.com/api/explorer?Product=asr&Version=2019-06-14&Action=SentenceRecognition&SignVersion= 命令行工具:cloud.tencent.com/document/product/440/6176 错误码业务逻辑相关 公共错误码:返回结果中如果存在 Error 字段,则表示调用 API 接口失败。 Error 中的 Code 字段表示错误码,所有业务都可能出现的错误码为公共错误码,下表列出了公共错误码。 文章来源腾讯云 ,查看更多相关文档请访问https://cloud.tencent.com/document/product
(编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |