全部产品

语音识别 ASR

语音识别 ASR

提供业界非常具有性价比的语音识别服务,超高识别准确率,适用多场景

专业智能高效的语音处理服务

提供技术支持

语音识别 ASR 简介

腾讯云语音识别(Automatic Speech Recognition,ASR) 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、语音输入法等多个场景。

产品子功能

实时语音识别

对不限时长的实时音频流进行识别,识别结果自动断句,标记每句话的开始和结束时间;可应用于智能语音助手等实时音频流场景。

录音文件识别

对用户上传的五小时之内的录音文件进行识别;可应用于呼叫中心语音质检、视频字幕生成,会议语音资料转写等场景。

一句话识别

对一分钟之内的短音频文件进行识别;可应用于语音输入法、语音消息转文字、语音搜索等场景。

语音流异步识别

对直播协议语音流进行识别,准实时返回识别结果,支持音视频场景专用模型;可用于直播流质检等场景。 

录音文件识别极速版

对用户上传的较大的录音文件进行极速识别,半实时返回识别结果;可应用于音视频字幕、准实时质检分析场景等场景。 

产品优势

价格低

购买预付费包更加优惠,识别1小时语音不到1元。每月赠送免费额度,最大程度降低客户成本。

效果好

字准率97%处于业界领先水平,与微信、王者荣耀的语音转文字使用一套服务,效果一样好。

语种多

已经支持中文普通话、英语、粤语、韩语、日语、泰语和上海话方言的语音识别,后续将陆续开放其他语种和方言的识别能力。 

算法强大

基于创新网络结构 TLC-BLSTM,利用 ATTENTION 机制有效地对语音信号进行建模,通过 Teacher-Student 方式提升系统鲁棒性,对通用以及垂直领域下场景有领先业界的识别精度和效率。 

自助提升准确率

针对垂直领域,上传词表或句子即可完成语言模型的自动优化,借助自训练平台,不懂算法也可轻松实现定制化模型,进一步提升识别准确率。

支持场景丰富

经过内部微信、腾讯视频、王者荣耀等大流量产品的充分验证,在互联网、金融、教育等领域,基于海量数据实现分场景优化,积累了多行业的最佳实践。

应用场景

呼叫中心录音质检

业务痛点

传统质检严重受限于人的工作效率和人力成本,只能抽检不能全检,难以评估客服的真实工作质量。

解决方案

语音识别将电话录音识别为文本,再通过质检规则对文本进行分析,识别不符合规范的服务通话记录。

价值提升

大幅提升呼叫中心工作质量管控能力,完成人力不可能完成的超大规模电话录音质检工作,提升呼叫中心人员的服务质量。

短视频字幕

业务痛点

在拍摄 Vlog 的场景中,用户会边拍视频边说话;拍完视频还需要二次编辑,手动输入字幕才能将视频发布。

解决方案

通过录音文件识别极速版,实现了用户边拍边说,将语音内容直接显示在视频上。

价值提升

大大减少了用户后期处理的成本,使得用户拍摄后即可发布。

视频理解

业务痛点

在直播、音频分享等平台,有海量音视频需要理解,用来做质检审核或者标签推荐,基于人力很难实现。

解决方案

录音文件识别 / 语音流异步识别 / 录音文件识别极速版可将视频中的音频(流)通过音视频专属模型进行转写,可满足多种输入、不同时延的需求。

价值提升

助力快速对平台海量音视频进行理解,极大降低人力成本,快速实现质检审核或精准推荐。

产品动态

2020-01-01
价格变化
实时语音识别与一句话识别产品价格策略变更
2020-02-25
新功能发布
语音识别产品支持通过控制台创建热词
2020-03-16
功能优化
发布语音识别后脏词过滤、语气词过滤和句末标点过滤用户自主选择功能
2020-04-07
新功能发布
录音文件识别产品上线音视频领域模型
2020-04-24
新功能发布
语音识别支持用户自主对识别结果进行数字转换
2020-06-05
新功能发布
实时语音识别支持词时间戳功能
2020-07-02
新功能发布
实时语音识别支持 OPUS 格式
2020-07-28
新功能发布
录音文件识别支持3人及以上多说话人分离
2020-08-04
新功能发布
语音识别产品支持日语
2020-08-21
新功能发布
语音识别产品支持上海话方言
2020-09-07
新功能发布
客户端TRTC接入实时语音识别技术指引上线
2020-09-09
新功能发布
语音识别电话场景支持英语模型
2020-09-16
新功能发布
ASR 支持访问控制
2020-10-10
新功能发布
ASR 接入层支持 websocket 协议
2020-11-27
新功能发布
录音文件识别支持自动说话人分
2020-12-18
新功能发布
录音文件识别支持云函数接入方式
2021-01-15
新功能发布
语音流异步识别上线
2021-01-15
新功能发布
录音文件识别极速版上线
2021-01-21
功能优化
实时语音识别SDK全面支持websocket 协议,了解更多
2021-02-01
新功能发布
实时语音识别、录音文件识别支持教育、医疗、游戏、法庭行业模型
2021-02-01
新功能发布
实时语音识别、录音文件识别支持教育、医疗、游戏、法庭行业模型
2021-01-21
功能优化
实时语音识别SDK全面支持websocket 协议,了解更多
2021-01-15
新功能发布
录音文件识别极速版上线
2021-01-15
新功能发布
语音流异步识别上线

开始使用腾讯云语音识别 ASR

按照我们的 入门指南,只需点几次鼠标,即可

创建您的首个语音识别实例。 

联系我们

我们为您提供个性化的售前购买咨询服务,以及全面的技术售后服务。

http://www.vxiaotou.com