咨询我们:020-2919 3652
 企业云服务专家 科技赋能创未来 
鹏华技术_企业云服务专家
合作伙伴_03
企业微信服务商_03
网站建设
语音识别
腾讯云语音识别(Automatic Speech Recognition,ASR)是将语音转化成文字的PaaS产品,为企业提供精准而极具性价比的识别服务。被微信、王者荣耀、腾讯视频等大量业务使用,适用于录音质检、会议实时转写、语音输入法等多个场景。
  • 实时语音识别
    对不限时长的实时音频流进行识别,识别结果自动断句,标记每句话的开始和结束时间;可应用于智能语音助手等实时音频流场景。
  • 录音文件识别
    对用户上传的五小时之内的录音文件进行识别;可应用于呼叫中心语音质检、视频字幕生成,会议语音资料转写等场景。
  • 一句话识别
    对一分钟之内的短音频文件进行识别;可应用于语音输入法、语音消息转文字、语音搜索等场景。
  • 语音流异步识别
    对直播协议语音流进行识别,准实时返回识别结果,支持音视频场景专用模型;可用于直播流质检等场景。
  • 录音文件识别极速版
    对用户上传的较大的录音文件进行极速识别,半实时返回识别结果;可应用于音视频字幕、准实时质检分析场景等场景。
  • 说话人识别
    基于语音识别与声纹识别能力,将说话人的音频与语音库中该说话人预存的音频进行1:1比对验证,具备一定的抗攻击能力,可用于身份验证场景。
  • 虚拟号真人判定
    基于语音识别和声学算法能力,在智能外呼场景下,能够在毫秒级准确判断真人用户何时接起电话,帮助客户判断对话机器人的启动时机。
产品子功能
  • 技术先进
    语音识别技术采用自主研发的Transformer技术,具备较好的鲁棒性。具备声音和文本层面的自适应能力,具备多语言混合识别能力。中文普通话、英文的识别字准率均能满足广泛的商用场景。
  • 性价比高
    腾讯云提供预付费、后付费等多种灵活计费模式,在预付费包提供了较大优惠,识别1小时语音不到1元。每月赠送免费额度,最大程度降低客户成本。
  • 多语种、多方言
    目前语种支持中文普通话、英语、日语、泰语4个语种,后续将持续开放其他语种的识别能力。方言支持粤语、上海话、四川话等24种方言,后续将持续开放其他方言的识别能力。
  • 适用多领域、多场景
    可广泛适用于客服质检、外呼中心、智能家居、游戏直播、会议转写、语音输入法、法庭、房地产、教育等多个行业,基于海量数据实现分场景优化,积累了多行业的最佳实践。
  • 支持热词和自助训练
    针对垂直领域,客户可自助上传热词词表或自训练语料轻松完成模型自助训练,不懂算法也可以轻松实现模型调优,有效提升专有领域的识别准确率。
  • 高性能
    产品全面实现华南、华北、华东、西南等多地域就近接入,实时识别时延达到毫秒级,非实时识别实现高性能转写速率。
产品优势
应用场景
  • 智能客服质检

  • 会议实时转写

  • 实时字幕

  • 法庭转写

  • 面对面销售

  • 语音输入法

解决方案

在智能客服场景中,使用腾讯云语音识别可以将客服通话录音转化为文本,对可能出现的违规用语、危险用语等进行及时的干预处理,避免造成公司损失。支持实时监控和离线录音异步质检等多种质检方式。

推荐产品

录音文件识别

对录音文件进行识别,达到识别较长的非实时语音的效果。

描述
描述
解决方案

通过腾讯云语音识别实现实时对会议内容进行转写,免除了大量人工记录的工作,并通过产品的自动分段功能减轻后续人工编辑的工作量,辅助会议记录快速生成,提升稿件整体效率。

推荐产品

实时语音识别

对实时音频流进行识别,达到“边说边出文字”的效果。

解决方案

支持对视频进行实时字幕转写,产品提供时间戳功能,其精细度可到字级别,帮助客户更好地定位字幕持续时间,实现在线会议、在线视频的实时字幕功能。

推荐产品

实时语音识别

对实时音频流进行识别,达到“边说边出文字”的效果。

描述
解决方案

传统场景的书记员人工记录方式有可能影响庭审的效果,或出现错误需要二次修改。使用腾讯云语音识别,可自动地实现庭审记录的转写,大量降低了人工成本,避免了人为错误、人为篡改等因素,维护了法庭记录的合规性,有效提升庭审记录效率。

推荐产品

实时语音识别

对实时音频流进行识别,达到“边说边出文字”的效果。

描述
解决方案

腾讯云语音识别对面对面销售的场景、尤其是车企、药企等需要重点依赖面对面销售的场景有很好的支持力度,能够通过远场识别技术准确地转写客户和销售人员的对话内容,帮助销售人员回顾工作过程,或帮助管理者进行销售人员规范用语质检。

推荐产品

录音文件识别极速版

对用户上传的较大的录音文件进行极速识别,准实时返回识别结果。

描述
解决方案

腾讯云语音识别能够帮助各大输入法厂商实现语音转写,通过多方言、多语种、实时性等特性的支持,能够覆盖大部分终端客户语音转写的场景,可用性高达95%。

推荐产品

实时语音识别

对实时音频流进行识别,达到“边说边出文字”的效果。

描述
<
>
行业客户案例
  • 微信
    在语音消息转写和语音输入产品功能中使用语音识别服务,帮助用户更便捷的进行消息阅览和传递,提升了 App 的易用性。
  • 喜马拉雅
    喜马拉雅使用腾讯云语音识别,实现 UGC 上传音频节目转写,通过转写为文字的内容提供内容标签,实现更精准的内容推荐。
  • 珍爱网
    使用腾讯云语音识别完成电话录音质检,效率提升31倍,成本降低90%,过去50个人的工作量,现在只需1个人工+1台机器。
  • 58同城
    58同城智能电话联络系统集成腾讯云语音识别服务,使得电话联络机器人可以听懂客户的声音,显著提高电话联络效率,降低电话联络人力成本。
  • 中信银行
    中信银行手机银行 App 集成腾讯云语音识别服务,用户使用语音交互,即可完成转账、查询、理财等日常金融交易,大幅提升业务办理效率。
  • 尚德机构
    尚德机构使用腾讯云语音识别进行电话录音质检,从只能抽检变成全检,大幅提高质检效率,完成客服工作质量评价,并推动改进客服与用户沟通的体验。