2月1日,腾讯云语音识别团队与微信智聆团队共同打造的在线教育领域专属行业模型正式对外发布。同时,为满足客户更多场景需求,腾讯云语音识别在原有产品矩阵基础上,新发布语音流异步识别和录音识别极速版两大子产品,并对支持的音频格式做了系统升级,升级之后的音频支持格式种类在国内主流语音识别厂商中位居领先地位。
在线教育行业专属模型,字准率业界领先
在线教育长期以来一直是AI语音需求旺盛的行业。疫情期间,在线教育对于语音识别的需求不仅持续增加,并且随着国内在线教育市场的发展,在线课堂场景下对于AI语音新需求也在集中出现,通用的语音识别模型已经无法满足该领域专有的句式和词汇需求。
腾讯云AI语音团队与微信智聆联合打造的在线教育行业专属语音识别包含中文和英文两大模型:中文模型涵盖了数学、语文等传统教育学科,以及美术、音乐、大语文、数理思维、STEM等素质教育学科;英文模型适配了K12少儿英语发音以及英语学科内容,具备高准确率、高并发支撑能力、低时延的效果,经过客户实测,中文、英文在线教育模型字准率在业界处于最佳水平。
值得一提的是,在线教育行业的客户不仅可以使用腾讯云ASR语音识别应用语音弹幕、教学字幕、直播中对授课内部进行检测,并对学生侧的音频做分析,进一步了解潜在诉求,提升产品的用户体验。
新发布录音识别极速版和语音流异步识别
为满足不同客户群体需求,腾讯云语音识别团队在产品功能的丰富度上持续发力,在已有语音识别功能三个子产品实时语音识别、一句话识别、录音文件识别之外,新增了录音文件识别极速版和语音流异步识别两个子产品。
其中,录音文件识别极速版对用户上传的较大的录音文件进行极速识别,半实时返回识别结果;可应用于音视频字幕、准实时质检分析场景等场景;语音流异步识别可直接对直播协议语音流进行识别,准实时返回识别结果,支持音视频场景专用模型,可用于直播质检等场景。
经过长期的打磨训练和效果调优,目前腾讯云语音识别各功能已广泛应用于会议记录转写、音视频字幕、电话录音质检、直播质检、语音消息转写、语音弹幕等业务场景,服务于短视频、直播、社交、游戏、在线教育等应用。
全新升级音频格式,覆盖主流客户需求
此次升级,腾讯云语音识别在常见的pcm/wav/mp3/m4a音频格式之外,还增加支持wma/amr/aac/ogg-opus/flac/flv/mp4/3gp等音频格式,全面覆盖市场主流客户使用需求,支持的音频格式的类型在国内业界主流语音识别厂商中处于领先地位。
为了给开发者提供语音转文字服务的最佳体验,腾讯云语音识别不仅在公司内部微信、QQ 、腾讯视频、王者荣耀等大体量业务充分验证,也在大量互联网、金融、教育等领域的外部客户业务场景成功落地,日服务用户超亿级。具有海量数据支撑、算法业界领先、支持语种丰富、服务性能稳定、抗噪音能力强、识别准确率高等优势。
腾讯云AI解决方案产品中心总经理周超表示:“腾讯云语音识别产品团队还在继续努力,深耕智能语音行业化,用更前沿的技术、更完善的生态,帮助合作伙伴和客户打造高效的专属解决方案,助力各行各业的数字化和智能化转型。”
免责声明:本文互联网转载,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
免责声明:市场有风险,选择需谨慎!此文转自网络内容仅供参考,不作买卖依据。