您当前的位置是:  首页 > 技术 > 企业通信 > 技术 > 语音通信 > 技术动态 >
  首页 > 技术 > 企业通信 > 技术 > 语音通信 > 技术动态 > 声网Agora一站式智能语音识别方案:内容审核,快速接入

声网Agora一站式智能语音识别方案:内容审核,快速接入

2019-08-26 15:28:12   作者:   来源:CTI论坛   评论:0  点击:


  视频直播、语音聊天、音乐社交,这些与“声音”有关的社交场景在近两年来越来越热,也吸引了很多内容创作者和用户。不过,与之相关的语音内容审核一直是令很多平台头痛的问题。这也让那些“每天听 4000 条语音”的声音鉴黄师上了头条。而现在,市场上已经有一些厂商开始提供智能语音鉴黄服务了,大幅减轻了人工鉴黄的工作量。
  不过,对于社交产品团队来讲,现有的语音内容审核+实时音视频服务,部署、调试、运维的成本高,而且很多方案对有背景音乐、噪声的音频识别效果差。为了解决这个问题,我们正式推出声网 Agora 一站式智能语音识别方案。
  现有的方案都是如何实现的呢?
  一般来讲,一个社交产品需要对接三种厂商:CDN厂商,用来推流、拉流,实现普通的直播;RTC 厂商,用来实现低延时的实时互动直播;内容审核厂商,通过 AI、人工进行审核。接入的架构基本如下图所示,可简单概括为三步:
  1. 内容经过转码或直接推流至 CDN;
  2. 内容审核厂商从 CDN 拉流,然后进行 AI 、人工内容审核;
  3. 完成审核后,传回给服务器端。