您当前的位置是:  首页 > 技术 > 企业通信 > 文摘 >
当前位置:首页 > 技术 > 企业通信 > 文摘 > 坚守音视频领域多年:是偶然,也是必然

坚守音视频领域多年:是偶然,也是必然

2020-05-21 14:05:12   作者:刘华平   来源:LiveVideoStack   评论:0  点击:


  十几年持续专注于音视频领域的在国内确实不多,我能坚守是偶然也是必然。早期的坚持是兴趣加上偶然因素,现在看到能够通过技术来极大的提升人类在各方面应用的效率时,更多的则是必然。网易云音乐音视频实验室负责人刘华平在采访中说到。
  LiveVideoStack:华平你好,我们是在2017年认识的,当时你还在“WiFi万能钥匙”,说说你的近况吧。
  刘华平:是的,历时一年,在从零组建WiFi万能钥匙音视频研发团队,并且很好地支持了实时通话、音视频编辑和播放相关业务。2017年8月份,网易云音乐在找合适的人来组建专注音乐业务的音视频实验室,当时跟云音乐CEO和CTO有过直接沟通。看到云音乐高层清晰的业务布局和对音视频技术的重视,回想起当年在阿里音乐没能实现的一些想法,在这两方面因素的影响下,让我做出了加入云音乐的决定。
  2017年11月份,我正式加入云音乐,开始组建云音乐音视频实验室,通过技术来提升覆盖音乐内容生产、宣发和消费的效率以及用户欣赏音乐的体验。音视频实验室成立,很多经验丰富的音视频领域人才加入,极大的加快了云音乐产品矩阵落地的速度。
  2019年下半年,我同时兼任云音乐创新业务技术负责人,通过音视频技术来支撑一些音乐新玩法 — 网易云音乐音乐旗下K歌App“音街”就是创新业务部门主导的产品。音街产品中K歌综合评分、酷炫的歌词和视频动画都是音视频技术驱动产生的创新玩法。
  LiveVideoStack:在多家公司辗转,给你带来了什么?你是追求自由的人吗?
  刘华平:每到一个公司,都会给我带来三个方面的成长:
  1. 技术深度和广度:由编解码技术,扩展到前后端算法。从音频到视频,从传统数字信号处理算法到深度学习。
  2. 行业的认识:最初是音视频技术公司,只能向外面提供最底层的技术库,又多是海外市场,至于用在哪里都不是很清楚;后来进入基于音视频技术应用互联网公司,平时的工作除了功能实现,还通过运营大数据和用户反馈来优化和设计解决方案,一步步的由技术点到行业面的认识成长。
  3. 认识与思考能力:现在对工作和生活、职业发展规划、系统化思考等,好像都开始有点入门并且形成一套自己的方式,能以很好的心态去面对人和事。我自律性不错,同时也是追求自由的人,体现在只要能高效的完成某些任务,我不怎么注重形式。
  LiveVideoStack:是什么驱动你去创业,再而回归职场?
  刘华平:我有两次创业经历,第一次是2013年,那次更多的是项目驱动,没有更多的规划和想法,坚持一年又没再坚持;2016年进行第二次创业,是跟几位有成功创业经历的朋友一起做一个音视频技术为主的技术型公司。当时我是CTO,跟着联合创始人一起思考方向、寻找投资,先后见了十几家投资机构,最后由于某些原因也没能持续下去。
  创业让我更好的理解到行业和平台的重要性,认识到创业其实也是在寻找实现自我的平台后,如不能自己去搭建,那就寻找一个可以实现自身价值的大平台,这也就是我创业后,再选择回归职场的根本原因。
  LiveVideoStack:从硬件开发到软件开发,从外企到本土互联网公司,再到网易云音乐,他们有何不同?你更喜欢哪种?
  刘华平:截止到现在,十几年的职业生涯,先后在freescale、visualon、盛大创新研究院、阿里巴巴、WiFi万能钥匙和网易云音乐任职。公司在变化,但自己专注的音视频方向一直没有改变。不同的阶段以及公司,都让我学到很多东西。
  我的代码习惯和一些流程化的管理是当年在freescale和visualon学的,外企在这方面做得真的很到位,code review和版本管理做得很细;
  盛大创新研究院当年是国内互联网牛人最多的地方,在这里让我原来点状的音视频技术形成面,有产品化思维,同时也把我带入到了实时视频这个应用领域。当时参与过的类似于早期YY语音类似的易聊项目,语音3A算法、音效、丟包补偿就是从那时候开始更加专业去做;
  阿里巴巴的工作经历,让我有了全局观和系统化思维的能力。阿里针对P8及以上的人员,有很多相关的培训,例如湖畔学院课程等。这些课程的学习和在平时工作中的应用,让我认识到做事专注和深度思考的重要性;
  在WiFi万能钥匙,使我获益最多的应该是WiFi万能钥匙创始人陈大年,年总每次在公司生日会上的互动分享,我都会认真作记录,过后反复看。年总以数据驱动产品功能以及工作与家庭平衡的理念,对我产生了极大的正向影响;
  网易云音乐组织结构扁平化,团队充满活力,你有好的想法可以直接找到云音乐任何一位高层交流并能得到很专业的点评。云音乐团队在产品设计和技术与产品的结合方面做得很到位。例如做音乐行业,云音乐是看到音乐背后的人,将服务好独立音乐人和用户作为所有工作中的重点。
  总得来说,经历过的每一家公司,我都会积极参与,同时怀着空杯心态去学习,对所有公司都是心怀感恩,只能说我更喜欢当下的状态。
  LiveVideoStack:是什么力量让你守望音视频领域这么多年?
  刘华平:十几年持续专注于音视频领域的在国内确实不多,我能坚守是偶然也是必然。早期的坚持是兴趣加上偶然因素,现在更多的是必然。
  我读研时跟着导师做语音识别方面的课题,也就偶然的进入人类主要信息获取渠道-语音的研究领域。为了能更好的整理自己的所学知识,毕业后我在博客园以笔名 “刘品”开始专注于写音频相关的博客。坚持了几年,博客热度也很高,通过博客经常跟国内外很多做音频算法的人交流,让我学习了很多东西,使我的专业知识从深度和广度上得到了加强。
  音视频领域其实是一个演进很快的行业,例如音频编码器从MP3到AAC再到MPEG-H,视频H264到H265,VC1等。算法也从传统到AI相关,应用场景也是越来越丰富。看到能够通过技术来极大的提升人类在各方面应用的效率时,守望音视频领域就成为我现在的必然选择。
  LiveVideoStack:我注意到你在本科阶段就选择“人工智能与自动化控制”,这是你主动选择的吗,那可是20年前的事了。
  刘华平:我很感恩这个时代和自己的运气,早期我很多选择都是被动的,但现在来看当初的选择还算不错。本科的专业其实是调剂的,当时最火的是“计算机软件”,因分数不高,被调到机自学院的“自动化控制”,因为那时这个专业跟人工智能是最靠边的,在这期间我学习了很多跟人工智能相关的编程语言。
  LiveVideoStack:人工智能,或者深度学习真的可以改变多媒体的生产和消费吗?具体到在网易云音乐,你们做了哪些探索?
  刘华平:人工智能对多媒体的生活和消费产生了极大的影响。目前来看,人工智能场景化应用在音视频(看与听)领域得到了极大的发挥。例如深度学习推动了语音识别、合成、视觉相关技术的发展。
  网易云音乐自2018年底就开始在内容创作、分析和消费中寻找AI能切入的应用场景,目前已取得相当不错的成绩,在改善用户体验的同时提高了音乐产业链各环节的效率。
  • 内容创作方面,我们通过AI对音乐乐理进行分析,形成内容创作方面的知识库,目的是提早发现用户喜欢的新歌并有针对性的进行运营。
  • 内容分析与处理方面,我们通过AI开发性能优于spleeter的消音伴奏算法、音乐结构分段。现在音街用的K歌伴奏库元素绝大部分是通过这套算法自动实现的。
  • 内容消费相关的个性化推荐中有很多标签都是通过AI来打的,推荐不再是仅仅基于用户行为,音乐乐理本身也成为歌曲推荐较为重要的衡量维度。
  AI在音乐中的应用才刚刚开始,效果较为依赖于场景与训练数据覆盖,网易云音乐非常期待能通过更多的技术来助力中国音乐产业。
【免责声明】本文仅代表作者本人观点,与CTI论坛无关。CTI论坛对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

专题

CTI论坛会员企业