AI科技网 互联网 工信部专家包冉:搜狗AI录音笔C1 Pro,用小产品映射智能文明的大图景

工信部专家包冉:搜狗AI录音笔C1 Pro,用小产品映射智能文明的大图景

  录音笔,AI的天然落地场景

  从1956年在美国东部召开的达特茅斯会议明确“人工智能”概念开始算起,这个眼下时兴的名词并不算是严格意义上的新兴事物。

  然而,之所以它在最近几年开始成为全球热议的话题,源于它终于从实验室中走了出来,在现实世界找到了大量的落地场景并最终改变了人们的生活。在这些被改变的落地领域,录音笔算是典型的一个。

  12月12日,搜狗新一代AI录音笔C1 Pro正式发售。根据搜狗的官方介绍,这款录音笔将具备高清录音、录音转文字、同声传译等三大基础功能。工信部互动媒体产业联盟数字文化工作组组长包冉指出:“人工智能的发展遵循两条并行不悖的路径——在学术层面,由围绕基础算法、累进算力和大数据模型开展的前沿研究成为了引领人工智能技术发展的关键力量;而在应用层面,将AI技术产品化、云端算力功能化,并使其转换为实实在在的生产力创新工具成为技术发展的重要保障。从搜狗此次推出的AI录音笔C1 Pro来看,很好的呼应了如上两点。”

QQ图片20191216145913.jpg

  换言之,技术本身需要服务于社会,而在与社会结合的过程中所迸发出的商业价值又将反向驱动技术本身的向前发展。在当下的录音笔市场中,类似搜狗C1 Pro这样的产品仍然是凤毛麟角。智能录音笔提升了速记、翻译等行业的运作效率的同时,也实现了对人机语音交互等基础技术研究的反哺。社会需求越发紧迫,技术向前发展的动力也就愈益彰显。

  技术研发与落地场景的正向循环

  以C1 Pro为例,其三大基础功能虽然从本质上都是实现人机间基于语音的交互,但实则拥有着全然不同的基础技术的支撑。

  其中,高清录音考验着技术革新所带来的采音、降噪与定向能力提升水平。由于录音笔的使用涵盖从人际传播到群体传播等不同规模的场景,如何根据外部环境的变化实现解决方案的智能调节关乎最终的录音效果。这时,搜狗自研的PureVoiceAI降噪算法就自然派上了用场;

QQ图片20191216145927.jpg

  另外,录音转文字基于语音识别技术,在搜狗的这款录音笔中则建构在搜狗知音深度卷积神经网络ASR技术之上——在这一技术的辅助下,1小时的录音文件在5分钟内即可转写完毕,并且实现了高达97%的识别准确率;

  最终,同声传译功能的实现还需要基于后台建立的庞大语料库及不断迭代的深度学习算法。C1 Pro之所以能够支持中英互译,这既得益于搜狗在传统业务中积累的大量原始素材,也受惠于过去几年在人工智能技术上的深度发力与积累。

  对于搜狗新推出的C1 Pro,包冉从两个角度做了剖析:从技术层面来说,产品理论基础源于搜狗知音深度卷积神经网络ASR技术,其语音与语义识别的理论及实验准确率均达到了国际领先水平;在产品的设计方面,其基础功能元素如采音、降噪、定向,智能服务元素如同声传译、高效转写、文辞修饰,云力支撑元素如云存储、APP适配,科技美学元素如简约的一体化设计,均使其用户界面友好、细分应用场景全面。包冉认为:“当在技术的支撑下覆盖更为全面的场景,并使得越来越多的用户‘拿起来、放不下’的时候,源源不断的‘数据能源’就不再是一句空话。”

  包冉提到:“技术的先进程度与落地场景的覆盖度是人工智能发展进程中的一体两面。当技术越先进时便能获得更多的落地机会,这时在落地过程中生产的数据又会进一步提高技术的先进性,从而达成正向循环。”从这个层面来看,搜狗录音笔和其背后的底层技术已经率先进入了相对舒服的互动状态。

  通用技术路径的差异化优势

  事实上,在输入法领域的长期深入研发,让搜狗在推出录音笔产品时具有先天优势。而输入法业务本身即是扮演着高效连接人与信息的角色,这使得其需要储备强大的自然语言处理等技术,而这其中便包含着对语言和语义的精准理解。值得注意的是,在博大精深的中国语言系统中,这种精准常常就体现在各种各样的细节中。

  如果仔细审视C1 Pro的各项功能,还能够发现其中潜藏着的不少小惊喜,例如其提供了自动分段、过滤语气词和重复词等功能。这些功能让录音笔不再只是简单的将语音转换成文字的工具,成为了能够自主进行文字预处理的“助理”,从而提高使用者的工作与沟通效率。也正是拥有了这些功能的补充,“一出声,就搞定”的使命才得以高质量完成。

QQ图片20191216145923.jpg

  从工具属性到智能助理,这显然会成为录音笔不容忽视的趋势。而要在中文语境下达成这一跃迁,仅仅依靠全球通用的人工智能技术解决路径并不可行,这时就考验着本土化的团队对中文这一语言体系是否足够理解,而搜狗积累的大量经验就成为了其发展录音笔业务的差异化优势。

  包冉认为,“搜狗AI技术的落地以及场景的应用符合人工智能未来发展的趋势,它颠覆了人类传统意义上的工作和生活方式,从这一点来讲,搜狗走在了行业的前列”。并且,从这样一个智能硬件的快速发展过程中,我们也能看到智能时代人类文明的大图景。“这幅图景有三个基本支撑点:首先是以5G为代表的新一代基础信息网络,以及不断被打破的通信与应用之间的物理和地理边界;其次是以人工智能技术为代表的机器学习能力,它将覆盖更多的细分场景,不断造福人类个体和人类社会;最后是以大数据为代表的数据生产和生产力机制,正在不断加速着文明的交流、交通和交融。”包冉这样说道。

  当然,包冉也提到一些在技术发展热潮下需要的冷思考。“企业需要全力做好用户的数据安全保护和权益界定保障。让用户‘用得放心’是运营红线,更是ABC时代(AI、BigData、Cloud)下任何一家科技企业必须遵守的底线”,他提到。

  事实上,越来越多涉及数据权利竞夺的标志性事件正在高频发生,这成为用户自我保护意识觉醒的体现,也印证了包冉对于技术公司如何实现可持续发展的判断。

  对于任何一个身处技术赛道的公司来说,技术储备实力、场景落地能力、对本地场景差异化的理解以及对用户及其权利的充分敬畏都关乎着其在未来竞争棋盘中的位置。正因为战争刚刚开始,所以每一个决策都显得至关重要。

 
本文来自网络,不代表AI科技网立场,转载请注明出处:https://www.aitechw.com/internet/882.html

万博DataVis:以展示级BI打造企业增长新引擎

壹路通数字化赋能企业经营,实现客户价值最大化

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

返回顶部