豫都网 > 创业频道 > 创业新闻 >

解读百度大脑究竟能干嘛:李彦宏的演讲干货告诉你

[摘要]为了显示百度是家高大上的公司,李彦宏之前一直很强调百度在人工智能上的投入,但是百度在这方面究竟做得怎么样?在今天的百度世界大会上,李彦宏终于花了几个小时好好讲讲,这个他看做是百度大脑的人工智能技术。 他认为, 互联网 的发展在此之前已经经过了...

说了那么久,百度大脑究竟能干嘛:李彦宏的演讲干货

为了显示百度是家高大上的公司,李彦宏之前一直很强调百度在人工智能上的投入,但是百度在这方面究竟做得怎么样?在今天的百度世界大会上,李彦宏终于花了几个小时好好讲讲,这个他看做是百度大脑的人工智能技术。

他认为,互联网的发展在此之前已经经过了两个非常重要的阶段:PC互联网到移动互联网。目前,中国市场网络渗透率已经达到50%,也就是七亿多。这意味着,未来互联网的增长不能再靠人口红利来驱动了。中国进入新常态,经济的增长需要靠“互联网+”行动计划来推动。此前李彦宏在今年6月的百度联盟峰会上就提出,移动互联网之后的下一幕是人工智能。

而李彦宏表示,百度在过去的五六年当中,投入了很多精力到人工智能的研发当中。人工智能对百度的意义,就是百度大脑。这个大脑在三年前相当于两三岁孩子的智力水平。

百度大脑:三部分、四个功能

百度大脑基本上由三个大的部分组成。

第一部分是算法。这包括模拟人的神经元组成的网络、万亿级的参数、千亿的样本和千亿的特征。

第二部分是计算能力。百度使用了数十万台的服务器来进行计算,而这当中很多不是传统基于CPU,而是基于GPU。

第三部分是数据。他认为百度收集了全网的互联网网页内容、每天网民的搜索请求与定位请求。

有了算法,有了计算能力,有了数据,百度大脑就可以开始工作了。百度大脑又到底有什么样的功能?

我们今天想重点介绍的四个功能:一个是语音的能力,一个是图像的能力,一个是自然语言理解的能力,还有一个就是用户画像的能力。

语音:语音识别和语音合成

语音是今天人工智能发展的最成熟的一部分能力,而语音又分成两个方向,一个是语音的合成,一个是语音的识别。

语音合成

今年MIT Technology Review(《MIT科技评论》)杂志,把百度的语音识别引擎第二代Deep Speech 2评为“2016改变世界十大突破技术”,这个引擎大概可以做到97%的准确率,这样的准确率有时甚至超过了人。李彦宏演示了语音识别的其中一个应用场景:电话销售。

销售人员需要长时间培训才能上岗。但是通过百度语音识别能力,一个新的销售上岗的第一天,就可能掌握他所获得的那些最优秀的销售的能力:新销售打电话给潜在客户的时候,百度大脑都实时地识别了客户的问题,并且显示在销售的电脑的屏幕上,同时实时地把最优秀的销售的回答展示出来。这样,新的销售基本上可以照着屏幕念,就能够达到最优秀的销售的话术的水平。

 语音合成

而语音的另一方面,语音合成,则是指机器可以把文字转换成语音,把它念出来、读出来。今天的语音合成相较于之前,更为自然,更接近真人。百度发现,这样的提升有利于提高用户粘性:过去每个人平均在小说频道会花大概四十分钟左右的时间,现在要花将近两个半小时。现在,百度每天要响应2.5亿次的语音合成请求。

另外,语音合成还可以模拟任何一个你喜欢的人的说话方式。百度地图里导航功能其中有一个就是用李彦宏的声音进行导航,这是机器根据他说话的情况合成的。随后他在现场播放了一段合成的张国荣的声音。

 图像识别/计算机视觉

人工智能在图像识别方面的专业术语,叫计算机视觉。

图像识别其中一种应用就是人脸识别,百度人脸识别的准确率已经达到了99.7%。人脸识别通过提取人脸的关键点,即便一个人的表情会变,但是他的表情特征不变,所以仍然可以很准确地识别出。

除了面部识别之外,图像识别的另一个应用场景就是全景图的制作,采集图像之后要对图像中的目标进行识别,辨认出这具体是哪条路或者哪个大楼。

图像识别还有一个应用领域就是无人驾驶汽车。这需要计算机视觉、高精度地图、对环境的感知、定位、甚至需要语音通话。但李彦宏认为是图像识别是无人车技术中的“最后一公里”,真的要变成没有人,最终还是要依靠计算机视觉来识别各种极端情况,包括周围的车辆、行人、障碍、红绿灯。

另外,增强现实AR,也非常依赖(图像识别)。手机要正确识别出现实情况,才能产生真实世界和一些虚拟世界的完美结合。

 自然语言处理

第三个能力是自然语言处理,即能够用人的语言来与人进行交流,并且能够理解人的很多意思和意图,比如百度自动翻译、用度秘来解说奥运篮球。虽然度秘的语速比较慢、语言识别能力仍需加强,但其优势在于记忆能力强,知识型问题回答得非常快。

 用户画像

百度大脑的第四个能力是描绘用户画像,即基于百度的大数据以及机器学习了解用户,打上标签。这些标签主要在两个维度上体现,一个是通用的维度,人口学特征、短期的意图、位置属性;还有垂直行业的特征,用户在金融、保险、医疗、旅游健康等领域的情况、爱好和习惯。

这可以帮助百度给用户精准推荐新闻,可以帮助商家针对不同用户设计推广过程。

最后,李彦宏让百度大脑用人脸识别识别出了胡歌,用语音识别和合成模仿了胡歌的声音,还用用户画像能力挖掘出胡歌粉丝的爱好是旅游出行、网络购物。



《解读百度大脑究竟能干嘛:李彦宏的演讲干货告诉你》河南新闻-豫都网提供,转载请注明出处:http://cy.yuduxx.com/cyxw/471645.html,谢谢合作!

[责任编辑:admin]

我要评论

评论列表(网友评论仅供网友表达个人看法,并不表明本站同意其观点或证实其描述)

豫都网版权与免责声明

1、未经豫都网(以下简称本网)许可,任何人不得非法使用本网自有版权作品。

2、本网转载其他媒体之稿件,以及由用户发表上传的作品,不代表本网赞同其观点和对其真实性负责。

3、如因作品版权和其它问题可联系本网,本网确认后将在24小时内移除相关争议内容。

详细声明请点击进入>>

返回豫都网首页
版权所有: 豫都网 Copyright(c) 2010-2015 YuDuWang Network Center. All Rights Reserved 豫ICP备13014680号
若无意侵犯了贵司版权,请来信通知,我们会及时处理和回复,谢谢!邮箱:admin@yuduxx.com
未经豫都网书面特别授权,请勿转载或建立镜像 违者依法追究相关法律责任
地图 地图 地图 地图 地图 地图 地图 地图 地图 地图 地图 地图 地图