9月1日上午百度世界大会在京召开。百度董事长兼首席执行官李彦宏在开场时发布了关于百度人工智能的主题报告。本届百度世界大会的主题是“AI is the new Electricity”,亦即“人工智能是新电能”。
今年2月,百度语音识别入选《麻省理工评论》眼中的十大突破技术,这让本来不受媒体重视的百度人工智能摆上了台面。6月份李彦宏曾在百度峰会上表示,互联网即将进入以“人工智能”为平台的下一幕场景中。
百度世界大会上,李彦宏再次重申了“百度是一家人工智能公司”。而百度大脑四种重要功能自然语言的处理、语音识别、图像识别处理以及用户画像等几乎在每一个分论坛都被提及:从金融到内容,从服务平台到无人车。
李彦宏表示,过去五六年间,百度花了很大的精力投入到人工智能的研发当中,人工智能就是“百度大脑”。但是人脑和电脑还是有很大区别的,而百度大脑主要有人工智能的算法、计算能力和数据这三大板块。
其中人工智能算法由超大规模神经网络、万亿级参数、钱一样本和迁移特征训练组成。计算能力由数十万台服务器以及中国最大GPU集群组成。数据包括全网数万亿网页内容,每天数十亿次搜索数据,百亿级别定位数据。
随后,李彦宏介绍了百度大脑的四大功能。首先是语音包括语音合成和语音识别两大能力。今年MIT Technology Review把百度的DeepSpeech评为了2016改变世界的十大科技紧张。李彦宏表示,我们更感兴趣的是有了这些能力,应该在什么领域进行应用。紧接着李彦宏在现场演示了语音识别功能的实时话术推荐,可以实时在聊天中提醒说话者如何应对。
语音合成是李彦宏的下一个演示。现场出现了张国荣的合成音,并按照正常人的语调播放了出来。
图像演示在现场出现了一个笑点。李彦宏表示,现在人脸识别的准确率已经达到了99.7%,大屏幕上突然出现了现场视频,并在一片笑意中由百度大脑顺利识别出了百度副总裁朱光等人。
除了面部识别外,百度地图识别等现在也取得了很大进展。李彦宏说,计算机视觉,即图像识别也应该是百度无人车技术的最后一块壁垒。百度无人车的车辆检测能力,李彦宏表示,现在已经在国际上排名第一,车辆跟踪能力的6项指标中也有4项拿到了第一。
AR(增强现实能力),李彦宏认为,可以把现实世界中的物品和虚拟世界结合在一起,也需要图像识别技术的助力。而如何让技术落地消费者生活,广告主也需更好的创意。
自然语言处理的成熟程度尚不如上两种技术。李彦宏在演讲中表示,现在百度也有了“度秘”和百度翻译这样的产品,除了识别语音和图像外,更重要的功能是用人类的语言进行交互,理解使用者的意图。李彦宏请了篮球评论员杨毅上台,并现场点评了度秘的一场篮球比赛解说。用户也可以在百度翻译上进行实时语音翻译。
用户画像的用处在哪儿呢?李彦宏举了百度本身的一个例子。手机百度搜索栏下的Feed流就是根据用户画像进行的个性化推荐。百度描绘了61.5万个标签,每个用户都是标签的组合,因此才能做到千人千面。今年《魔兽》在中国上映期间就是根据百度的工具和数据进行人群筛选,带来了200%的票房提升。
百度钱包代言人胡歌的上台引起了现场的轰动。胡歌在台上与李彦宏进行了互动,演示了百度大脑的语音合成、用户画像等诸多功能。李彦宏开玩笑称,百度大脑以后可以模拟人的动作,能把胡歌的戏给演了,吓得胡歌连忙表示演戏还是自己来比较好。
百度的压力
从今年年初开始,百度就在无穷无尽的负面新闻中打滚。从“血友病吧”卖吧门到魏则西事件,紧接着是百度搜索赌博门,每一次都在网上引起群情激奋,然后就是常规的道歉、监管、整改,然后又是新的负面……
舆论渐渐平息,但是百度已经风声鹤唳。血友病吧事件过后,所有医疗类贴吧停止出售;魏则西事件后,针对国家网信办的整改要求,百度全面审查医疗类商业推广服务;7月底,随着媒体进一步曝光,百度开始要求对部分“非企”业务提高客户审查力度,叫停贴吧商业化合作,引起了同地方运营商的纷争。近日媒体曝出百度停止了比特币等虚拟货币广告,这被业内普遍认为是为了规避下一个有可能出现的负面舆论点,因为比特币等虚拟货币的交易存在大量的诈骗行为。
壮士断腕固然值得叹息,但是在这背后更值得思索的是,当百度形象面临固化的危机时,如何摆脱和扭转人们的成见。
无论是“这届百度公关”的微信公众号,还是李彦宏跟着贝尔去冒险的真人秀,目前来看都只是治标不治本的方法。百度要走出搜索盈利模式的窠臼,找到能带来高速腾飞的下一个增长点,才能得到形成新的企业文化的机会,也才有彻底解决问题的可能。