详情
百度给人的印象,总是科技控。但随着BBC报道度秘机器人入驻肯德基“Original+”的案例,又让人觉得科技控内心还是蛮狂野的。在不久前的百度语音技术媒体开放日上,百度宣布免费开放语音唤醒和自定义语义两项技术,进一步加深了我们的判断,科技控也有大野心。
语音技术:百度超越国际巨头的真正原因
近年来,语音技术成为人工智能领域的热门。谷歌ALLO中内置语音功能,微软的Botframework提供cognitive microservices(认知微服务),能理解自然语言或对图片进行分析;苹果也姗姗来迟的放出语音接口。全球范围内,互联网巨头们正在掀起一场抢占语音高地的“世界科技大战”。
相比其他世界巨头们,不论是谷歌、微软还是苹果,百度的语音技术显得姿态更高。之所以这么说,并不是单纯的逼格,而是在语音上的技术实力。根据最新报告,百度的DeepSpeech2错误率仅为%,而谷歌则在8%左右,百度的深度语音识别系统(DeepSpeech2)还入选为《麻省理工评论》2016年十大突破技术。
坦白讲,在语音识别领域,百度并不是先行者,谷歌、微软、IBM等巨头早有涉猎,百度为什么能领先呢?在语音识别领域,差距往往在细节。语音识别算法、语料库的累积,往往起到基础性作用。在语音识别算法上,微软、苹果、谷歌至少能够不低于百度的水平,差距取决于重视程度和投入的速度。对于中国市场,微软和谷歌、苹果虽然显得重视,真实的投入却比较一般,似乎是碎步慢走。而百度则将语音技术、人工智能技术作为变革进化的重中之重来看待,2015年研发投入超过100亿元,而在中国语料库的累积上,百度的速度也明显快于其他竞争者。
未来的世界科技大战是“口活”
尽管人们对人工智能还普遍抱有观望态度,但可以直观感受的是,语音技术一定是人工智能中的桥头堡和首攻高地。不论是微信、还是汽车语音导航、智能蓝牙音箱,人们可以直观的感受到,使用语音对话的确比用手操作方便了很多。如果开空调动动嘴巴就可以实现,为什么要不遗余力的寻找遥控器并且按个不停呢?为什么不能直接说“开空调制冷,调到16度”呢?
古语云,大道至简。以通讯为例,就在不断简化。从马拉松跑步,到飞鸽传书,到驿站书信、到电话、到电子邮件、到即时通讯、到语音,人类的进步,也正是一部方便性、简化性提升的历史。因此,在未来,当每个物体开始具有与人类似的识别、理解能力时,人工智能才会真正起步,而这个拐点已经开始出现,对于某些固定指令的自然语言交互,互联网巨头们已经可以做到近乎100%的可用率。
百度李彦宏已经看到了机遇所在,早在2014年百度世界大会上,李彦宏就提出了他对未来科技发展的行业洞察——科技正在回归人性。语音的历史已有二十万年,是人类自然的、低门槛的表达方式之一。他认为:“未来5年,消费者使用语音和图像表达需求的比例将超过50%”。
因此,我们在与一些新三板上市公司老总聊天的时候,他们也表示,百度是国际互联网巨头中,最对中国语料库感兴趣并且最愿意花钱投入的。这恐怕也是百度在未来世界科技大战领先的原因之一,玩好“口活”,不仅需要有技术,更需要有真金白银的投入和时间的积累。当然,这一切取决于态度。
人工智能:将成就一万个百度?
事实上,玩好“口活”,还只是未来人工智能世界的一角。一旦人工智能开始进入深度应用状态,其就会变得像水电一样无孔不入。试想一下,现在真正实现“百度inside”的,还只是在家中的电脑、手机、笔记本/pad而已,倘若未来社会上所有物件,全部“百度inside”,包括桌椅板凳、交通工具、食品日用、消费娱乐,那人工智能将成就一万个现有的百度,百度市值将迎来爆炸式增长。
李彦宏对人工智能的渗透性有着清晰的认识,“百度绝大多数的技术,或者说产品都已经渗透了人工智能的东西。人工智能能够带来的这种改变,或者说产生的颠覆,恐怕是很多人现在还无法想象的。几乎任何公司一旦赋予了人工智能的能力,就会变成一个不一样的公司。比如在制造业中,不管是一个杯子也好,或者是书架也好,现在都是死的,将来一旦具备了这种智能的能力,就变得鲜活了,它能够理解你,能够做你想让它做的各种各样的事情。所以它其实会涉及到方方面面,渗透到每个角落。”
那么,有人会说了,人工智能又不是只有百度一家,微软、谷歌、苹果不都有吗?是的,在技术上的领先,并不能保证渗透率的领先,这就需要有更加开放的心态、更迅速的策略结盟。值得注意的是,百度此次开放的2项语音技术,百度方面也表示将为开发者提供百度大脑的声学模型和语音模型,基础服务免费,可永久使用。相对于苹果Siri开放的羞羞答答和众多限制条件,可以相信,在越开放、越透明越能够生存的时代,竞争将不仅是技术层面,更是心态层面。
对比百度与苹果,可以发现一些有趣的现象。李彦宏曾经清晰指出了百度在人工智能上的定位,百度将专注于为整个社会提供底层的技术,“最显性的产品形态会是各种各样的公司他们去做的,如果这个机会我们能够抓住了,百度确实是可以变成一个完全不一样的公司,变成一个比现在要影响力大得多的公司”。
而在WWDC全球开发者大会上,苹果终于宣布进入对话式界面领域。不过,苹果的行动却令人困惑。Siri和Messages均只提供了程度很小的开放整合,用以整合Siri的工具SiriKit限于特定的几个使用案例,且对开发者在自家产品中整合Siri的方式实施制约。一些热门的领域显然很适合进行第三方的Siri整合,如地图和音乐。不过,它们被排除在了第三方创新范围之外。评论家指出,这最有可能是因为像谷歌地图和Spotify这样的服务一旦与Siri整合,可能会对苹果地图、AppleMusic等苹果旗下已有服务造成威胁。
在比拼渗透率的速度上,中国公司可能比国外巨头更有优势。在结盟策略上,不仅仅关系到技术,更是文化、价值认同以及实际利益让渡的综合博弈,作为一家在纳斯达克上市,拥有充沛现金流、并且正儿八经的中国高科技公司,百度在渗透率速度和规模的竞争上,将更具攻击性。
或许,巴别塔的故事将在人工智能上成为现实?