辑注记:上周四晚上参加了百度的一个技术沙龙:西二旗夜话,这是一个小范围的技术沙龙,主要聊一些跟技术相关的话题,这期的嘉宾是百度云首席架构师侯震宇、百度移动云首席布道师张辉、百度深度学习研究院常务副院长余凯,大家主要对 O2O 场景内连接方式做了一些探讨,现将随手整理的一些有趣的观点分享给大家。
主持人百度移动云首席布道师张辉开场先提了一个问题:O2O 场景内,你最看好哪一种连接方式?有四个选项供大家投票选择,分别是图像,二维码,NFC,语音识别。(投票结果在文末)
从产品的角度来说,目前这四种技术手段的产品都有人在做,比较常见的比如二维码,技术已经非常成熟;NFC 在国内的推广还比较局限,所以以他为解决方案的产品还不多,最早的维络城使用的是这个解决方案,不过现在已经落没了;语音识别之前布丁优惠和丁丁优惠都有过类似的解决方案,不过最后也不了了之,图像识别百度目前在做轻拍,不过使用场景和范围也都还在探索。
侯震宇:用技术连接服务
侯震宇是百度云首席架构师,过去几年一直负责百度的云计算大数据处理,现在主要负责百度移动云的云平台,在百度工作超过 10 年。
侯震宇分享了他对连接这个概念的看法,而他在做的事,是想通过“轻拍”在整个移动场景下打造出一个生态。他认为图片识别处理是最快实现用户需求的方式,通过“轻拍”给用户提供了更加简单的输入方法——拍照,通过拍照使用户和他想要的服务真正连接起来,实现真正的人和服务的连接。
他的想法是基于最简单直接的图片搜索来完成,图片搜索使用的多是描述性搜索,以图识图的方式也在慢慢成熟,轻拍想用这样的方式连接服务也有可行之处,只是在这是搜索技术的另一个使用场景,不只在 O2O 上,在很多地方都可以用到这个技术,我比较认同的一点是拍照确实是一个简单可操作的交互方式,比如扫一扫,摄像头识别等等,至于是否能更大场景的利用在本地生活及 O2O 上,还需要更多的产品尝试,轻拍只是提供了一个入口。
余凯:移动摄像头成为人视觉系统的延伸,是连接的一个关键通道
余凯是 百度深度学习研究院 常务副院长,院长为李彦宏,主要负责图像识别、深度学习、人机交互等领域的技术研究。
余凯认为,对于未来十年移动互联网以及 O2O 的愿景,从计算机视觉角度来讲,最让他期待的是摄像头,认为未来链接人与世界的最重要方式之一,就是摄像头。
感知是链接人与世界的媒介,通过感知能内化到我对于这个世界的认识,人类了解世界,90% 的信息是通过视觉。我们更多的是通过我们的视觉系统去链接这个世界。而移动摄像头已经成为了人视觉系统的延伸,既然移动摄像头成为了重要感官的延伸,那它无疑就是信息入口的最大想象空间之一。
但图像识别技术直到今天依然是信息技术最重大的领域之一,要识别一个东西是什么其实很难,视觉会遇到各式各样的干扰性信息,包括光照,远近,角度,形变,遮挡等。
为了能让摄像头和图像搜索连接人与世界,还有一系列的问题要解决。第一个问题是识别率的问题,第二个问题是特定场景的使用密度,如果用户对一个场景用十次只有一次两次可以搜出来,他就觉得这个东西不值得使用,这里面不光是技术,还有后台数据库的覆盖率问题。
关于移动摄像头已经成为了人视觉系统的延伸这一点相信应该没有人会否认,在移动设备越来越普及的今天,移动摄像头在很大程度做到了很多人做不到的事情,之前搜狗的 CEO 王小川在一篇文章《智慧的体外进化》里提到:现代人离开科技产品会变得更加脆弱,但是一旦把人和科技产品组合成一件事情,你会变得更加强大,我们被科技武装了。
移动摄像头也算科技武装人类的表现之一,做为连接的一个关键通道,未来充满想象。
O2O 场景内,你最看好哪一种连接方式?
再回到开头主持人提的那个问题:O2O 场景内,你最看好哪一种连接方式?
在开场前大家对这个问题做了投票,图像 15 票,二维码 1 票,NFC2 票,语音识别 3 票,我当时的投票是投给了 NFC,我认为图像识别的精准度和使用场景还有待考察,但 NFC 算是一个相对成熟的技术,在 O2O 场景内使用有成熟案例,但不能否认的是图像确实是更直接的一种方式。
而在场的观众和嘉宾普遍认为就单一问题和场景来说,可能图像识别更简单直接,但要到具体的应用场景,各有各的优势,就如我开头说的那样,每种技术手段都有产品在尝试,但使用场景和范围还需要探索。