空中有朵“数据云”
青稞人物:程学旗 中国科学院计算技术研究所研 究员
车品觉 阿里集团数据委员会会长
大卫·芬布雷 《大数据云图》作者
空中有朵“数据云”
本报记者 李光敏
走上云端 大胆预言
很难想象,当地球上不同角落的人们同时登陆同一个购物网站时,他们看到的页面并不完全相同。这是因为,你此前的每一次购物行为,都在互联网的世界里塑造了一个数据化的“你”。当你再一次登陆,店家会自动识别你的信息,像个老熟人一样,推荐你可能需要的商品。于是,网站有了“千人千面”的效果。
这是“天边的魔术师”——大数据给我们的生活带来的改变。
人们并非刚刚意识到数据的重要性。很多年前,航空公司就已经开始利用数据决定机票的价位,银行利用数据搞清楚该贷款给谁,信用卡公司则利用数据侦破信用卡诈骗。但直到最近,数据才真正成为我们日常生活的一部分。
《大数据云图》的作者大卫·芬布雷认为,Facebook和谷歌这两大公司的出现,从根本性上改变了大数据游戏:“任何一个享受这些服务的用户都生成了一条数据足迹,它能够反映出我们的行为。每次我们进行搜索,例如查找某个人或者访问某个网站,都加深了这条轨迹。”
除了存储搜索结果中出现的网站链接,谷歌还能存储人们所有的搜索行为,以惊人的洞察力掌握搜索行为的时间、内容以及它们是如何进行的。谷歌据此优化其广告,使之从网络流量中获益,甚至预测人们接下来会采取怎样的行动。“这种对大量的人机数据进行捕捉、存储和分析,并根据这些数据做出预测的能力,就是我们所说的大数据。” 大卫·芬布雷说。
当用户尚少时,要存储所有用户的数据足迹并不是什么难事。但随着用户数量激增,面对超过10亿的好友和1万亿的网页搜索量,这些公司不得不抓紧研发新技术来存储、分析数据。于是,一场被称为“大数据”的科技创新应运而生。
大卫·芬布雷介绍,互联网零售巨头亚马逊为大数据应用带来了革命性变化。亚马逊除了在产品推荐、网站测试等常规领域采用数据驱动的方法,其面向公众的“亚马逊网络服务”(AWS),更为企业开展大数据行动铺平了道路。有了它,大数据分析不再需要在IT上投入固定成本,获得数据、分析数据都能够在云端简单、迅速地完成。这使得企业无论规模大小,都有能力获取和分析大规模的数据——而在过去,它们很可能因为无法存储而不得不选择放弃。
《纽约时报》把2012年称为“大数据元年”。这一年,许多高端消费公司加大了对大数据的应用,Facebook、LinkedIn及Splunk等多家大数据企业完成了上市,与此同时,这些企业的商业用户也开始期待以一种同样便捷的方式来获得大数据的使用体验。
走下云端 谨慎务实
起源于大洋彼岸的大数据“风暴”席卷了整个世界,但在中国,人们足足花了一年时间才初步理解这场“风暴”的实质。
2013年底,中国科学院计算技术研究所研究员程学旗领衔中国计算机学会大数据专家委员会发布了《2014年大数据发展趋势预测》白皮书。“相比于2012年有关大数据的讨论只停留在概念层面,刚刚过去的2013年,无论是在应用还是技术方面,大数据都变得更‘务实’了。”程学旗说,国内一些生产领域已开始实实在在地落实大数据的价值,并探索大数据驱动的业务模式。
阿里集团数据委员会会长车品觉介绍,在淘宝业务中,以前只有广告、推荐会用到大数据,而现在,大数据无处不在。如果你认为淘宝上的某段页面文字只是碰巧出现的,那就错了。事实上,整个网站的布局、字体大小、颜色、按钮以及其他所有设计,都是经过多次测试后找出的转化率最高的方案。
金融大数据、企业大数据、健康医疗大数据、政府管理大数据和安全大数据成为了2013年的新热点。消费品企业试图利用大数据找出客户所需的商品,以此提高产品销量;医疗企业想借此提供更便捷、更定制化的医疗保健服务,政府则希望通过分析这些数据更好地管理城市,提供公共服务……
大数据的飞速发展使互联网企业纷纷把目光投向中国公有云市场。一方面,微软、IBM、亚马逊等国外巨头的公有云业务先后入华,另一方面,阿里、百度等国内企业也在部署公有云业务,激战在所难免,输赢前景难料,但可以肯定的是,越来越多原本有大数据意识却受制于成本的中小企业,将在大数据应用上有所作为。正如大卫·芬布雷所说,“改变”并不是指大数据从无到有,而是指它的规模和价格发生了变化。其力量所在,是不仅能收集和分析更多的数据,还能让更多的人以更低的价格受益于这些数据。
但大数据安全的问题也随之出现。个人的隐私越来越多地融入大数据中,而各种来源数据之间的无缝对接、越来越精准的数据挖掘技术,使得数据拥有者掌控了大量的信息和“秘密”。由于系统故障、黑客入侵、内部泄密等原因,数据泄漏随时可能发生,从而将造成难以预估的后果。虽然目前尚无较好的解决办法,但这一问题已经成为2013年全行业讨论的焦点。车品觉透露,阿里正致力于建一张数据地图,以保证数据安全隐患能及时“被看见”。
“如果一个公司有数据,却没有数据的文化,它是很难开展让更多人用数据的,所以大数据实际是一种态度。”在2013年年底的一个论坛上,车品觉提醒在座同行,“无线的数据越来越重要,当人们越来越多地通过移动端购买产品,或者用移动端和PC端共同完成一个购买动作的时候,数据可能会出现断裂。”
无线时代,大数据可能精确地关注到一个人在什么时候什么环境下做了一个购买决定。“移动端界面越来越小,用户做决定的时间也会越来越短,这就对推荐的精确度提出了更高要求。”车品觉认为,谁能最先解开移动端大数据的密码,谁就掌握了消费者的控制权。
追问一下
硅谷取代华尔街?
“硅谷的风险投资家们开始前赴后继地为大数据企业提供资金,这真是前所未有的状况。大数据将引发下一波重大转变,在这场转变中,硅谷有望在未来几年里取代华尔街。”大卫·芬布雷在他的新书中写道。
的确,华尔街正面临人才流失。无论是在哈佛、耶鲁还是普林斯顿,人才从金融流向科技公司趋势逐渐加强。对于那些激情满怀的年轻人来说,华尔街是天堂,但现在他们更喜爱和信任硅谷。
杰夫·哈默巴赫是一位哈佛数学天才,2006年,他离开华尔街投行贝尔斯登加入Facebook,成为Facebook最早搭建数据分析模型的人。通过对海量用户数据分析挖掘,他完成了Facebook CEO扎克伯格交给他的使命:弄清楚用户点击广告的动机和方式,这也为Facebook打开了高速盈利的阀门。
2008年,杰夫离开Facebook开始自己创业。谈到原因,他说了一句非常著名的话:“我们这一代人中最聪明的那些都在想着怎么让更多人点击广告,这简直糟糕透了。”现在,杰夫的公司正在帮助医生们找出“癌症患者都有哪些共同基因”,以提示有类似基因的人提前预防和治疗。
在不久后的将来,大数据应用程序可能让现在必须依靠手工执行的大量活动全部实现自动化,无论是为发布的博客寻找最佳读者还是开车去工作。在旧金山等城市,智能停车表可以汇报街道上是否还有停车位,司机通过简单易用的手机应用程序就能获得这些数据,有了它,人们也可以通过手机拨号或者使用移动应用来支付停车费。用《大数据时代》作者维克托·迈尔·舍恩伯格的话说,小到“以最合适价格和时机购买衣服”,大到“重要的经济决策中如何提高经济效益”,大数据都会告诉你如何做。