当数据变得有价值
本报记者 陈宁 通讯员 张娜 张东
本报记者 陈宁 通讯员 张娜 张东
对数字在行?对数据着迷?那么你听到的是机遇的敲门声。
15年前的7月8日,全国科技名词审定委员会公布了第二批56个信息科技名词,其中“互联网的用户”的中文名称正式被确定为“网民”。而如今,这一群体的规模已经突破6亿大关。
数据,泄露每个人的过去、现在和将来——每一次的鼠标点击,通过IT企业的服务器,收集到电子邮件、视频和语音交谈、视频、照片等个人碎片化的数据,通过统计分析,还原并预测着你与这世界的一切关联。不止是讲故事,它们开始追逐商业价值了。
数据变得有价值
你知道吗?每年大年三十晚8点央视春晚准点播出的同时,央视咨询中心的电话访问员也开始了忙碌,迅速粗略计算出收视人数。
中国传媒大学电视与新闻学院教授沈浩解释,真正的收视率通过机器计算,每家每户机顶盒会实时记录下电视机的实时信号,卫星电视台把信号汇集到全国性的收视网,省级卫视的信号会由省网记录,而类似于这样的收视网遍布全国。
从概念上,它只是收视人群和目标人群之间的百分比。由此得出的数据高低并不是让主持人在节目里简单地告诉你一个数值,“它衍生出的市场份额将更为重要。”沈浩说,比如收视率会成为广告经营中不可替换的指标,再比如一个节目是否被更多人购买,收视率也将成为“硬道理”。“电视台统一货币”的形容也由此而来。
当收视率的市场价值被挖掘后,如同“索福瑞”这样的第三方机构才会成为不可或缺的“数据记录员”。
这只是万千有价值数据中的一个。一项针对青少年吸烟率的调查,能够成为健康机构、戒烟产品广告商很好的说辞;学术课题对首要污染物、空气指数的研究,能成为制定新政策的有效支撑。
数据变得很“大”
你打开购物网站,键入登录名,电脑会“贴心地”为你筛选好你可能喜欢的衣服或店铺;社交网站无时无刻不在为你推送你可能认识的人,并且将你喜欢的音乐、电影、书籍一一罗列,而时不时弹出的新闻框也“瞄准”了你更为关心的本地新闻,有时候你不得不佩服电脑的聪慧,居然把你分析地如此透彻。
能做到这一切的,当然不是电脑本身,而是数据挖掘技术的功劳。互联网的存在,固然使得点击率和浏览量的累计更加方便,比如2010年全球移动数据流量预测会直观告诉你,推特共有1.75亿用户,每天创建9500万条留言,Facebook每天在30万台服务器上整理35亿万字节的数据日志,YouTube每天上传168亿万字节的视频内容……
集结这些数据,经过专业团队的分析解读,使得这些“量”变成了一系列更富于价值的内涵——你喜欢什么?你的习惯是什么?你的需求在哪里?等等。这些用户的需求以及喜好,有利于商家推送更契合这些需求的讯息。
数据就此打破了简单的数字框架,成为对人更有价值的信息。“阿里巴巴有一支非常强大的数据挖掘团队。”浙江工商大学统计与数学学院教授陈钰芬说,这让淘宝购物从大海捞针式的筛查,变成了“一击即中”消费者的需求。苹果手机的上千万用户会逐渐明白,与他们对话的并不是所谓的“个人语音助理”,而是海量的网络信息——日期、地理位置、通讯录、天气预报、商家等等。
数据可靠吗?
“定性的结论,价值判断,数据都无能为力。” 当数据逐渐渗透于生活之后,也有越来越多人和沈浩的看法一致。
《纽约时报》专栏作者大卫·布鲁克斯就曾在《大数据不能做什么?》一文中,直指数据“六宗罪”,比如数据能够统计出参与社交网站的庞大人数,本身却无法具备社交的能力;又比如数据其实有失客观公正,而是构建在人的意志力和价值观之上……
“如果你希望人们相信某些非常愚蠢无趣的信息,你只需要在其中加入一个数字就可以了。”无独有偶,美国作家查尔斯·塞费在《数字是靠不住》的一书中,将某些数字描述为一种工具甚至一项骗局,在他看来,从官方到民间,从新闻媒体到商业战场,无不充斥着种种数字骗术。
陈钰芬就认为,对个体而言,大数据时代“有点可怕”。数据挖掘将你的各种信息暴露,它们在为你提供生活便利的同时也带给你烦恼——手机、邮箱、微博私信越来越多的垃圾信息。其实不能埋怨过多,你的兴趣、性别、年龄、住址已经被互联网如实记录。
或许沈浩说得对:“统计不说谎,数据不犯错,犯错的只有人。”
当然更多时候你并没有选择的权利,不可否认你每天的生活,都会这样开始——打开手机,微博推送消息告诉你,最新报告显示30年来癌症上升比例高得惊人,一项民意调查显示一群人对社会问题的看法;电视里,新闻台正在关注最新出炉的CPI,屏幕下方还滚动着上证指数;家门口的信箱,塞满超市、商场的传单,上面的折扣力度看起来很诱人……
你发现了吗?当数据变得有价值,生活也发生着不可逆转的改变。