当前位置:数字报首页>经济导报>评论 A4

“大数据”时代未知也是一种美好

  • 日期:20140905
  • 作者:
  • 来源:经济导报
  • 查看PDF版 查看PDF版
    BigData——大数据,无疑是近年来互联网上的热词。越来越多企业开始热衷大数据,我们也享受着大数据带来的便利。在网上冲浪时,我们总能看到切中自己兴趣的产品推荐;打开一个网页,网页中的广告是近期有购买计划的产品;在网站上搜索,返回的搜索页面有很多有价值的“相关推荐”……在我们根本未意识到时,智能设备便处于联网之中,相关数据被悄然发送到第三方。这一切的背后,是网络服务商对用户的上网行为进行深度分析的结果,这都离不开大数据的技术支持。然而,大数据带来方便快捷的同时,其弱点也逐渐凸显,那就是越来越为人所关注的隐私问题。通过数据挖掘,人类所表现出的数据整合与控制力量远超以往。1995年,欧盟出台的隐私法例将“个人资料 ” 定义为可以直接或间接识别一个人的信息。很显然,当时立法者考虑的是那些带有身份标识号的文件资料等。如今,“个人资料 ”这一定义所包含的内容已经远远超出当年那些立法官员的想象,甚至可以轻易地超过19年前他们通过这项法例时整个世界的数据量。这期间到底发生了什么?首先,这个世界每年所创造的数据量在以指数形式增长,去年,这一数字则达到了2.8ZB,听起来就很可怕的数字,而且据知名信息行业咨询服务商IDC 称,这一数字将在2015年翻一番。其次,这些数据中的3/4是由个体人在创造或移动数字文件时贡献的。举例来说,一个标准的美国上班族每年可以贡献180万MB的数据量。尽管这其中的大部分数据都是不可见的,似乎也并不携带任何个人信息,但事实并非如此。现代数据科学已经发现几乎任何类型的数据都能用来识别创造它的人,每一个现实中的人在信息世界总能被刻画出来。毫无疑问,可以获得的个人数据量越多,其中的信息量就越大。只要拥有了足够多的数据,我们甚至可能发现有关于一个人的未来信息。去年,来自美国罗彻斯特大学的亚当·萨迪克和来自微软实验室的工程师约翰·克拉姆发现他们可以大致预测一个人未来可能到达的位置,最多可以预测到80周后,其准确度高达80%。为此,他们收集了32000天里307个人和396辆车的GPS数据并建造了一个“大规模数据集”。两人想象了一下这一研究成果的商业应用,他们说到时候会出现这样的广告:“需要理发吗?4天后你就会在这家发廊周围100米内,届时它将会有优惠活动哦!”大数据带来了很多便利,影响决策,也改变了生活。但大数据分析和应用,有时候往往偏离了其精神实质。人类不是机器,生活有时候并不需要十分精确,未知也是一种美好。(魏晓静鞠峰)