当前位置:K88软件开发文章中心办公应用办公应用21 → 文章内容

大数据背后,是谁在监视我们的生活?

减小字体 增大字体 作者:华军  来源:华军资讯  发布时间:2019-3-10 1:18:05

一个安卓App开发者曾经试图跟女朋友解释自己近乎无所不能的工作:在App安装后,他能够获得大量授权,推断数据里的人群做什么工作、常去哪里、毕业于什么学校、有什么爱好、有没有结婚、有没有外遇、有没有房、有没有车、现在是外出度假还是在家待着,甚至通过读取银行通知短信,推测实际收入。有时候为了客户需要,他还得推测人心,排除伪君子,比如如果手机里下载高端财经App,打开频率却几乎为零,那么这个人的标签要么是不小心下错了软件,要么就是‘比较装’??来源:人物文丨李斐然编辑丨赵涵漠我们的故事北京城里有许多故事不为人所知,一个最容易被人忽视的真相是,在这里,总有人比你更了解自己。周一早高峰时间挤在地铁里刷财经新闻的一些人,会在周五下班路上收到系统为他们推送的八卦新闻,因为算法知道这是他们此刻最想看到的内容。做人脸识别的公司知道我们每天晚上什么时间卸妆,什么时候敷面膜,周末早上赖床到几点,因为在这些时候,人脸识别通过率会骤然变低。在真实世界里,性别只分男和女,但是原阿里巴巴集团副总裁车品觉说,阿里巴巴曾经就有18个性别标签,它知道有些账号白天是男性用户持有,而晚上使用的却是女性。判断依据是用户资料、浏览商品类目、对话使用称谓,以及那些我们自己或许都未曾察觉的访问习惯——点击屏幕的轻重,经常输错的错别字,在浏览器窗口是喜欢在新窗口打开、还是反复使用前进后退键,正是它们告诉机器,此刻对着屏幕滑动商品页面的究竟是谁。大数据里的我们,拥有异常真实的群体画像。因为我们在面对手机的时候非常诚实,永远对它说真话。世界上知道这些秘密的只有你,和机器另一端的数据科学家。在机器语言里,我们不止是一个名字、一个地址、一串设备识别符。它每秒钟监测超过400个变量,记录每一个行为轨迹。今年57岁的韦思岸(AndreasWeigend)知道无数这样的故事。他出生在德国,原本在赫赫有名的欧洲粒子物理研究所(CERN)研究上帝粒子,但在2002年,他选择投身大数据世界,成为了亚马逊首席科学家,后来他曾任阿里巴巴数据顾问、人人网早期外部投资人,也曾为摩根大通、汤森路透、沃尔玛、AT&T等机构提供数据咨询。他教会机器一个理解人类的方法是:获知一个用户地址后,还要抓取这个地址周围5公里内的书店分布状况,因为这决定了用户有多大概率在亚马逊买书、会在什么情况下买书。这条准则后来被应用到了阿里巴巴的数据分析实践,所以当淘宝知道你家5分钟步行路程内有超市的时候,它就不会频繁向你推荐油盐酱醋,但是它看到你的搜索记录,获知你皮肤敏感,而15分钟路程内的商场都没有你习惯用的护肤品,那么,这些商品将会出现在你的屏幕上。韦思岸将数据分析师每天的工作形容为‘人性实验’,就像科学家通过实验探索物质的本质,数据分析师通过程序研究人的行为特征。技术改变了人的物理概念。定义我们的不仅仅是账户和密码,还有我们的爱好、情绪、行为习惯。不管我们在互联网上如何伪装,换新的名字、新的头像,机器总能轻易识破。数据记录下的习惯,是我们的另一个身份定义。这些故事让他兴奋,同时让他感到不安,韦思岸告诉《人物》,‘我能看到最近十几年我们的生活因为技术发生了颠覆性变革。但是它真的让我们变得更自在吗?我没有答案。’在数据的世界里,我们面对手机的每一个举动,都在成为机器学习的材料,训练人工智能更加理解人性。曾经那些高深玄奥的人生命题——我们是谁?好朋友意味着什么?我们将会选择什么样的生活——这些答案都可以从搜索记录、社交网络的聊天记录和手机传感器里找到。截止2018年第一季度,超过10亿人每月使用微信及WeChat,6.17亿人在淘宝购物,全国搜索引擎用户达6.4亿,他们时刻创造新的海量数据,也在被勾画着异常精准的群体画像,机器在一步步接近一张清晰的人性图景。数据是这个时代最特别的商品,它的产生几乎毫无成本,却造就了无数科技独角兽、日渐强大的上市公司,以及数以亿计的产业利益。大数据日渐了解我们,但是很少人知道,我们所做的事情会让我们成为广告主的商品、被人剖析个性的样本、掌握我们的一举一动,甚至能预测我们的未来轨迹。‘隐私’不止一位数据科学家确信,隐私已经是一件‘算法上不成立’的事件。我们知道自己在分享数据,但是大部分人并不知道,自己正在分享些什么,更不知道,这种分享将会意味着什么。听一个分析师讲述数据挖掘过程,就像是见证了一场悬疑推理,唯独这一次,福尔摩斯活在大数据里。一切从手机App安装软件中的SDK开始,这是一个搭载在App中的软件开发工具包,其中嵌入了统计分析工具,实时收集用户信息。当然,这是经过你授权同意的,就在你可能从来没有认真读完的用户协议里。从App下载到手机那一刻起,揣测人生的尝试就开始了。仅仅是安装过程中所抓取的硬件设备信息,App已经对你有了一个大概印象——如果一台手机一个月内有10次连接同一个星巴克的WIFI,20次连接同一个定位在写字楼的公共区域WIFI,30次连接一个家庭WIFI,再算上这些WIFI的地理位置,以及WIFI名里的关键词,那么,一条几近清晰的生活——工作的路线轨迹,get。在学者的论文里,这被形容为一个‘数据失控’的时代,没有人能控制自己的数据,我们的数据时刻被人监视。不过,实际经手数据的人并没有这种感觉。人们担忧自己的个人信息泄露,比如姓名、电话、地址。在业界,工程师给隐私下过一个最简单的定义——隐私,就是那些不允许自由流动的数据,比如被法律禁止交易的身份证号、个人征信、医疗记录,它们只能固定储存,不允许随意读取。事实上,现在App收集信息也确实越来越受到限制,比如IOS10以后的系统已经禁止读取许多设备硬件信息,安卓系统也在逐步限制软件能够获取的用户信息范围。不过对公司来说,以上这些信息固然重要,但更值钱的是另一些数据——你的喜好、兴趣、生活方式、行为习惯——而这些数据在很多人的概念里,还不属于隐私。‘大数据能做很多事情,通过合理分析解释世界。最好的事是,这些东西完全不触及隐私。’大河在一家公司的数据相关部门工作,她认为,隐私是法律明令禁止收集和交易的身份证号、手机号、户籍地址等个人身份信息,而她的工作完美避开了它们。‘刚刚分析的这些画像,我根本不知道他是谁,我看

[1] [2] [3] [4]  下一页


大数据背后,是谁在监视我们的生活?