- ·上一篇文章:专家:人工智能与人合作才能创造最大价值
- ·下一篇文章:最新报告:2016年转基因为全球农场带来182亿美元收益
大数据背后,是谁在监视我们的生活?
到的只是设备。比如我能看到一个在回龙观的安卓设备,早上9点去了望京晚上9点又回来了。他的轨迹我都知道,但是我并不知道他是谁。所以它又能匿名,又很精准。’一个不愿意署名的数据工程师说,要说有问题,是那些私下倒卖个人身份信息的黑市有问题,20块钱买一个人的征信报告,几百块钱就能买高净值人群打包数据,这些跟社会信息相关的是隐私,需要管。但是互联网公司收集的都是‘浅层信息’,这没关系。小乔曾经在一家以‘大数据分析’为主力业务的互联网公司工作,她的工作就是利用公司通过大数据得到的用户画像,组织线下营销活动。她说,自己并不那么担心习惯被人察觉,因为在她的经历里,好多都是‘忽悠人用的,又不准,怕什么’?特别是在北上广,每个人都那么不一样,用户画像根本行不通,也就在三四线城市,弄个噱头忽悠一下人。‘(我们)什么信息都能得到,但是没什么用,也懒得看。’一个不愿署名的程序员这样说,‘互联网公司让你感到害怕,只是因为你在App里,没有掩饰你是什么样的人,而App把这些看在眼里——你不会出柜,但会偷偷在淘宝上搜索润滑剂;你不会跟人说荤段子,但App上看到翘臀美女还是会点进去;你对外痛击侵犯版权,但看到四位数价格的正版软件,还是去搜了盗版的下载??’实实在在的人民币对于掌握海量用户数据的大公司,真实的人性画像等于钱,因为他们能找到非常精准的目标用户,比如商家想要卖一款针对5岁以下孩子的推车,他们就可以提供‘家里有5岁以下孩子、订单中却未发生过此类母婴商品购买行为’的用户群。他们将海量用户喜好、兴趣、习惯等数据组建成数据库,这样向品牌商和广告主推销:这些消费者数据也是一种资产,你知道他们习惯买什么、什么时候想买,它能如预知未来一样,直观看到未来可能收割的营业额,不是某种估计的指标或指数,而是‘实实在在的人民币’。这大概是广告主最喜欢的时代。Facebook曾推出一项行之有效的算法lookalike。比方说,一家公司想卖啤酒,它只需要提供100个曾经购买过这款酒的用户群体,数据会将它们视为种子用户,寻找和种子用户相似的另外500个人。他们有相似的兴趣爱好,相似的行为习惯,他们可能并没有买过啤酒,但是基于他们的行为特征相似性,该相似群体极有可能在推送后马上得到转化,买下这款啤酒。并非所有人都对这些‘隐私’的开放无感。武山在一家行业排名很高的互联网公司工作,利用大数据进行算法推荐。每天在工作的时候,他能够看到全体用户在App上的行为轨迹信息,包括电话、地址、搜索记录、每一屏交互行为等等。这是他的工作内容,可是他说,这也让他不安。‘虽然都说数据开放、数据开放,但还是觉得,这些数据真是太开放了,没有做好保护啊!比如内部员工可以查到用户在App上的行为习惯啊,还有App收集用户信息的时候,哪些该收集,哪些不该收集,在我看来也算隐私啊,应该有一些机制保护吧?’武山说,‘可我不知道有没有行业标准,现在我是全靠自律的。就是如果我想看,我随便都能看到啊!’据《财经》此前的报道,国内个人信息泄露数达55.3亿条,平均每个人有四条相关个人信息泄露,这些信息最终在黑市反复倒手,直至被榨干价值。其中,80%的数据泄露来自企业内鬼,黑客仅占20%。去年6月,广东苍南警方发布通报,有苹果公司国内员工涉嫌以非法手段获取苹果手机关联的个人信息,包括用户注册苹果账户时所填个人信息,涉案22人中有20人在苹果国内直销公司及苹果外包公司工作,每条以10元到180元不等的价格出售,非法倒卖个人信息至少20多万条。就在不久前,一名Facebook安全工程师被解雇,因为在网上搭讪女性的时候吹嘘,自己能够看到所有人的信息,‘我是一个专业的跟踪狂’。而一位豆瓣用户则发文称,与前男友分手后遭到持续跟踪骚扰,前男友利用某电商App登录漏洞,查到了她家人、闺蜜、朋友的姓名、住址、电话,可是即便经过投诉,最终也没有阻止跟踪狂的持续登录。现在,买东西需要填个注册表,或者下载新App后需要关联用户信息,都会让武山不舒服。他说,这可能是他的‘职业病’。在互联网上,韦思岸做过的最疯狂的人性实验,是关于自己的。从2006年开始,他主动将自己所有联系信息公布在自己的网站上。在那里,任何人都可以看到他的实时地址、电话、邮箱、行程、工作日程、即将搭乘的航班号及座位号。他公布了自己在旧金山和上海的住址,精确到楼层房间号。这和他的父亲的经历有关。韦思岸的父亲因为被诬陷是间谍,曾被强行关进监狱,坐了六年牢。后来,韦思岸查阅父亲的个人档案时,意外地发现,即便父亲出狱后,安全部还在持续监视他,还给身为儿子的自己建了档案,收集信息。这个经历极大影响了他的数据观,‘我们不能抱着一个天真浪漫的观点,还以为我们能够拥有隐私。我见过数据是怎么对待我的父亲的,我的父母曾经一度一无所有,我们不应该天真地以为,一切不会再重现。’‘我把联系方式放在网上,可要是让我公布我的搜索记录,我绝对不愿意。’他说,某种程度上来说,电话号或者住址并不是私密信息,你的朋友知道,你的同事也可能知道,但搜索记录中所透露出的个人喜好、习惯,则是非常私密的个人信息。一个安卓App开发者曾经试图跟女朋友解释自己近乎无所不能的工作:在App安装后,他能够获得大量授权,推断数据里的人群做什么工作、常去哪里、毕业于什么学校、有什么爱好、有没有结婚、有没有外遇、有没有房、有没有车、现在是外出度假还是在家呆着,甚至通过读取银行通知短信,推测实际收入。有时候为了客户需要,他还得推测人心,排除伪君子,比如如果手机里下载高端财经App,打开频率却几乎为零,那么这个人的标签要么是不小心下错了软件,要么就是‘比较装’??这些推测并不完全准确,也没有涉及身份信息,却已经让身为普通用户的女朋友感到冒犯,冲他大发脾气:‘你这人怎么这样?你为什么要看我们这么多数据啊?谁叫你拿这些授权的?是你老板逼你这么干的吗?’对抗在技术的世界里,边界是最难讨论清楚的话题。大部分公司都在反复强调,我们虽然收集大量数据,但是十分重视隐私,绝对不会泄露你的名字。事实上,许多大公司的确是这样做的,它们内部有非常严格的数据保护措施,比如微信有比较复杂的ID体系,系统内部有用户的唯一ID标识,但是第三方开发者不能获得
大数据背后,是谁在监视我们的生活?