当前位置:K88软件开发文章中心办公应用办公应用21 → 文章内容

大数据背后,是谁在监视我们的生活?

减小字体 增大字体 作者:华军  来源:华军资讯  发布时间:2019-3-10 1:18:05

这个唯一ID,即便是同一个用户,在不同公众号下被第三方开发者收集到的ID都是完全不一样的,这样就完全阻止公众号之间用户数据的随意买卖交易。负责用户挖掘的微信斑马系统只支持一万人以上的人群画像分析,从而实现‘分析一群人而不分析一个人’,而在分析过程中也会主动控制精度,比如分析用户住址时,只定位到小区,不再基于气压传感器定位高度,做楼栋和楼层的定位。在一次媒体采访会上,阿里巴巴的一个技术负责人说:‘数据肯定是往越来越严控的方向发展,我们采集信息的目的,其实还是为了更好地提升用户体验,所以一个基本原则是,这些信息的获取要从提升产品的角度出发。’比如对有的App来说,获取WIFI信息是为了挖掘用户社交关系,这让人感觉越界,但是对金融、支付类的App来说,知道WIFI地址可以快速判断这是不是用户常用地址,这笔交易有没有可能是盗刷,它能有效防范资金风险。不过,虽然花了两个小时反复解释现有隐私保护如何严格,临走的时候,他还是忍不住补了一句:‘不过啊,最近网上那种做个心理测试啊,点进图片生成自己的照片啊那种,我劝大家还是不要点了,那种背后一般都存在很大的信息收集的。’这种看似无害的休闲App可能不会直接窃取手机号、身份证号等身份信息,但就在点击授权、进入游戏的那一瞬间,它很容易完全获得你的社交关系和网络行为习惯。今年3月份,Facebook被爆隐私丑闻,存在影响8700万人的严重数据隐私滥用,这些数据包括用户的社交关系、兴趣偏好、点赞记录等个人信息,而这一切就是从类似的心理测试开始的。剑桥分析公司通过左右这些用户在Facebook收到的推送,影响他们在美国大选中对候选人的态度,最终帮助特朗普当选,这些数据也‘不知道被复制了多少次’,甚至有可能存储在俄罗斯。并不是没有技术办法对抗这样的数据危机。在英国,有专门保护个人隐私的公共机构,直接向英国国会报告。它提出了数据管理者登记制度,要求每个处理个人信息的机构都要在信息专员办公室登记,否则就算为刑事犯罪。很多公司也有谨慎的数据使用哲学。谷歌会把用户的姓名、账号、联系方式、地址等信息,与行为数据完全分开,不会将两者关联使用。而雅虎会有专门的研究员,在实践中界定数据搜集的隐私边界。许多数据科学家将自己设计的隐私保护对策详细公布在论文中,有人将分散信息流控制和差分隐私保护技术应用到云计算,还有人通过模糊处理(obfuscation)技术对用户隐私全程加密,另一种有效的操作方法是制造噪声,根据用户历史记录制造等比例的行为噪音,这样试图解读用户行为的服务商就很难辨别哪个是用户真实需求,哪个是系统制造的噪音,从而保护用户真实的隐私。但是,在真实的大数据前线,还轮不上这些对策上场,仗已经败了。技术理想的敌人其实比想象中更原始——严谨规则背后,不讲规则的人。程路从美国留学回来后,在国内一家交友类社交平台工作,负责大数据处理。运营的同事要做市场推广活动,要看用户数据,他想看用户最近在聊什么,然后根据用户喜好有针对性地开展活动。‘理论上讲,这也是业务需求,他想抽样,我也不介意。’程路说,聊天记录经过加密处理,他很快做了抽样,断裂可追溯信息,对用户信息做了脱敏。但是运营同事不愿意,他要求看全量数据。全量数据是什么概念?它是一个用户在App上的所有数据,能够非常精准地描述用户,他的身份背景、兴趣爱好、行为习惯,甚至每天的喜怒哀乐,都能从行为痕迹里推测出来,但是这是对隐私的极大挑战。程路试着跟对方解释,只是做市场推广的话,使用脱敏后的抽样样本就可以了,没有必要查看全量数据。但意外的是,这个提议没有得到理解。运营的人不同意,公司CTO不同意,连CEO也不同意。他的一个同行说,‘我挺惊讶的,做这一行的还有这种想法。’而另一个同行评价他,‘心态这么不稳,怎么在中国生活?如果知道自己的房子、车子、保险、信用卡、婚恋、酒店入住、户籍信息、工作信息等等全部真实的信息每天都在各个公司的销售那里买卖转手百来次,你还会有什么感想?毫无心理波动。’可是,这对程路来说,违背了自己的技术理想。‘这就好像借着你的手,把别人的日记挨页翻给人看一样。’他反问,‘要是你的日记,你愿意吗?’最后,决定数据命运的是来自CEO轻描淡写的评论,‘这有啥啊,你就给他呗!’程路把全量数据给了业务部门,同一个礼拜,他辞职了,‘一半的原因是这件事吧,道不同了。’在这里,他还时不时要面对数据交易,会有大公司的销售人员拿着报价表找他谈合作,表单上每一类用户群体都有一个大概标价,爱旅游的、每天点外卖的、打游戏时长每天超过4小时的,每一个群体都有一批相对应的广告主喜欢。所以,只要细化出了用户特征,就能有机会把它卖钱,这是一笔大生意,但这让他感到很不舒服。现在,他在一家外资游戏公司,选择新工作有很多理由,其中一个考虑,现在的大环境里很难找到一个不越界的公司,那就找个没那么强烈想要收集社交数据的地方。他说,这样工作起来心里会舒服点。韦思岸说,对抗隐私危机,最有效的办法只有严惩。‘我们不能天真地期待数据公司能够有足够的自我驱动力,替我们维护数据中的隐私部分。对这些公司而言,惩罚是它们唯一听得懂的语言。’数据未来我们正在面对的数据未来是,人或许比想象中更容易预测,而算法可能比我们更了解世界。2008年9月15日,美国雷曼兄弟公司宣告破产,引发次贷危机,而最早察觉到这件事的是Linkedin的数据科学家。他们注意到,9月14日明明是一个周末,网站数据却十分活跃,不断有人疯狂联系工作、更新简历、发送消息,而所有这些行为都来自雷曼兄弟的员工。随着技术优化,现在甚至不需要成为专业人士,就能洞察真相。就在今年初,使用健身记录软件Strava的用户发现,仔细查看App所提供的跑步热力图,能轻易推测出美军驻阿富汗军事基地的具体位置。因为它会实时追踪用户位置数据,以高亮形式呈现在地图上,而在当地用户很少的战乱地区,每天集体跑步的美国士兵在热力图上圈出了异常明显的行动路线,基地位置、出勤时间、巡逻路线在图上一目了然。2012年,美国罗彻斯特大学教授亚当·萨迪克(Adam Sadilek)和微软实验室的工程师约翰·克拉姆(John Krumm)共同发布了他们的研究,‘如今已有大量研究能够预测人的未来行程,

上一页  [1] [2] [3] [4]  下一页


大数据背后,是谁在监视我们的生活?