学姐记忆面包110——大数据在应用中存在的问题(1)
2022/10/18 17:32:12 阅读:238 发布者:
用户隐私问题
社会化媒体、移动终端等新媒体应用刺激了个体数据的生成,数据成为了个体的映射和化身。从信息技术的角度看,任何数字化的信息都是数据。这样一种数据化,也使得个体暴露在更多的风险中。其中之一便是用户的隐私被置于更大的风险之中,在大数据运用过程中如何保障用户隐私成为当下最重要的议题之一。
案例: Facebook 1.2亿用户数据面临泄露风险
案例:每天 Facebook 上需要处理的数据:
1. 25 亿 Facebook 上分享的内容条数 ;
2. 27 亿“赞”的数量 ;
3. 3 亿上传照片数 ;
4. 500+TB 新产生的数据 ;
5. 105TB 每半小时通过 Hive 扫描的数据 ;
6. 100+PB(1PB=1024TB) 单个 HDFS(分布式文件系统)集群中的磁盘容量。
Facebook 的 工 程 总 监 Parikh 解 释 了 这 些 数 据 对 于Facebook 的意义 :“大数据的意义在于真正对你的生意有内在的洞见。如果你不能好好利用自己收集到的数据,那你只是空有一堆数据而已,不叫大数据。”目前 Facebook 有着世界最大的分布式文件系统,单个集群中的数据存储量就超过 100PB。在 Facebook 内部,从一开始就没有在不同的部门之间(比如广告部和用户支持部)设立障碍或者分割数据。这样一来产品开发者就可以跨部门获得数据,实时知晓最近的改动是否增加了用户浏览时间或者促成了更多的广告点击。
转自:“新传记忆面包”微信公众号
如有侵权,请联系本站删除!