学姐记忆面包114——大数据在应用中存在的问题(5)
2022/11/1 13:35:56 阅读:199 发布者:
海量数据带来的风险是处处都是假规律(黄金时代电影)
数据量的增大,会带来规律的丧失和严重失真。数据量的大幅增加会造成结果的不准确,一些错误的数据会混进数据库,”此外,大数据的另外一层定义,多样性,即来源不同的各种信息混杂在一起会加大数据的混乱程度,统计学者和计算机科学家指出,巨量数据集和细颗粒度的测量会导致出现“错误发现”的风险增加。(水军的存在、互联网用户行为的捕捉不能用非结构数据进行测量、调查对象互联网行为和现实行为也存在差异等)
抽样分析+全数据验证的分析思路。没有抽样的拟合,直接面对大数据,将使我们失去对人的了解,对真实规律的追寻。
转自:“新传记忆面包”微信公众号
如有侵权,请联系本站删除!