投稿问答最小化  关闭

万维书刊APP下载

学姐记忆面包114——大数据在应用中存在的问题(5)

2022/11/1 13:35:56  阅读:199 发布者:

海量数据带来的风险是处处都是假规律(黄金时代电影)

数据量的增大,会带来规律的丧失和严重失真。数据量的大幅增加会造成结果的不准确,一些错误的数据会混进数据库,”此外,大数据的另外一层定义,多样性,即来源不同的各种信息混杂在一起会加大数据的混乱程度,统计学者和计算机科学家指出,巨量数据集和细颗粒度的测量会导致出现“错误发现”的风险增加。(水军的存在、互联网用户行为的捕捉不能用非结构数据进行测量、调查对象互联网行为和现实行为也存在差异等)

抽样分析+全数据验证的分析思路。没有抽样的拟合,直接面对大数据,将使我们失去对人的了解,对真实规律的追寻。

转自:新传记忆面包”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com