1
缺乏合适的对照组
Absence of an adequate control condition/group
研究所针对的现象是否成立?成立的话规模如何?在缺乏对照组,或对照组规模不相当的研究中根本无法凸显实验组中操作的变向是否正确。
2
未经比较的分析
Interpreting comparisons between two effects
without directly comparing them
某现象可能在实验组中达显著,在对照组中未达显著,切记!这并不足以证明什么,不能把未经统计方法计算的任何数据当统计资料。
要证明在实验组中的某现象大于对照组的某现象,只能直接用统计方法来计算,例如ANOVA就是比较两个群组中的现象的统计方法。
3
夸大分析单位
Inflating the units of analysis
有时学者会为了达到信心度大的实验样本数而采取过小的单位,但是适当的样本单位才能促成正确的分析!
进行群组比较的时候,应该要在每一个样本都能比较某现象,而不是在同一样本上比较某现象。
4
伪相关
Spurious correlations
当一个变量出现一个或数个离群值时,就容易影响积矩相关系数,造成伪相关。其实散布图一看就很明显了。
5
样本数过小
Use of small samples
样本数过小容易使结果偏离常态分布,除非能提出先验效应值,或是能够复制试验结果,才能例外地接受小样本数。
6
循环分析
Circular analysis
循环分析就是从已经过整理分析的数据中再进行一次分析。最常见的做法就是分析过后去除离群值,再分析一次。
要避免循环分析必须先制定分析标准後进行分析,或永远使用新的一组数据。
7
P值黑客
Flexibility of analysis: p-hacking
操纵p值,也就是伪造数据。很不幸地,不少医学尤其是药物研究都传过这样的不端。
其实,同时呈现原始实验结果与测试性试验结果、预期性资料与非预期性资料就可以了。
8
多重比较未修正
Failing to correct for multiple comparisons
多重比较后应进行修正。学界对多重比较后应进行的修正有许多公开的讨论及标准,应该摊开所有变量,找寻适当地多种比较修正方法。
9
过度诠释非显著结果
Over-interpreting non-significant results
科研学者应公开效应值与p值,让其他研究人员权衡研究是否有继续发展的价值。
比如大样本数呈现非显著结果就是告诉其他研究人员大概不用再讨论下去了,但若是中样本数呈现非显著结果,或许还有其他实验的空间。
10
错把相关当因果
Correlation and Causation
这是运用统计方法时最常见的错误。科研学者必须把握的是,因果关系必须经过操弄变量来证明,最好能够加入第三个变量来证明因果关系。
转自英论阁Enago微信公众号,仅作学习交流,如有侵权,请联系本站删除!