科研中的“数据修改”,很多时候并不是黑白分明的事。一边是严谨、真实的科研伦理,一边是实验的不确定性、设备的小误差、数据的“不可描述”……
那我们到底该怎么判断,哪些数据“可以修”,哪些“动都不能动”?别慌,我们从三个维度说清楚:
PART. 1
动手改数据≠科研造假,
但要有清晰边界
我们先说结论:不是所有的数据调整都等于造假,但有些修改一旦越界,就会直接影响您科研的诚信底线。
可以接受的修改一般是这样的:
· 数据格式处理:比如单位换算、小数位统一、异常值排查(前提是您说清楚筛选标准)。
· 仪器误差修正:有些设备本身会存在偏差,只要修正有依据,是可以的。
· 合理的统计处理:比如log转换、正态化处理、去除已知错误数据点等,只要保留原始数据并说明处理过程,是允许的。
而绝对不能接受的,是这些:
· 人为编造数据点,比如复制、杜撰不存在的实验。
· 删除不利于假设的数据点,只保留“好看”的部分。
· 篡改测量结果,为了凑显著性p值而调数据。
一句话:不能为了得到您想要的结论而“创作”数据。不然就从“科研”变成了“文学创作”了。
PART. 2
“合理修改”的前提:
您得能说明原因+过程可追溯
有些同学以为“我只是Excel里动了个数字”、“只是扔了几个离群点”,问题不大。
但关键在于:改动了之后,还能不能对别人说清楚您为什么动、动了什么、动完后原始数据还在不在。
这就涉及两个基本原则:
1. 可复现:别人要能根据您的说明,重复您这个修改过程,得到一样的结果。
2. 可追踪:您得保留原始数据,写清楚为什么筛掉某个点、用了什么统计方法。
建议养成好习惯:
1.实验记录别只写结论,要写数据怎么来的;
2.原始数据、处理过的数据要分开保存;
3.如果您用了某种数据处理方法,一定要在文章中或附录中说清楚处理逻辑。
这样,就算将来审稿人、导师、甚至您自己都能回头理解当时是怎么处理的。
PART. 3
如果数据不好看,别忙着“改”,
先看看能不能“解释”
很多时候,我们不是不能接受“差数据”,而是不能接受“差数据毫无解释”。
数据不理想,可能是方法问题、控制变量不够、实验环境波动大、样本量太小……这些都可以分析。哪怕结论是:“目前的数据无法支持假设,需要进一步验证。”也比硬把数据修成“漂亮”的来得更可信。
您可以试试这些做法:
· 画图:看分布、趋势、离群点在哪里;
· 补实验:让样本更充足,看看是否存在系统性问题;
· 多角度验证:换个指标、换个模型,多条线索支持一个判断;
· 写进讨论部分:诚实说明数据存在偏差或局限,反而能提升可信度。
很多时候,审稿人最怕的不是“结果不好”,而是“您硬说它好却说不出为什么”。
科研不完美,但要诚实
科研从来不是“完美”的事。数据不理想很正常,问题是您怎么对待它。
修改数据不等于造假,但背着别人动手、动完不留痕、动了说不清,那就是科研诚信的雷区。
要相信:就算数据差,只要您能诚实、清晰地解释,也可以是一篇好论文的基础。而一篇看似漂亮但底子空的数据文章,才是真正危险的东西。
转自查尔斯沃思作者服务微信公众号,仅作学习交流,如有侵权,请联系本站删除!