投稿问答最小化  关闭

编辑是怎么通过Graphpad知道你的数据造假的?

2022/7/13 13:31:52  阅读:892 发布者:

背景介绍

本文是一篇发表在CNKI上的论文,比较有意义,因此给大家推荐一下!参考文献见文末!

数据审核是医学论文审稿流程的重要环节 ,可以保障论文质量且有效防范学术不端。GraphPad Prism 是一款既可以进行科学绘图 ,又能对数据进行统计分析的科研工具软件 ,可以帮助编辑对稿件中的统计结果进行验证 ,提高审核效率及准确性。文章通过 3 个案例 ,介绍 GraphPad Prism 软件的使用方法及技巧 ,期望能为编辑的数据审核工作提供一定的帮助。

实际案例

两独立样本均数的 t 检验

例: 该文作者收集其医院收治的 171 例心梗患者 ,其中 146 例患者血尿酸值正常 ,25 例为高尿酸血症。所有患者经超声检测左室舒张末内径(LVEDD),结果显示 :血尿酸值正常的心 a 梗患者 LVEDD 为(49±9mm ;高尿酸血症的心梗患者LVEDD 为(52±11mm,两组比较差异有统计学意义(P 0.05)。

验证:在 ,编 LVEDD的均值相差并不大 ,对其是否真的具有统计学意义存疑。虽然稿件并未提供 LVEDD 的原始数值 ,应 用 GraphPad Prism 软 件 ,编 辑 仍 可 以利用文中提供的均数 ,标准差及样本量进行两样 本 均 数 的 t 检 验 ,从 而 对 统 计 结 果 进 行 验证。

操作:GraphPad Prism 软 件 操 作 如 下 :打 开 软件 ,在欢迎界面 New Table & Graph 选框中选择 Column → Enter and plot error values already calculated elsewhere → MeanSDN → Create,创建并进入数据表。录入数据后 ,在工具栏选择 Analyze → Column analyses → t tests and nonparametric tests→ OKParameters 对 话框中 ,可选择非配对的 t 检验(Unpaired t test. Assume both populations have the same SD)或方差不齐时的 t’检验(Unpaired t test with Welch’s correction. Do not assume equal SDs)。在不知道方差齐性的情况下 ,先选择 t 检验 ,点击 OK,即可生成统计结果表单。如果方差齐性检验的 P 0.05,说明两样本方差相等 ,表单中 t 检验有效 ;反之 ,则需返回到 Parameters 对话框 ,选择方差不齐时的 t’检验。

结论:本例两组方差齐次性检验的 P 0.05F test to compare variancesP 0.1560),且 t 检验的 P 0.1384,说明两组患者的 LVEDD 不具有统计学差异 ,文章的结果确实存在问题。之后编辑用同样的操作对文章的其他数据逐一进行检验,又发现多处 P值错误。编辑部经讨论,认为此稿件数据不可靠 ,结论不可信 ,给予退稿。

多样本均数比较的方差分析

例: 该文作者收集了医院收治的冠脉单支病变患者 100 例(单支组),冠脉双支病变患者 143例(双支组),冠脉三支病变患者 67 例(三支组),同期入院的冠脉正常病例 289 例(正常组),检测各组患者 24 小时平均收缩压(24hSBP),分别为(137.75±13.08mmHg,(143.83±9.91mmHg,(147.58±10.02mmHg,(127.78±16.15mmHg。作者认为冠状病变各组的 24hSBP 均显著高于正常组 ,且随着冠状动脉狭窄支数增加 ,24hSBP 逐渐增加(P 0.05)。

验证:统计学中 , 多样本均数比较应该使用方差分析 ,并要进行方差分析后的多重比较。文章中的统计方法部分仅描述为两组间比较采用 t 检验,而未有方差分析的描述。同时编辑注意到双支与三支病变组的均值相差较小。那么该文是统计方法描述不准确还是使用了错误的统计方法 ,双支与三支病变组的比较结果是否正确?编辑利用GraphPad Prism 对四组总体方差分析以及之后的多重比较进行了重新验算。

操作:GraphPad Prism 进行方差分析时 ,数据表创建及数据录入步骤与两独立样本均数的 t 检验一致。**Analyze 对话框选择 One -way ANOVAand nonparametric tests→ OKParameters 对话框中 ,Multiple Comparisons 选项卡→ compare the mean of each column with the mean of every other column Options 选项卡→ Fisher’s LSD test Experimental Design选 项 卡 → No matching or pairing → Yes. Use nonparametric test. → OK。生成的统计结果表单显示 :四组总体方差分析具有统计学差异 ,P0.0001 ;多重比较时 ,双支与三支病变组间差异没有统计学意义 ,P 0.0661。所以文章中随着冠状动脉狭窄支数增加 ,24hSBP 逐渐增加的表述是不合适的。多样本均数比较时 ,不进行方差分析 ,直接用 t 检验进行多组间的两两比较是作者经常犯的统计错误之一。

结论:编辑利用 GraphPad Prism,按照错误的方法进行 t 检验 ,结果显示 P 均< 0.05。此结果与作者的结果一致 ,由此编辑部推断作者是使用了错误的统计方法。后期编辑与作者沟通 ,要求其应用正确的统计方法重新计算 ,并对稿件中相应的结论进行了修正。

卡方检验

例: 该文作者收集病情相似的胃癌术后患者 ,按不同化疗方案分为 AB 两组 ,每组 79 例。经过2 年治疗后 ,A 组患者发生肺转移、骨转移及脑转移的例数分别为 2 例 ,0 例 ,1 例 ;B 组发生例数为 6 例 ,4 例 ,5 例。采用卡方检验 ,比较两组的转移情况 ,结果显示 :肺转移、骨转移、脑转移的Χ2 值分别为 6.2316.1356.988,而 P 值分别为0.0450.0450.042

验证:编辑在进行数据审核过程中对统计结果的正确性产生了质疑。例 3 AB 两组患者肺转移、骨转移、脑转移情况比较实为三个独立的四格表资料。卡方界值表中 ,Χ2 0.051 3.84Χ2 0.011 6.63,这是统计学习中通常会被要求记忆的临界值。四格表资料的卡方检验 ,自由度均为 1,当 Χ23.84 时 ,则 P 0.05,当 Χ2 6.63 时 ,则 P0.01。文章脑转移项结果显示 ,Χ2 6.988大于临界值 6.63,而对应的 P 0.042,远远大于0.01,这明显是错误的。同时肺转移及骨转移项中的 Χ2 值接近 6.63,但 P 值却接近 0.05,也明显不符合数学规律。

操作:故编辑应用 GraphPad Prism 对表格中的结果依次进行了验证。以肺转移项为例 ,打开软件 ,在欢迎界面 New Table & Graph 选框中选 择 Contingency → Start with an empty data table → Create,建立并进入数据表。录入数据后 ,在 工 具 栏 选 择 Analyze → Chi-squareand Fisher’s exacttest → OK

结论:统计结果单显示 Χ2 1.185P 0.276,这与文章中的数据相差较大且结论相反。骨转移及脑转移项的结果经验证也是同样的情况。最终编辑部以文章的数据不可信给予了退稿。

注意事项:

论文数据审核时 ,编辑会从资料表达方式是否恰当 ,统计学方法的选择及数值计算是否正确等方面进行审核。

只有正态分布的计量资料采才能用均数 ± 标准差表达 ,非正态分布的计量资料采用中位数和四分位数值表达 ,计数资料采用率或构成比的形式表达。

医学论文中常出现的两样本及多样本的比较 ,应根据资料的特征 ,选择相应的参数或非参数检验方法 ,然后应用统计软件可以对统计过程进行验算 ,判断文中数值正确与否。

不同特征的数据资料适用不同的检验公式 ,而同一组数据使用校正与未校正的公式得到的结论可能完全相反。

通常来说 ,卡方检验需要满足样本量(n≥ 40 且理论频数(T≥ 5 的条件 ;若 n ≥ 40 1 ≤ T 5,使用 Yates 校正公式 ;若 n40T1,使用 Fisher确切概率法。

参考文献

[1] 关珠珠,李雅楠,郭锦秋.GraphPad Prism软件在医学论文数据审核中的应用[J].科技传播,2021,13(05):118-120.

转自:小杜聊科研

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com