中华生物医学工程杂志, 2022,28(2) 王心旺.
本讲概述医学科研设计的学术定义、基本要素、基本原则、基本原理和研究案例。
01
医学科研设计的学术定义
钟南山院士在其主编的《医学科研设计》一书中为医学科研设计所下的定义为:医学科研设计是运用科学的、专业的和艺术的思维方法对医学所研究的问题进行决策和规划的过程[]。这个定义中的科学思维方法一般包含排序(对研究问题优先次序的安排顺序)、机遇与推论(对研究信息达到需求阈值的时机把握并及时提炼总结出研究结论)、概率(对研究中的各类随机事件发生的可能性均用概率来测量)、假设(是关于研究课题所涉及各类研究变量之间数量关系的推测或提议,或称猜想、设想、命题;又可在统计学术语中称为等式、方程、函数、模型)。应用这些科学思维方法再结合专业思维方法和艺术思维方法就能够设计出所需要的医学科研方案。
02
医学科研设计的基本要素
医学科学研究设计的研究对象是设计中所涉及的问题、变量、假设和研究方法。受试对象、处理因素、试验效应是医学科研设计的三大基本要素。通常把客观性观察指标作为试验效应的度量指标,一般分为计量指标(如平均数、标准差、相关系数)和计数指标(如频率指标、率的标准差)两大类。
03
医学科研设计的基本原则
对照、随机、均衡、重复是医学科研设计的四项基本原则。没有对照就没有统计。对照的目的在于显示处理的效应。常用的对照方法有实验对照、标准对照、自身对照、相互对照、安慰剂对照。没有随机化就没有统计。随机化是针对大量的、不可控制的非处理因素(如研究病例的遗传特性和生活方式等)所采取的应对措施。常用的随机化方法有完全随机化、分层随机化、整群随机化、阶段随机化。没有均衡就没有统计。均衡是针对重要的、可控制的非处理因素(如研究病例的性别、年龄等)所采取的应对措施。常用的均衡化方法有交叉均衡和分层均衡。没有重复就没有统计。重复一般是指样本量的大小。足够的样本量可以产生足够的统计功效。满足医学科研设计原则中重复性要求的方法是进行样本量的估算。具体的估算方法要根据预先设定的检验水准α、检验效能1-β、容许误差δ、统计学检验的目的(优效、等效、非劣效),并参照相应的公式来估算。
下面,我们以样本均数与总体均数比较这种研究场合中的样本量计算方法为例进行讨论。
在文献查新或预试验的基础上,已知样本标准差S=2.5,设定为单侧检验(优效),检验水准α=0.05,检验效能1-β=0.9,容许误差δ=|μ1-μ2|=1,Zα=Z0.05=1.6449,Zβ=Z0.1=1.2816。
首先进行样本量的预估,以正态分布曲线下α和β的对应正态界值Zα=Z0.05=1.6449,Zβ=Z0.1=1.2816代入以下样本量的预估公式:
然后再进行样本量的确切估计。根据t值分布表,查找n=53所对应的t0.05,53=1.6759,t0.1,53=1.2987,则代入以下样本量的确切估计公式:
这样,就可得到单一样本量的精确估计值为55例。在医学科研实践中,为防止研究对象的脱落,一般还要考虑增加20%的样本量设计冗余,如本例,可将最终的样本量确定为55+55×20%=66例。
为了方便叙述,我们把10种研究场合的样本量计算公式总结于表1。
表110种研究场合的样本量计算公式
当然,在实际应用中,我们可以借助EXCEL统计分析模板[](由武汉大学健康学院宇传华教授研制)和专业软件(PASS软件,网址:https://www.ncss.com/software/pass/)以及在线计算样本量工具(网址:http://www.powerandsamplesize.com/),更方便地计算出各种研究场合下的样本量。
04
医学科研设计的基本原理
医学科研设计的基本原理就是采用定量分析的方法通过试验对照来比较出试验组的处理因素(干预措施等)所产生的效果。
试验组的效应值=T1+E1;对照组的效应值=T2+E2。
我们可以通过合理的设计(如随机对照试验设计),使得两组的非实验条件均衡,从而使E1=E2,这样,两组的效应值之差就能反映两组处理因素的效果差异:T1-T2=Td有差别才能鉴别。可用统计推断方法(如两个独立样本均数之间差异比较的t检验、多个独立样本均数之间差异比较的方差分析、两个或多个独立样本率之间差异比较的卡方检验)鉴别之。
05
医学科研设计的案例介绍
5.1 研究课题
输精管切除术与动脉粥样硬化疾病的相关性研究[2]。
5.2 研究问题的描述
(1)输精管切除术是否与动脉粥样硬化疾病有关?(2)如果存在联系,与其他已知的危险因素相比,输精管切除术的相对重要性有多大?(3)哪些男性亚群在输精管切除术以后发生动脉粥样硬化疾病的可能性特别大?
5.3 研究目的
5.3.1 一般目的
确定输精管切除术与其后因动脉粥样硬化疾病而住院之间是否有因果联系;如果有,则确定输精管切除术与患动脉粥样硬化性疾病的危险性是否因观察对象具有其他冠心病危险因素,如吸烟、高血压和高胆固醇等而增强。
5.3.2 特殊目的
(1)估计输精管切除术及其男性动脉粥样硬化性疾病危险因素的相对危险度;(2)估计输精管切除术对动脉粥样硬化性疾病独立的作用;(3)检测输精管切除术导致动脉粥样硬化性疾病的可能期限;(4)检测在输精管切除术、吸烟和高血压之间可能的协同作用。
5.4 研究变量
(1)按照世界卫生组织标准来诊断动脉粥样硬化性疾病;(2)患者特征:年龄、出生日期、宗教、教育、职业、家庭史、婚姻状况;(3)生育史:存活子女的数量与性别、妻子的生育情况;(4)生活方式:吸烟习惯、饮酒量、饮食习惯、食盐量、喝咖啡量、体力活动;(5)医学史:有无可能导致不育的疾病或手术、高血压、糖尿病或高胆固醇血症。
5.5 研究假设
输精管切除术与动脉粥样硬化疾病之间有密切相关性联系。
5.6 研究方法
(1)随机对照试验;(2)Logistic回归方法。
5.7 研究设计
5.7.1 抽样
以完全随机抽样方式确定样本。样本量大小的计算是基于事先确定显著性水平、把握度和打算测知的相对危险度水平。假定样本量确定为病例组500例,对照组1000例。本设计力图避免或减少在病例一对照研究中常见的偏倚与误差。回忆偏倚、选择偏倚和输精管切除术报告偏倚对研究结果的真实性是极其重要的。
5.7.2 资料收集
(1)病例组的选取:调查员审阅每日住院患者情况→如果诊断适合研究的范围,将病例转给心脏病主任医师作评估→由他做出病例诊断是否合格的决定→调查人员核对患者背景资料是否合格→如果患者满足诊断标椎和背景资料合格→调查人员开始询问并填写调查表→每完成5个病例和10个配对对照以后,请研究中心的工作人员对调查表进行评估→重复以上步骤。(2)对照组的选取:调查人员评估入院单并选择符合配对标椎和入院诊断合适的对照病例→核对患者背景资料是否符合入院标准→如对照组成员合格,则进行调查。
5.7.3 统计分析
(1)计算未校正的相对危险比(OR)与95%可信限范围,以此估计输精管切除术和其他危险因素的相对危险度。(2)利用配对的条件Logistic回归模型计算校正相对危险比,用来评价输精管切除术对动脉粥样硬化的独立影响。(3)利用动脉粥样硬化作为因变量,输精管切除术后间隔时间作为自变量,用条件Logistic回归模型来检验输精管切除术后时间长短对发生动脉粥样硬化的时间效应。
转自:“医学科研与管理空间”微信公众号
如有侵权,请联系本站删除!