投稿问答最小化  关闭

万维书刊APP下载

学会 t 检验,从这一刻开始

2023/7/4 9:28:30  阅读:40 发布者:

以下文章来源于质量优势 ,作者柯学斌

包子变小的故事

某天蓝精灵们正在食堂吃早饭,吃着吃着,笨笨突然说:

「大家有没有觉得最近食堂的包子比以前小了?」

其它蓝精灵纷纷表示有同感,回想起来,最近天天早上没到十一点肚子就开始咕咕了。于是群情激昂的大家一起来到包子窗口质问格格巫:

「最近包子是不是做得比从前小了?」

格格巫一口否认,悠悠说道:「你们啊!too young too simple, sometimes naive!!手工做的包子,当然有大有小,包子的平均大小我可是一直按照食堂标准来的啊。」

蓝精灵们一时语塞,他们该用什么方法来揭穿格格巫呢?证明现在的包子不符合食堂标准中的平均大小要求?

这个方法就是我们今天要谈到的:T检验。

1.何为 t 检验?

亦称T student T检验(students T test),主要用于样本含量较小(N<30),总体标准差σ(总体标准差是反映研究总体内个体之间差异程度的一种统计指标,用σ表示)未知的正态分布(正态分布是一种概率分布)。

正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是遵从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )

T检验是1908年戈塞特(Gosset)位于都柏林的健力士酿酒厂担任统计学家,在Biometrika上公布T检验,但因其老板认为其为商业机密而被迫使用笔名“学生”。实际上,跟他合作过的统计学家是知道“学生”的真实身份是戈塞特。

为何叫T“检验,不叫”A”检验,“B”或“检验呢?

因为:T检验的对象是符合T分布特征的数据,T分布是三大分布(卡方分布,U分布)一种。

特征:

0为中心,左右对称的单峰分布。

T分布是一簇曲线,其形态变化与n(确切地说与自由度DF)大小有关。自由度DF越小,T分布曲线越低平;自由度DF越大,T分布曲线越接近标准正态分布(u分布)曲线。

随着自由度逐渐增大,T分布逐渐接近标准正态分布.

2.T检验用途及公式

T检验是用于小样本(样本容量小于30)的两个平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。

适用条件:

(1) 已知一个总体均数;

(2) 可得到一个样本均数及该样本标准差;

(3) 样本来自正态或近似正态总体。

T检验分为单样本检验和双样本检验。

单样本T检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。

当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计呈T分布(如果求出的平均数是由所研究对象全部数据求出的,就叫做总体平均数;如果是由样本求出的,就叫做样本平均数,可以用样本平均数去估算总体平均数)

单样本T检验统计量为:

双样本T检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。

双样本T检验又分为两种情况,一是独立样本T检验,一是配对样本T检验。

独立样本T检验统计量为:

样本方差是常用的统计量之一,是描述一组数据变异程度或分散程度大小的指标,实际上,样本方差可以理解成是对所给总体方差的一个无偏估计。

配对样本T检验统计量为:

3.T检验步骤和举例

以单样本T检验为例说明:

工厂要求每包精细面粉其平均重量u0=20 (单位:kg) ,某日抽查了16包,测量结果得样本均值为20.0669Kg,样本标准差S =0.1026Kg,问在显著水平a=00.5下,工厂生产的面粉重量都是20Kg

解:

1. 建立假设、确定检验水准α

H0:μ = 20 (零假设,null hypothesis

H1:μ ≠ 20(备择假设, alternative hypothesis

双侧检验,检验水准:α=0.05

2. 计算检验统计量

3. 查相应界值表,确定P值,下结论

查附表, t 0.05 / 2.15 = 2.131,t = 2.61,t > t 0.05 / 2.15,P < 0.05,按α=0.05水准,拒绝H0,即认为面粉重量差别已有显著变化,生产不正常。

4.Minitab 验证

应用MINITAB, 输入收集的数据,先进行数据正态验证。

依次选择菜单“统计>基本统计>正态性测试(Stat >Basic Statistics >Normality Test)

P>0.05,属于正态分布

进行单样本T检验

”统计>基本统计>单样本TStat >Basic Statistics > 1 Sample t),进入界面,填写相关变量名后,要特别注意在“选项(Options)”窗口选择双侧检验“不等于(Not Equal)得到结果。

5.T检验注意事项

要有严密的抽样设计,随机、均衡、可比;

选用的检验方法必须符合其适用条件(注意:T检验的前提是资料服从正态分布)

单侧检验和双侧检验:单侧检验的界值小于双侧检验的界值,因此更容易拒绝,犯第Ⅰ错误的可能性大;

假设检验的结论不能绝对化:不能拒绝H0,有可能是样本数量不够拒绝H0,有可能犯第Ⅰ类错误;

正确理解P值与差别有无统计学意义:P越小,不是说明实际差别越大,而是说越有理由拒绝H0 ,越有理由说明两者有差异,差别有无统计学意义和有无专业上的实际意义并不完全相同。

假设检验和可信区间的关系

结论具有一致性

差异:提供的信息不同,区间估计给出总体均值可能取值范围,但不给出确切的概率值,假设检验可以给出H0成立与否的概率。

注:文章授权转载自质量优势,作者柯学斌

转自:“量化研究方法”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com