t检验

参考视频: StatsCast: What is a t-test?(需要梯子)

t检验的目的

t检验的目的是判断两个样本集某个属性的均值是否有显著差异

为什么需要t检验

直接比较两个样本集的均值只能给出已知差异(描述统计学), 但是无法保证两个样本集所各自代表的整体也具有同样的差异, 因为结果可能是偶然性造成的(无法用局部代表整体).
要通过已知样本来理解整体, 需要用到推论统计学, t检验就是属于推论统计学的内容. t检验要通过样本数据, 得到样本所代表的整体之间的差异.

t检验的分类

单样本t检验

适用于一个样本群体某种属性的均值与某个特定值的比较;例如实验中,对做某种处理的一组小白鼠的体重与正常小白鼠体重(已知值)比较

两独立样本 T 检验

前提:先进行方差的齐性检验
若方差相同,则使用同方差检验
若方差不同,则使用异方差检验

适用于两个相对独立的群体某个相同属性均值的比较,比如男性、女性群体的身高比较。

成对样本 T 检验

适用于对同一组样本两次测量的均值比较,例如同一年级学生的两次考试.

t检验的两个指标: t值与p值的理解

t = 样 本 之 间 的 方 差 样 本 内 部 的 方 差 t = \frac{样本之间的方差}{样本内部的方差} t=t越大, 说明两个样本集之间差异就越大, 反之差异越小. 如果样本集的数据点越分散(样本内部方差大), 越难判断样本集间的差异大小.

但得到的t值只是已知样本集之间的差异大小, 这个t值能有多大的置信度代表整体之间的差异? 这由p值来表示.

p值: p值是指 (t所代表的样本集之间的差异可能是由随机数据导致的) 的概率大小. 换言之, p值是量化表示 样本集之间的差异是真实差异 还是 偶然因素造成的.

例如, p=0.05, 表示有5%的可能性t所代表的这种差异是随机因素造成的. 换言之, 就是有5%的可能性两个样本集所代表的整体之间是完全一样的.

一般设置p=0.05为阈值, 当p小于0.05时, 认为两个样本集所表示的整体之间有显著差异. 就是说, 如果p=0.01, 这种差异是随机因素造成的的概率只有1%, 99%的概率可能是真实差异, 概率足够大, 我们就认为是有显著差异的.

注意: p值的计算公式里是除以了t值的, 表示是在同样的t值差异下来量化p所代表的概率.

应用t检验的一些限制

  1. 样本和整体应该是正态分布的, 离均值越远的比例越低, 否则p值可能不准确.
  2. 两个样本集的数量应该是相等的. 不相等的样本集可能导致结果不准确.
  3. 样本集内部每个样本之间应该是相互独立的, 不会相互影响.

如何写t检验的结果

两独立样本t检验被应用于确定xx减肥药的效果, t(99) = 0.33, p = 0.37, 发现两组人群体重没有显著差别(实验组M=60, 对照组M=62).
注: 99表示自由度, 为样本数量-1, 所以可知样本数量为100人; M表示实验组和对照组的体重均值.

    原文作者:赤道6号转向发动机
    原文地址: https://blog.csdn.net/weixin_42561002/article/details/90712492
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞