Statistics

Statistics

现代统计学(modern statistical science)由20世纪英国数学家、演化生物学家费希尔(Ronald Fisher)一手建立。

p-value (P值)

p值:代表的是p值(p-value)是用于衡量统计假设检验中观察到的样本数据与原假设之间的差异程度的一种指标。在假设检验中,p值是指当原假设为真时,观察到的样本数据与原假设相差如此之大或更大的概率。通常情况下,p值小于给定的显著性(statistical significance,所谓的“统计显著性”)水平(通常为0.05或0.01)时,我们认为观察到的数据与原假设不一致,拒绝原假设;反之,当p值大于显著性水平时,我们接受原假设。

现代科学(特别是生物医学和社会科学)实验和研究中大量使用“回归分析”,在这种研究中,原假设通常是指模型中某些参数的取值等于一个特定的值,或者两个或多个参数之间没有显著的关系。拒绝原假设意味着在给定显著性水平的情况下,样本数据提供了足够的证据来支持模型中这些参数的取值不等于特定值,或者它们之间存在显著的关系。例如,如果某个研究中得到的p值为0.02,意味着在原假设为真的情况下,出现这样的数据或更极端的数据的概率只有2%。因此,我们通常会拒绝原假设,认为这个研究结果是有显著性差异(其它说法:具有统计学意义、具有统计显著性)。

这种研究方法体现的是一种“小概率反证”的思想。即原假设成立的前提下,小概率事件在一次试验中不太可能发生,如果发生了,则认为原假设并不成立。

科学界主流观点普遍使用 0.05 作为显著性水平的标准线,这个值是费希尔本人提出的。

例如:

  • 主题:研究一组学生的考试成绩,并尝试建立一个回归模型来预测他们的成绩。我们认为,学生的成绩可能与他们的学习时间、家庭背景和性别等因素有关。因此,我们建立了一个多元回归模型,其中学习时间、家庭背景和性别是自变量,考试成绩是因变量。
  • 原假设:家庭背景、学习时间和性别等因素对考试成绩没有显著的影响。
  • 统计分析结果:在进行回归分析后,我们得到了一些统计结果。其中:
    • 家庭背景变量的回归系数不显著,即其p值大于显著性水平(例如0.05):这意味着我们无法拒绝原假设(家庭背景对考试成绩没有显著的影响)。
    • 学习时间、性别变量的回归系数在显著性水平下均显著:这意味着我们可以拒绝原假设(学习时间和性别对考试成绩没有显著的影响)。
  • 结论:学习时间和性别是预测学生成绩的重要因素,而家庭背景不是。

这种统计分析方法称为“零假设(Null hypothesis,又译虚无假设、原假设)。零假设的内容一般是希望能证明为错误的假设,与零假设相对的是备择假设(Alternative hypothesis),即希望证明是正确的另一种可能。从数学上来看,零假设和备择假设的地位是相等的,但是在统计学的实际运用中,常常需要强调一类假设为应当或期望实现的假设,例如在相关性检验中,一般会取“两者之间无关联”作为零假设,而在独立性检验中,一般会取“两者之间非独立”作为零假设。

如果一个统计检验的结果拒绝(reject) 零假设(结论不支持零假设),而实际上真实的情况属于零假设,那么称这个检验犯了第一类错误(“假阳性”)。反之,如果检验结果支持零假设,而实际上真实的情况属于备择假设,那么称这个检验犯了第二类错误。通常的做法是,在保持第一类错误出现的机会在某个特定水平上的时候(即显著性差异值或α值),尽量减少第二类错误出现的概率。

延伸阅读


Last update: 2023-11-14 03:38:56 UTC