威廉·高斯*、本杰明·梅尔、赖纳·穆什
“显著”和“p 值”这两个术语对于生物医学研究人员和包括药理学家在内的生物医学论文读者来说非常重要。没有其他统计结果像 p 值一样经常被误解。本文对探索性检验与确认性检验的问题进行了总体讨论。显著的 p 值有时会导致精确的假设(探索性检验),有时则被解释为“统计证明”(确认性检验)。只有在以下情况下,p 值才可解释为确认性的:(1) 假设和显著性水平是先验确定的,并且 (2) 如果进行了多项检验,则进行了多重检验调整。
筛查计划(例如美国国家银杏毒理学计划)通常用于探索性结果。对照随机试验通常包括对主要结果变量进行一次确认性检验和对次要结果变量进行几项探索性检验,以及进行探索性亚组分析。一些研究得出的 p 值比单纯的探索性更有意义,而其他 p 值似乎或多或少具有确认性。流行病学研究和荟萃分析得出的 p 值可能介于探索性和确认性之间。我们建议将探索性和确认性视为一个两极连续体。尽管如此,建议研究方案的作者以明确的探索性或严格的确认性方式设计他们的研究。此外,我们建议除了适当的描述性结果外,每个已发表的显著 p 值都应明确标记为探索性或确认性。