421 字

分位点与分位数 z

统计学; 分位数;

分位数在统计学是中一个比较简单和容易理解的概念,大部分初级的统计学教材中都会有相应的介绍。但实际在理解这个概念的时候,要注意连续情形下与分位数相关的几个概念之间的联系与区别。

离散情形

举一个例子,将 100 名同学的期末考试总分成绩所组成的向量 \(\mathbf{x}\) 按从小到大的规则进行排序,生成一个新的顺序统计量 \(\mathbf{x}'\),那么 \(\mathbf{x}\)\(1/4\) 分位数指的是 \(\mathbf{x}^\prime\) 第 25 号位上的那个数字,同理可知中位数以及 \(3/4\) 分位数等。

连续情形

以正态分布为例,\(1/4\) 分位数指的是 \(\mathrm{Pr}(X\leqslant x)=1/4\) 对应的 \(x\) 值,类似的,标准正态分布中中位数对应的 \(x\) 为 0。

从上面的例子可以看出,分位点确定的基础是在离散情形下将样本数量标准化为 1,而在连续情形下则是将 x 坐标轴的可用长度标准化为 1(对于正态分布和 t 分布而言,原始长度为 \(-\infty\)\(+\infty\) 之间的全部范围。

在连续情形下,若考虑的置信系数是左单侧的,那么置信系数 \(\alpha\) 对应的下 \(\alpha\) 分位点的 \(x\) 值与 \(\alpha\) 分位数以及 \(\mathrm{Pr}(X\leqslant x)=\alpha\) 中的 \(x\) 实际上指向同一个 \(x\) 值。

这个值在大部分统计软件中对应的命令以 q 开头,比如 R 中的 qnorm 命令。