如何计算方差(样本方差和总体方差)

/ 0评 / 0

如何计算方差(样本方差和总体方差)最佳边肖带大家去了解一下

如何计算方差(样本方差和总体方差)

1。方差:对随机变量或一组数据离散程度的度量。
概率论中的方差用来衡量随机变量与其数学期望(即均值)之间的部分巴克斯特分离(www.isoyu.com原创版权)程度。

统计中的方差(样本方差)是每个样本值之间的差值的平方值与所有样本值的平均值的平均值。

概率论中的方差表示:

样本方差,无偏估计,无偏方差。对于一组随机变量,从其中随机选择n个样本,这组样本的方差是Xi^2平方和除以N-1。


总体方差,也称为有偏估计,实际上是我们从初中学到的标准定义的方差,除数为n.

方差在统计学中的表示:


第二,为什么样本方差的分母是n-1?为什么叫无偏估计?
简单的答案是因为你用了n个数的平均值来估计平均值。求方差时,只有(n-1)个数与均值信息无关。

而你的第n个数可以由之前的(n-1)个数和平均值唯一确定,但实际上没有信息。所以在计算方差时,只除以(n-1)。

那更严格的证明呢?
最佳网络

【/h/】样本方差计算公式中的分母为n-1,是为了使方差的估计无偏。

无偏估计量比有偏估计量好,直观,虽然有统计学家认为最小均方误差(MSE)更有意义,所以这里不讨论这个问题。

不直观的是,为什么分母一定是n-1而不是n,才能使估计无偏。

首先我们假设随机变量的数学期望已知,但是方差未知。在这种情况下,根据方差的定义,我们有

由此,你可以得到


这个结果很直观,数学上也很明显。

现在我们考虑随机变量
三、理论推导
为了叙述方便,这里解释一下数学符号:


前面说过,样本的方差要除以(n-1),因为这样的方差估计量是总体方差的无偏估计量。根据公式,样本方差估计量的期望应等于总体方差。如下:


但没有修正的方差公式,其期望不等于群体方差的


也就是说,如果用未修正的方差公式
来估计总方差,则样本方差估计量是有偏的

下面是一个很好理解的公式推导过程:


就是说,除非

最佳网络
否则,必须有


需要注意的是,不等式的右边是方差的“正确”估计,但是我们不知道真实的总体均值是什么,所以只能用样本均值代替总体均值。

【/h/】因此,如果样本方差估计量采用未修正的方差公式来估计总方差,会有偏差,低估样本总体方差。为了无偏差地估计总体方差,方差的计算公式应修改如下:


这一修订估计数将是对人口差异的无偏估计,这一修订的来源如下。

为了理解这种修正是如何发生的,我们首先必须有以下等式:

1。方差计算公式:


2。平均值和方差的计算公式:


我们有:
为方差计算公式,未经修正