如何计算方差(样本方差和总体方差)

如何计算方差(样本方差和总体方差)最佳边肖带大家去了解一下

如何计算方差(样本方差和总体方差)

1。方差:对随机变量或一组数据离散程度的度量。
概率论中的方差用来衡量随机变量与其数学期望(即均值)之间的部分巴克斯特分离(www.isoyu.com原创版权)程度。

统计中的方差(样本方差)是每个样本值之间的差值的平方值与所有样本值的平均值的平均值。

概率论中的方差表示:

样本方差，无偏估计，无偏方差。对于一组随机变量，从其中随机选择n个样本，这组样本的方差是Xi^2平方和除以N-1。

总体方差，也称为有偏估计，实际上是我们从初中学到的标准定义的方差，除数为n.

方差在统计学中的表示:

第二，为什么样本方差的分母是n-1？为什么叫无偏估计？
简单的答案是因为你用了n个数的平均值来估计平均值。求方差时，只有(n-1)个数与均值信息无关。

而你的第n个数可以由之前的(n-1)个数和平均值唯一确定，但实际上没有信息。所以在计算方差时，只除以(n-1)。

那更严格的证明呢？
最佳网络

【/h/】样本方差计算公式中的分母为n-1，是为了使方差的估计无偏。

无偏估计量比有偏估计量好，直观，虽然有统计学家认为最小均方误差(MSE)更有意义，所以这里不讨论这个问题。

不直观的是，为什么分母一定是n-1而不是n，才能使估计无偏。

首先我们假设随机变量的数学期望已知，但是方差未知。在这种情况下，根据方差的定义，我们有

由此，你可以得到

这个结果很直观，数学上也很明显。

现在我们考虑随机变量
三、理论推导
为了叙述方便，这里解释一下数学符号:

前面说过，样本的方差要除以(n-1)，因为这样的方差估计量是总体方差的无偏估计量。根据公式，样本方差估计量的期望应等于总体方差。如下:

但没有修正的方差公式，其期望不等于群体方差的

也就是说，如果用未修正的方差公式
来估计总方差，则样本方差估计量是有偏的

下面是一个很好理解的公式推导过程:

就是说，除非

最佳网络
否则，必须有

需要注意的是，不等式的右边是方差的“正确”估计，但是我们不知道真实的总体均值是什么，所以只能用样本均值代替总体均值。

【/h/】因此，如果样本方差估计量采用未修正的方差公式来估计总方差，会有偏差，低估样本总体方差。为了无偏差地估计总体方差，方差的计算公式应修改如下:

这一修订估计数将是对人口差异的无偏估计，这一修订的来源如下。

为了理解这种修正是如何发生的，我们首先必须有以下等式:

1。方差计算公式:

2。平均值和方差的计算公式:

我们有:
为方差计算公式，未经修正