如何计算方差(样本方差和总体方差)最佳边肖带大家去了解一下
如何计算方差(样本方差和总体方差)
1。方差:对随机变量或一组数据离散程度的度量。
概率论中的方差用来衡量随机变量与其数学期望(即均值)之间的部分巴克斯特分离(www.isoyu.com原创版权)程度。
统计中的方差(样本方差)是每个样本值之间的差值的平方值与所有样本值的平均值的平均值。
概率论中的方差表示:
样本方差,无偏估计,无偏方差。对于一组随机变量,从其中随机选择n个样本,这组样本的方差是Xi^2平方和除以N-1。
总体方差,也称为有偏估计,实际上是我们从初中学到的标准定义的方差,除数为n.
方差在统计学中的表示:
第二,为什么样本方差的分母是n-1?为什么叫无偏估计?
简单的答案是因为你用了n个数的平均值来估计平均值。求方差时,只有(n-1)个数与均值信息无关。
而你的第n个数可以由之前的(n-1)个数和平均值唯一确定,但实际上没有信息。所以在计算方差时,只除以(n-1)。
那更严格的证明呢?
最佳网络
【/h/】样本方差计算公式中的分母为n-1,是为了使方差的估计无偏。
无偏估计量比有偏估计量好,直观,虽然有统计学家认为最小均方误差(MSE)更有意义,所以这里不讨论这个问题。
不直观的是,为什么分母一定是n-1而不是n,才能使估计无偏。
首先我们假设随机变量的数学期望已知,但是方差未知。在这种情况下,根据方差的定义,我们有
由此,你可以得到
这个结果很直观,数学上也很明显。
现在我们考虑随机变量
三、理论推导
为了叙述方便,这里解释一下数学符号:
前面说过,样本的方差要除以(n-1),因为这样的方差估计量是总体方差的无偏估计量。根据公式,样本方差估计量的期望应等于总体方差。如下:
但没有修正的方差公式,其期望不等于群体方差的
也就是说,如果用未修正的方差公式
来估计总方差,则样本方差估计量是有偏的
下面是一个很好理解的公式推导过程:
就是说,除非
最佳网络
否则,必须有
需要注意的是,不等式的右边是方差的“正确”估计,但是我们不知道真实的总体均值是什么,所以只能用样本均值代替总体均值。
【/h/】因此,如果样本方差估计量采用未修正的方差公式来估计总方差,会有偏差,低估样本总体方差。为了无偏差地估计总体方差,方差的计算公式应修改如下:
这一修订估计数将是对人口差异的无偏估计,这一修订的来源如下。
为了理解这种修正是如何发生的,我们首先必须有以下等式:
1。方差计算公式:
2。平均值和方差的计算公式:
我们有:
为方差计算公式,未经修正