方差的概念很容易理解,高中时候就已经讲过

但是当我们进行抽样调查时,我们老师却告诉我们,公式要变成

我们称S为样本方差(有些材料叫修正样本方差)。此时大家一定会有疑惑,为什么要除以n-1而不是n呢?
很简单的一点一定可以想到,那就是,由于抽样调查时我们试图用抽样的样本来代替总体,但肯定不完全一样,所以样本方差和总体方差肯定是不同的。不过,由于抽样具有代表性,所以我们可以认为我们抽出的样都是随机的且可以代表总体的情况,用他们的方差代替总体的方差看上去也很正常,到底为什么差了个(n-1/n)倍呢?
原因就出在X拔(样本平均值)上。X拔虽然可以代替总体平均值,但是X拔的平方却不能代替平均值的平方。所谓的代替,就是指期望是相等的。即。下面开始解释:
假设总体的平均值是μ(即总体期望,这里不考虑不同取值概率不同的情况),方差是σ平方。可以理解为每个数都是
xi = μ + ε
μ就是期望值,或者说是平均值,ε就是每个数的偏差,这些偏差的和为0,(比如有些比平均数高一点,有些低一点,最后加起来为0),平方和的平均数即方差σ平方(无论偏高还是偏低,他们的平方都是正数,所以可以衡量他们的离散程度,这也是方差的意义)。
Σεi = 0 ; Σε^2 = n* σ^2
关于期望的理解可以看下面这个公式,可以理解为“平均数”

那么:

第一项是常数;第二项由于ε的总体期望是0,所以为0;第三项偏差平方的总体期望可以理解为Σε^2/n = σ^2。所以:

可见通过平方的期望就是把本来隐藏的偏差给找出来,那么我们想想X拔是否会有方差?
尽管:


但是:

(D就是表示方差,Dxi = σ^2)
方差知道了,平均数也知道了,那么X拔平方期望也就可以知道了,类似于上面计算Xi平方期望一样


到这里就能看出来样本平均数的平方无法替代总体的平均数平方,他们差了方差/n。

那么根据总体方差公式

我们不知道总体的期望,想要用样本的平均值代替。我们先带进去试试会怎么样,这里要注意的是,如果直接把X拔带入,那将会是个定值,因为对于每个已知的X拔都有一个特定的S。而我们要求的是建立在X拔本身是“无偏的”的基础上,即我们要考虑X拔本身存在误差,它等于μ方+n分之sigma方,我们需要用期望来表示方差。


X拔与i无关,所以1/n * Σ 可以省略。 又 1/n * Σ Xi 就等于X拔,所以最后两项可以合并为- E(X拔方)|

第一项这里省略不写了
第二项之前已经证明了
所以:

即S=Sn/(n-1) = σ^2

如果学过数理统计等,可以看http://www.dutor.net/index.php/2009/10/sample-variance/comment-page-1/
更专业、具体

本人想出来的用更通俗易懂的方法:

S = Σ (Xi-X拔)^2 ,这里面 Xi= μ + ε ; X拔相当于ε/根号n的误差,这个误差的来源是因为我们知道Xi是期望为μ,方差为σ^2的数组,那么X拔其实是期望为μ,方差为σ^2/n的数组,它本身是含有误差的(很好理解,我们取不同样本,平均值接近μ但还是存在一定的误差),所以当我们做方差时如果不考虑本身误差的存在,那么做出来的S是有偏的。我们考虑了X拔的误差,则就是无偏估计。