无偏估计下的均值与方差

无偏估计,老生常谈了,但以防忘记,蛮记录一下存着吧

无偏估计

理想情况下的统计量的估计,是通过全体样本进行评估,这一定是无偏的,但问题是没办法,所以我们需要通过抽样来统计

但是如果仅是一次抽样,很明显的,抽样结果不可能完全符合真实情况,

img

因为“抽样出来的样本”的均值,也是一个随机变量,这个随机变量的期望才是真正的均值,才意味着是无偏估计

所以,其实简单来讲,用一次抽样的方式来表征全体的统计信息是不可取的,需要多次抽样才能获得可靠的统计

这里其实涉及到了大数定理和中心极限定理,但还没有找到有结合这个讲得比较好的,留个坑吧,以后再说

大数定理就是多采样,就容易对

中心极限定理就是多次采样的结果会形成以真实期望为中心的正态分布

无偏估计下的均值

所以无偏估计下的均值就是

image-20200612212612521

无偏估计下的方差

那么根据上述无偏估计均值的方式,按道理方差的无偏估计是:

image-20200612212831851

但是关键就在于,咱们的均值是未知的,那么这时候实际上算出的期望并非无偏估计,需要将分母改为n-1

数学证明

image-20200612212938807

直观解释

估计的理论基础在于,每个数据都是独立的,但是统计出的均值使得数据间存在了联系,简单来说就是前n-1个值与X拔就确定了,第n个值,自由度仅有n-1,最后一个值不具有信息量了

笔记记录

微信图片_20200612211553

参考

什么是无偏估计?

为什么样本方差(sample variance)的分母是 n-1?

数学推导可看:为什么样本方差(sample variance)的分母是 n-1?

0%