标准差与标准误的区别

2010-12-18 MedSci原创 MedSci原创

在日常的统计分析中,标准差和标准误是一对十分重要的统计量,两者有区别也有联系。但是很多人却没有弄清其中的差异,经常性地进行一些错误的使用。对于标准差与标准误的区别,很多书上这样表达:标准差表示数据的离散程度,标准误表示抽样误差的大小。这样的解释可能对于许多人来说等于没有解释。 其实这两者的区别可以采用数据分布表达方式描述如下:如果样本服从均值为μ,标准差为δ的正态分布,即X~N(μ, δ2),那

在日常的统计分析中,标准差和标准误是一对十分重要的统计量,两者有区别也有联系。但是很多人却没有弄清其中的差异,经常性地进行一些错误的使用。对于标准差与标准误的区别,很多书上这样表达:标准差表示数据的离散程度,标准误表示抽样误差的大小。这样的解释可能对于许多人来说等于没有解释。

其实这两者的区别可以采用数据分布表达方式描述如下:如果样本服从均值为μ,标准差为δ的正态分布,即XN(μ, δ2),那么样本均值服从均值为0,标准差为δ2/n的正态分布,即N(μ,δ2/n)。这里δ为标准差,δ/n1/2为标准误。明白了吧,用统计学的方法解释起来就是这么简单。

可是,实际使用中总体参数往往未知,多数情况下用样本统计量来表示。那么,关于这两者的区别可以这样表述:标准差是样本数据方差的平方根,它衡量的是样本数据的离散程度;标准误是样本均值的标准差,衡量的是样本均值的离散程度。而在实际的抽样中,习惯用样本均值来推断总体均值,那么样本均值的离散程度(标准误)越大,抽样误差就越大。所以用标准误来衡量抽样误差的大小。

在此举一个例子。比如,某学校共有500名学生,现在要通过抽取样本量为30的一个样本,来推断学生的数学成绩。这时可以依据抽取的样本信息,计算出样本的均值与标准差。如果我们抽取的不是一个样本,而是10个样本,每个样本30人,那么每个样本都可以计算出均值,这样就会有10个均值。也就是形成了一个10个数字的数列,然后计算这10个数字的标准差,此时的标准差就是标准误。但是,在实际抽样中我们不可能抽取10个样本。所以,标准误就由样本标准差除以样本量来表示。当然,这样的结论也不是随心所欲,而是经过了统计学家的严密证明的。

在实际的应用中,标准差主要有两点作用,一是用来对样本进行标准化处理,即样本观察值减去样本均值,然后除以标准差,这样就变成了标准正态分布;而是通过标准差来确定异常值,常用的方法就是样本均值加减n倍的标准差。标准误的作用主要是用来做区间估计,常用的估计区间是均值加减n倍的标准误。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=11517, encodeId=79ad1151e29, content=言简意赅,很好的解释, beContent=null, objectType=article, channel=null, level=null, likeNumber=110, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=5757106889, createdName=oubaochi, createdTime=Fri Sep 05 22:18:00 CST 2014, time=2014-09-05, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1982, encodeId=3b52198272, content=谢谢精彩的分析,但还是有点不太明白。例如在实际工作中:western blot 分析,共分成三组,每组三个标本,得到每组三个数值,那么三组之间进行统计分析后,是用均数±S.D表示还是用均数±S.E.,M表示, beContent=null, objectType=article, channel=null, level=null, likeNumber=91, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=f0620, createdName=120.0.121.172, createdTime=Thu Jan 20 22:29:00 CST 2011, time=2011-01-20, status=1, ipAttribution=)]
    2014-09-05 oubaochi

    言简意赅,很好的解释

    0

  2. [GetPortalCommentsPageByObjectIdResponse(id=11517, encodeId=79ad1151e29, content=言简意赅,很好的解释, beContent=null, objectType=article, channel=null, level=null, likeNumber=110, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=5757106889, createdName=oubaochi, createdTime=Fri Sep 05 22:18:00 CST 2014, time=2014-09-05, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1982, encodeId=3b52198272, content=谢谢精彩的分析,但还是有点不太明白。例如在实际工作中:western blot 分析,共分成三组,每组三个标本,得到每组三个数值,那么三组之间进行统计分析后,是用均数±S.D表示还是用均数±S.E.,M表示, beContent=null, objectType=article, channel=null, level=null, likeNumber=91, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=f0620, createdName=120.0.121.172, createdTime=Thu Jan 20 22:29:00 CST 2011, time=2011-01-20, status=1, ipAttribution=)]
    2011-01-20 120.0.121.172

    谢谢精彩的分析,但还是有点不太明白。例如在实际工作中:western blot 分析,共分成三组,每组三个标本,得到每组三个数值,那么三组之间进行统计分析后,是用均数±S.D表示还是用均数±S.E.,M表示

    0