置信区间的概念理解

生活常识 2023-05-11 14:41生活常识www.xinxueguanw.cn

大家好,下面心血管健康网小编给大家分享一下。很多人还不知道置信区间的概念。以下是详细的解释。现在让我们来看看!

1。定义

在统计学中,样本的置信区间是总体参数区间估计。置信区间给出了所要求的总体参数在测量值区间内的真实值的置信度或概率。这个概率也被称为置信水平。举个例子,在另一次大选中,如果上帝看到某人的支持率是55%,在0.95的置信水平上的置信区间是(50%,60%),那么他的真实支持率落在50%-60%之间的概率是95%。如果分布是对称的,那么他的支持率低于50%的概率只有2.5%。

对于给定的情况,置信水平越高,置信区间就越大。置信区间表示一个特定的范围,置信水平是一个概率,表示真值落在这个区间内的概率。

2。参数估计

置信区间属于参数估计中的区间估计

参数估计主要包括点估计区间估计。点估计包括:一阶矩估计,最大似然估计,最小二乘估计。置信区间属于区间估计。

3。置信区间

我们通过估算人的身高来解释什么是置信区间。

3.1上帝的视角

对于人类的平均身高,因为人太多,没办法全部统计出来。这个数据肯定是真实的,我们可以说,天知道。也就是说,从上帝的角度,我们可以看到人类身高的真实分布,假设满足正态分布:均值145,标准差1.4。

置信区间有什么性质 一文了解什么是置信区间(1)

3.2点估计值

愚蠢的人类想要统计平均身高,除了抽样统计,没有别的办法。

置信区间有什么性质 一文了解什么是置信区间(2)

例如,在抽样过程中,我们在图上画出计算出的样本平均值,蓝点表示:

置信区间有什么性质 一文了解什么是置信区间(3)

则该样本的平均高度是真实平均高度点估计。通过一次又一次的抽样,我们可以得到许多不同的点估计:

置信区间有什么性质 一文了解什么是置信区间(4)

现在,关闭上帝的视角,无法判断哪一点更好:

置信区间有什么性质 一文了解什么是置信区间(5)

:对于点估计,真均值是由样本的均值直接估计的。似乎比区间估计更准确。其实并不是这样的。如果只使用点估计,正确估计的概率为0。P(u1 = u) = 0。

置信区间虽然我们还不知道哪个估计更好,但可以给出一个概率。

3.3置信区间

它提供了一种区间估计的方法。不是直接估计参数值,而是估计区间包含真值的概率。例如,95%的置信区间意味着给定的置信区间有95%的机会包含真值。(,参数的真值会以95%的概率落在这个区间内。因为参数的真实值不是随机的,它是一个值,我们的区间是随机的。

点估计给出的估计是X ',区间估计是区间[X'-1,X' 1]。区间估计正确的概率为:

置信区间有什么性质 一文了解什么是置信区间(6)

还是之前估算人体身高的问题。假设我们用一个固定长度的区间来估计人类身高的平均值:

置信区间有什么性质 一文了解什么是置信区间(7)

假设选择这个固定长度,我们取不同的样本,得到不同的估计区间。对于某些采样样本,估计区间包含真值(如绿色),而其他样本不包含真值(如红色)。如果在100次采样实验期间构建的95个估计区间包含真值,则置信度为95%。

3.4如何得到置信区间的长度和中点

我们用95%的置信区间来说明它。

假设人口的身高符合正态分布:

置信区间有什么性质 一文了解什么是置信区间(8)

均值未知,但方差已知。目标:估计均值。

我们不断对人群进行抽样,得到样本量为n 空,样本的平均值为:

置信区间有什么性质 一文了解什么是置信区间(9)

那么m也服从正态分布:

置信区间有什么性质 一文了解什么是置信区间(10)

接下来,我们计算一个以U为中心,面积为0.95的区间。从上帝的角度看,它是这样的:

置信区间有什么性质 一文了解什么是置信区间(11)

即:

置信区间有什么性质 一文了解什么是置信区间(12)

所以现在我们无法得到真实的平均值。那么只能用个样本的平均值来代替。,更换之后,也有一个问题。样本均值与真实值有一定的偏差,所以瞬时区间长度相同,得到的区间不同。假设我们通过采样得到100个区间,如下所示:

置信区间有什么性质 一文了解什么是置信区间(13) 置信区间有什么性质 一文了解什么是置信区间(14)

可以看出,有的区间包含实值,有的区间不包含实值。那么100个区间中有多少个包含真值呢?答案是95%。我换个说法:从这100个区间中随机取一个区间,那么包含真值的概率是多少?答案是95%。

常见的正态分布图还能记住:

置信区间有什么性质 一文了解什么是置信区间(15)

3.5如何评价区间估计的质量

常用的标准有两种:(1)置信度标准(2)准确度标准。

置信度是估计区间包含真值的概率。显然,信心越大越好。

置信系数是参数空之间的置信下限。因为对于不同的参数,估计的置信度是不同的,显然,我们希望最小置信度尽可能大。所以置信系数越大越好。

精度的标准有很多,最常用的是随机区间平均长度[/s2/]。显然,平均长度越小越好。

,

以上解释了置信区间的概念。这篇文章已经分享到这里了。希望能帮到大家。如果信息有误,请联系心脑血管健康网进行更正。

Copyright@2015-2025 www.xinxueguanw.cn 心血管健康网版板所有