2.2.2 用样本的数字特征估计总体的数字特征
〖目标〗
1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差
2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释;
3. 会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识。
〖重难点〗
教学重点 用样本平均数和标准差估计总体的平均数与标准差。
教学难点 能应用相关知识解决简单的实际问题。
〖教学过程〗
一、复习回顾
作频率分布直方图分几个步骤?各步骤需要注意哪些问题?
二、创设情境
在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下?
甲运动员?7,8,6,8,6,5,8,10,7,4;
乙运动员?9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?上节课我们学习了用图表的方法来研究,为了从整体上更好地把握总体的规律,我们这节课要通过样本的数据对总体的数字特。
三、 新知探究
众数、中位数、平均数
众数―一组数中出现次数最多的数;在频率分布直方图中,我们取最高的那个小长方形横坐标的中点。
中位数――当一组数有奇数个时等于中间的数,当有偶数个时等于中间两数的平均数;在频率分布直方图中,是使图形左右两边面积相等的线所在的横坐标。
平均数――将所有数相加再除以这组数的个数;在频率分布直方图中,等于每个小长方形的面积乘以其底边中点的横坐标的和。
思考探究:
分别利用原始数据和频率分布直方图求出众数、中位数、平均数,观察所得的数据,你发现了什么
问题?为什么会这样呢?
你能说说这几个数据在描述样本信息时有什么特点吗?由此你有什么样的体会?
答:(1)从频率分布直方图得到的众数和中位数与从数据中得到的不一样,因为频率分布直方图损失了一部分样本信息,所以不如原始数据准确。
(2)众数和中位数不受极端值的影响,平均数反应样本总体的信息,容易受极端值的影响。
练一练:
假如你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20~100万元。中位数是25万元,平均数是100万元,众数是20万元。你会选择哪一种数字特征 来表示国家对每一个项目投资的平均金额?
解析:平均数。
一、标准差、方差
在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下?
甲运动员?7,8,6,8,6,5,8,10,7,4;
乙运动员?9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?
我们知道, 。
两个人射击的平均成绩是一样的。那么,是否两个人就没有水平差距呢?(观察 图2.2-7)直观上看,还是有差异的。很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据。
1、标准差
标准差是样本数据到平均数的一种平均距离,一般用s表示。
思考探究:
1、标准差的大小和数据的离散程度有什么关系?
2、标准差的取值范围是什么?标准差为0的样本数据有什么特点?
答:(1)显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小。
(2)从标准差的定义和计算公式都可以得出: 。当 时,意味着所有的样本数据
都等于样本平均数。
2、方差
在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差。
四、例题精析
例1:农场种植的甲乙两种水稻,在面积相等的两块稻田连续6年的年平均产量如下:
甲:900,920,900,850,910,920
乙:890,960,950,850,860,890
那种水稻的产量比较稳定?
[分析]采用求标准差的方法
解:
所以甲水稻的产量比较稳定。
点评:在平均值相等的情况下,比较方差或标准差。
变式训练:在某项体育比赛中,七位裁判为一选手打出的分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为
(A)92 , 2 (B) 92 , 2.8 (C) 93 , 2 (D) 93 , 2.8
【答案】B
【解析】由题意知,所剩数据为90,90,93,94,93,所以其平均值为
90+ =92;方差为 2.8,故选B。
例2、例1.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为
由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在
的人数是 .
(2)这20名工人中一天生产该产品数量的中位数 .
(3)这20名工人中一天生产该产品数量的平均数 .
点评:在直方图中估计中位数、平均数。
变式训练:
某医院急诊中心关于其病人等待急诊的时间记录如下:
等待时间(分钟)
人数48521
用上述分组资料计算得病人平均等待时间的估计值 = ,病人等待时间的标准差的估计值 =
五、反馈测评
1. 在一次知识竞赛中,抽取20名选手,成绩分布如下:
成绩678910
人数分布12467
则选手的平均成绩是 ( )
A.4 B.4.4 C.8 D.8.8
2.8名新生儿的身长(cm)分别为50,51,52,55,53,54,58,54,则新生儿平均身长的估计为 ,约有一半的新生儿身长大于等于 ,新生儿身长的最可能值是 .
3..样本 的平均数为5,方差为7,则3 的平均数、方差,标准差分别为
4.某工厂甲,乙两个车间包装同一产品,在自动包装传送带上每隔30min抽一包产品,称其重量是否合格,分别记录抽查数据如下:甲车间:102,101,99,103,98,99,98;乙车间:110,105,90,85,75,115,110.
(1)这样的抽样是何种抽样方法?
(2)估计甲、乙两车间的均值与方差,并说明哪个车间的产品较稳定.
六、课堂小结
1、在频率分布直方图中,如何求出众数、中位数、平均数?
2、标准差的公式;标准差的大小和数据的离散程度有什么关系?
〖板书设计〗
〖书面作业〗
课本 6 7
2.2.2 用样本的数字特征估计总体的数字特征
课前预习学案
一、预习目标:
通过预习,初步理解众数、中位数、平均数、标准差、方差的概念。
二、预习内容:
1、知识回顾:
作频率分布直方图分几个步骤?各步骤需要注意哪些问题?
2、众数、中位数、平均数的概念
众 数:____________________________________________________________________
中位数:___________________________________________________________________
平均数:____________________________________________________________________
3.众数、中位数、平均数与频率分布直方图的关系:
众数在样本数据的频率分布直方图中,就是______________________________________
中位数左边和右边的直方图的________应该相等,由此可估计中位数的值。
平均数是直方图的___________.
4.标准差、方差
标准差 s=_________________________________________________________________
方 差s2=_________________________________________________________________
三、提出疑惑
同学们,通过你的自主学习,你还有哪些疑惑,请把它填在下面的表格中
疑惑点疑惑内容
课内探究学案
一、学习目标:
1. 能说出样本数据标准差的意义和作用,会计算数据的标准差
2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释;
3. 会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意识。
二、学习内容
1.众数、中位数、平均数
思考1:分别利用原始数据和频率分布直方图求出众数、中位数、平均数,观察所得的数据,你发现了什么问题?为什么会这样呢?
思考2: 你能说说这几个数据在描述样本信息时有什么特点吗?由此你有什么样的体会?
练一练:
假如你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20~100万元。中位数是25万元,平均数是100万元,众数是20万元。你会选择哪一种数字特征来表示国家对每一个项目投资的平均金额?
2. 标准差、方差
在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下?
甲运动员?7,8,6,8,6,5,8,10,7,4;
乙运动员?9,5,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?
思考1:标准差的大小和数据的离散程度有什么关系?
思考2:标准差的取值范围是什么?标准差为0的样本数据有什么特点?
3、〖典型例题〗
例1.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为
由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在
的人数是 .
(2)这20名工人中一天生产该产品数量的中位数 .
(3)这20名工人中一天生产该产品数量的平均数 .
例2:农场种植的甲乙两种水稻,在面积相等的两块稻田连续6年的年平均产量如下:
甲:900,920,900,850,910,920
乙:890,960,950,850,860,890
那种水稻的产量比较稳定?
三、反思总结
1、 在频率分布直方图中,如何求出众数、中位数、平均数?
2、标准差的公式;标准差的大小和数据的离散程度有什么关系?
四、当堂检测
1.在一次知识竞赛中,抽取20名选手,成绩分布如下:
成绩678910
人数分布12467
则选手的平均成绩是 ( )
A.4 B.4.4 C.8 D.8.8
2.8名新生儿的身长(cm)分别为50,51,52,55,53,54,58,54,则新生儿平均身长的估计为 ,约有一半的新生儿身长大于等于 ,新生儿身长的最可能值是 .
3.某医院急诊中心关于其病人等待急诊的时间记录如下:
等待时间(分钟)
人数48521
用上述分组资料计算得病人平均等待时间的估计值 = ,病人等待时间的标准差的估计值 =
4.样本 的平均数为5,方差为7,则3 的平均数、方差,标准差分别为
5.某工厂甲,乙两个车间包装同一产品,在自动包装传送带上每隔30min抽一包产品,称其重量是否合格,分别记录抽查数据如下:甲车间:102,101,99,103,98,99,98;乙车间:110,105,90,85,75,115,110.
(1)这样的抽样是何种抽样方法?
(2)估计甲、乙两车间的均值与方差,并说明哪个车间的产品较稳定.
课后练习与提高
1.某人5次上班途中所花的时间(单位:分钟)分别为 已知这组数据的平均数为10,方差为2,则 的值为( )
A.1 B.2 C.3 D.4
解:由平均数公式为10,得 ,则 ,又由于方差为2,则 得
所以有 ,故选D.
2.某房间中10个人的平均身高为1.74米,身高为1.85米的第11个人,进入房间后,这11个人的平均身高是多少?
解:原来的10个人的身高之和为17.4米,所以,这11个人的平均身高为 =1.75.即这11个人的平均身高为1075米
[例4]若有一个企业,70%的人年收入1万,25%的人年收入3万,5%的人年收入11万,求这个企业的年平均收入及年收入的中位数和众数
解:年平均收入为1 (万);中位数和众数均为1万
3.下面是某快餐店所有工作人员的收入表:
老板大厨二厨采购员杂工服务生会计
3000元450元350元400元320元320元410元
(1)计算所有人员的月平均收入;
(2)这个平均收入能反映打工人员的月收入的一般水平吗?为什么?
(3)去掉老板的收入后,再计算平均收入,这能代表打工人员的月收入的水平吗?
(4)根据以上计算,以统计的观点对(3)的结果作出分析
解:(1)平均收入 (3000+450+350+400+320+320+410)=750元
(2)这个平均收入不能反映打工人员的月收入水平,可以看出打工人员的收入都低于平均收入,因为老板收入特别高,这是一个异常值,对平均收入产生了较大的影响,并且他不是打工人员
(3)去掉老板后的月平均收入 (450+350+400+320+320+410)=375元.这能代表打工人员的月收入水平
(4)由上可见,个别特殊数据可能对平均值产生大的影响,因此在进行统计分析时,对异常值要进行专门讨论,有时应剔除之