2.自己亲自体验制作频率分布表的过程,注意分组合理并确定恰当的组距;
[课堂互动]
自学评价
案例1 为了了解7月25日至8月24日北京地区的气温分布状况,我们对往年份这段时间的日最高气温进行抽样,并对得到的数据进行分析.我们随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:℃):
|
7月25日至8月10日 |
41.9 |
37.5 |
35.7 |
35.4 |
37.2 |
38.1 |
|
34.7 |
33.7 |
33.3 |
32.5 |
34.6 |
33.0 |
|
|
30.8 |
31.0 |
28.6 |
31.5 |
28.8 |
|
|
|
8月8日 至8月24日 |
28.6 |
31.5 |
28.8 |
33.2 |
32.5 |
30.3 |
|
30.2 |
29.8 |
33.1 |
32.8 |
29.4 |
25.6 |
|
|
24.7 |
30.0 |
30.1 |
29.5 |
30.3 |
|
怎样通过上表中的数据,分析比较两时间段的高温(≥33℃)状况呢?
[分析]
要比较两时间段的高温状况,最直接的方法就是分别统计这两时间段中高温天数.若天数差距明显,则结论显然,若天数差距不明显,可结合其他因素再综合考虑.上面两样本中的高温天数的频率用下表表示:
|
时间 |
总天数 |
高温天数(频数) |
频率 |
|
7月25日至8月10日 |
17 |
11 |
0.647 |
|
8月8日至8月24日 |
17 |
2 |
0.118 |
由此表可以发现,近年来,北京地区7月25日至8月10日的高温天气的频率明显高于8月8日至8月24日.
上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.
案例2 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm)。试作出该样本的样本的频率分布表。
|
168 |
165 |
171 |
167 |
170 |
165 |
170 |
152 |
175 |
174 |
|
165 |
170 |
168 |
169 |
171 |
166 |
164 |
155 |
164 |
158 |
|
170 |
155 |
166 |
158 |
155 |
160 |
160 |
164 |
156 |
162 |
|
160 |
170 |
168 |
164 |
174 |
171 |
165 |
179 |
163 |
172 |
|
180 |
174 |
173 |
159 |
163 |
172 |
167 |
160 |
164 |
169 |
|
151 |
168 |
158 |
168 |
176 |
155 |
165 |
165 |
169 |
162 |
|
177 |
158 |
175 |
165 |
169 |
151 |
163 |
166 |
163 |
167 |
|
178 |
165 |
158 |
170 |
169 |
159 |
155 |
163 |
153 |
155 |
|
167 |
163 |
164 |
158 |
168 |
167 |
161 |
162 |
167 |
168 |
|
161 |
165 |
174 |
156 |
167 |
166 |
162 |
161 |
164 |
166 |
[分析]该组数据中最小值为151,最大值为180,它们相差29,可取区间[150.5,180.5],并将此区间分成10个小区间,每个小区间长度为3,再统计出每个区间内的频数并计算相应的频率,我们将整个取值区间的长度称为全距,分成的区间的长度称为组距。
[解](完成空格和表格)
(1)在全部数据中找出最大值 和最小值 ,则两者之差为 ,确定全距为30,决定以组距3将区间[150.5,180.5]分成 个组;
(2)从第一组
开始,分别统计各组中的频数,再计算各组的频率,并将结果填入下表:
|
分 组 |
频数累计 |
频数 |
频率 |
|
|
|
4 |
|
|
|
|
8 |
|
|
|
|
|
|
|
|
|
11 |
|
|
|
|
22 |
|
|
|
|
|
|
|
|
|
14 |
|
|
|
|
|
|
|
|
|
4 |
|
|
|
|
3 |
|
|
合 计 |
|
100 |
1 |
[小结]编制频率分布表的步骤如下:
(1)求全距,决定组数和组距,组距=全距/组数;
(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
(3)登记频数,计算频率,列出频率分布表.
在分组时,为了容易看出规律,一般分组使每组的长度相等,组数不宜太多也不宜太少.一般地,称区间的左端点为下组限,右端点为上组限。我们可以采用下组限在内而上组限不在内的分组方法,也可采用下组限不在内而上组限在内 的分组方法。如果取全距时不利于分组(如不能被组数整除),如何处理可适当增大全距,如在左、右两端各增加适当范围(尽量使两端增加的量相同.
经营有术典范例
例 某铸件厂从规定尺寸为25.40mm的一堆零件中任取100件,测得它们的实际尺寸如下:
|
25.39 |
25.36 |
25.34 |
25.42 |
25.45 |
25.38 |
25.39 |
|
25.41 |
25.43 |
25.44 |
25.48 |
25.45 |
25.43 |
25.46 |
|
25.40 |
25.39 |
25.41 |
25.36 |
25.38 |
25.31 |
25.56 |
|
25.37 |
25.44 |
25.33 |
25.46 |
25.40 |
25.49 |
25.34 |
|
25.35 |
25.32 |
25.45 |
25.40 |
25.27 |
25.43 |
25.54 |
|
25.40 |
25.43 |
25.44 |
25.41 |
25.53 |
25.37 |
25.38 |
|
25.36 |
25.42 |
25.39 |
25.46 |
25.38 |
25.35 |
25.31 |
|
25.41 |
25.32 |
25.38 |
25.42 |
25.40 |
25.33 |
25.37 |
|
25.47 |
25.34 |
25.30 |
25.39 |
25.36 |
25.46 |
25.29 |
|
25.40 |
25.35 |
25.41 |
25.37 |
25.47 |
25.39 |
25.42 |
|
25.42 |
25.24 |
25.47 |
25.35 |
25.45 |
25.43 |
25.37 |
|
25.40 |
25.34 |
25.51 |
25.45 |
25.44 |
25.40 |
25.38 |
|
25.43 |
25.41 |
25.40 |
25.38 |
25.40 |
25.36 |
25.33 |
|
25.42 |
25.40 |
25.50 |
25.37 |
25.49 |
25.35 |
25.39 |
|
25.39 |
25.47 |
|
|
|
|
|
1)这100件零件尺寸的全距是多少?
2)如果将这100个数据分为11组,则如何分组?组距为多少?
3)画出以上数据的频率分布表。
4)如果规定尺寸在
之间的零件为合格产品抽样检查,合格品率大于85%,这批零件才能通过检验,则这批产品能通过检验吗?
[解](完成空格和表格)
1)该组数据中最小值为 ,最大值为 ,它们相差 ,故可取区间[25.235,25.565],并将此区间等分成11个区间,这100个零件尺寸的全距为
1.感受如何用样本频率分布表去估计总体分布;
6.2 总体分布的估计
第19课时 频率分布表
[学习导航]
学习要求
4.某单位有2000名职工,老年、中年、青年分布在管理、技术开发、营销、生产各部门中,如下表所示:
|
人数 |
管理 |
技术开发 |
营销 |
生产 |
小计 |
|
老年 |
40 |
40 |
40 |
80 |
200 |
|
中年 |
80 |
120 |
160 |
240 |
600 |
|
青年 |
40 |
160 |
280 |
720 |
1200 |
|
小计 |
160 |
320 |
480 |
1040 |
2000 |
(1)若要抽取40人调查身体情况,则应该怎样抽样?(2)若要开一个25人的讨论单位发展与薪金调整方面的座谈会,则应怎样抽选出席人?(3)若要抽20人调查对北京奥运会筹备情况的了解,则应怎样抽样?
[解]
3.某班有50名学生,(其中有30名男生,20名女生)现调查平均身高,准备抽取10%,问应如何抽样?如果已知男女身高有显著不同,又应如何抽样?
解:(1)
2.某商场想通过检查发票及销售记录的2%来快速估计每月的销售总额,采取如下方法:从某本50张的发票存根中随机抽取一张,如15号,然后按顺序往后将65号、115号、165号、…发票上的销售额组成一个调查样本。这种抽取样本的方法是 ( )
(A)抽签法 (B)系统抽样
(C)分层抽样 (D)随机数表法
1.某公司生产三种型号的轿车,产量分别为1200辆、6000辆、2000辆。为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车应分别抽取___ ____、___ ___和____ __辆。
2.三种抽样方法的比较(如表):
|
类别 |
特点 |
相互联系 |
适用范围 |
共同点 |
|
简单随机抽样 |
从总体中逐个抽取 |
|
总体中的个体数较少 |
抽样过程中每个个体被抽到的可能性相同 |
|
系统抽样 |
将总体平均分成几部分,按事先确定的规则分别在各部分中抽取 |
在起始部分抽样时,采用简单随机抽样 |
总体中的个体数较多 |
|
|
分层抽样 |
将总体分成几层,按各层个体数之比抽取 |
各层抽样时采用简单随机抽样或系统抽样 |
总体由差异明显的几部分组成 |
[经典范例]
例1 某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人,上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取。
[解]
例2 某电视台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12000人,其中持各种态度的人数如下表所示:
|
很喜爱 |
喜爱 |
一般 |
不喜爱 |
|
2435 |
4567 |
3926 |
1072 |
电视台为进一步了解观众的具体想法和意见,打算从中抽取60人进行更为详细的调查,应怎样进行抽样?
分析:因为总体中人数较多,所以不宜采用简单随机抽样,又由于持不同态度的人数差异较大,故也不宜用系统抽样方法,而以分层抽样为妥。
[解]
例3 某所学校有小学部、初中部和高中部,在校小学生、初中生和高中生之比为5:2:3,且已知初中生有800人,现要从这所学校中抽取一个容量为80的样本以了解他们对某一问题的看法,应采用什么抽样方法?从小学部、初中部及高中部各抽取多少名?总体上看,平均多少名学生中抽取到一名学生?
[解]
例4 下列问题中,采用怎样的抽样方法较为合理?
(1)从10台冰箱中抽取3台进行质量检查;
(2)某电影院有32排座位,每排有40个座位,座位号为1-40。有一次报告会坐满了听众,报告会结束以后为听取意见,需留下32名听众进行座谈;
(3)某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本。
分析:(1)用抽签法或随机数表法。
(2)总体容量比较大,用抽签法或随机数表法比较麻烦。由于人员没有明显差异,且刚好32排,每排人数相同,可用系统抽样。
(3)由于学校各类人员对这一问题的看法可能差异较大,故应采用分层抽样方法。
[解]
追踪训练
1.分层抽样
分层抽样的概念:当总体由
组成时,为了使样本
,我们常常____________
____________________________________
_______________________________,然后 ,这样的抽样方法称为分层抽样(stratified sampling)
分层抽样的步骤为:
(1) ;
(2) ;
(3)
;
(4)
。
[小结]①分层抽样适用于总体由差异比较明显的几个部分组成的情况,是等可能抽样,它也是客观的、公平的;
②分层抽样是建立在简单随机抽样或系统抽样的基础上的,由于它充分利用了已知信息,使样本具有较好的代表性,而且在各层抽样时可以根据情况采用不同的抽样方法,因此在实践中有着非常广泛的应用.
3.简单随机抽样、系统抽样、分层抽样的特点及适用范围。
[课堂互动]
自学评价
案例 某校高一、高二和高三年级分别有学生1000,800和700名,为了了解全校学生的视力情况,欲从中抽取容量为100的样本,怎样抽样较为合理.
[分析]如果在2500名学生中随机抽取100名学生作为样本,或者在三个年级中平均抽取学生组成样本,这样的样本是否合理?能否反映总体情况?
由于不同年级的学生视力状况有一定的差异,为准确反映客观实际,不仅要使每个个体被抽到的机会均等,而且要注意总体中个体的层次性,从而使抽取的样本具有良好的代表性. 对于这种容量较大、个体差异较大且明显分成几部分的总体,就考虑用分层抽样来抽取样本.
湖北省互联网违法和不良信息举报平台 | 网上有害信息举报专区 | 电信诈骗举报专区 | 涉历史虚无主义有害信息举报专区 | 涉企侵权举报专区
违法和不良信息举报电话:027-86699610 举报邮箱:58377363@163.com