1.回归直线方程的系数a,b的最小二乘估计使函数
最小,
函数指( ).
A.
B.
C.
D.![]()
[例1]有如下一组y与x的数据
|
|
-3 |
-2 |
-1 |
0 |
1 |
2 |
3 |
|
y |
9 |
4 |
1 |
0 |
1 |
4 |
9 |
问y与x的(样本)相关系数r是多少?这是否说明y与x没有关系?
错解:![]()
所以相关系数r=0,即y与x没有关系.
错因:相关系数r=0并不是说明y与x没有关系,而是说明y与x没有线性相关关系,但有可能有非线性相关关系.
正解:![]()
所以相关系数r=0,即y与x没有线性相关关系,但有可能有非线性相关关系.
此题中y与x之间存在着
的二次相关关系的.
[例2]某工厂在2004年的各月中,一产品的月总成本y(万元)与月产量x(吨)之间有如下数据:
|
x |
4.16 |
4.24 |
4.38 |
4.56 |
4.72 |
4.96 |
5.18 |
5.36 |
5.6 |
5.74 |
5.96 |
6.14 |
|
y |
4.38 |
4.56 |
4.6 |
4.83 |
4.96 |
5.13 |
5.38 |
5.55 |
5.71 |
5.89 |
6.04 |
6.25 |
若2005年1月份该产品的计划产量是6吨,试估计该产品1月份的总成本.
分析:可将此问题转化为下面三个问题:
(1)画出散点图,根据散点图,大致判断月总成本y与月产量之间是否有线性相关关系;
(2)求出月总成本y与月产量x之间的线性回归方程;
(5) 若2005年1月份该产品的计划产量是6吨,试估计该产品1月份的总成本.
错解:省去第一步,即把判断判断月总成本y与月产量之间是否有线性相关关系的过程舍去,想当然其具有线性相关关系,直接代入公式,求出线性回归方程.
错因:此题的月总成本y与月产量x之间确实是有线性相关关系,若不具有则会导致错误.因此判断的过程不可少.
正解:(1)散点图见下面,从图中可以看到,各点大致在一条直线附近,说明x与y有较强的线性相关关系.
![]()
(2)代入公式(*)得:a=0.9100,b=0.6477,线性回归方程是:y=0.9100x+0.6477.
(3)当x=6.0时,y=0.9100
(万元),即该产品1月份的总成本的估计值为6.11万元.
[例3]变量
与
有线性回归方程
,现在将
的单位由
变为
的单位由
变为
,则在新的回归方程
中.
.
错解:0.1![]()
错因:由
且
的值变为原来的
,
的值变为原来的
可得
的值应为原来的
.
正解:0.01![]()
[例4]假定一个物体由不同的高度落下,并测量它落下的时间,几个测量结果如下表所示:
|
高度s(cm) |
40 |
60 |
100 |
130 |
150 |
180 |
200 |
220 |
240 |
|
时间t(ms) |
353 |
387 |
505 |
552 |
579 |
648 |
659 |
700 |
725 |
高度(距离)与时间之间的关系由公式
给出,这里g是重力加速度的值.
(1)画出s关于t的散点图,这些点在一条直线附近吗?
(2)设
,画出s关于x的散点图,这些点在一条直线附近吗?
(3)求出s关于x的线性回归方程.
解:(1)高度s关于时间t的散点图见下面,从图中可以看到这些点似乎在一条直线附近,也好像在一条抛物线附近
![]()
(2)高度s关于x的散点图见下面,从图中可以看到这些散点大致在一条直线附近
![]()
(3)可以求得s关于x的线性回归方程是s=0.0004901x-18.8458
[例5]测得某国10对父子身高(单位:英寸)如下:
|
父亲身高(x) |
60 |
62 |
64 |
65 |
66 |
67 |
68 |
70 |
72 |
74 |
|
儿子身高(y) |
63.5 |
65.2 |
66 |
65.5 |
66.9 |
67.1 |
67.4 |
68.3 |
70.1 |
70 |
(1)画出散点图;
(2)求出y与x之间的线性回归方程;
(3)如果父亲的身高为73英寸,估计儿子的身高.
解:(1)散点图见下面:
![]()
(2)从散点图可以看出,这些点都分布在一条直线附近,可求得线性回归方程为![]()
(3)当
时,![]()
所以当父亲的身高为73英寸时,估计儿子的身高约为69.9英寸.
5. “最好的”直线方程中“最好”可以有多种解释,也就有不同的求解方法,现在广泛采用的最小二乘法所用的思想是找到使散点到直线
在垂直方向上的距离的平方和最小的直线
,用这个方法,
的求解最简单
4. 比较相关关系绝对值的大小可以比较一组变量之间哪两个变量有更强的(线性)相关关系.
3.还有其他寻找较好的回归直线的原则(如使y方向的偏差和最小,使各点到回归直线的距离之和最小等)
2.用最小二乘估计方法计算得到的
使函数
达到最小
1.现实世界中两个变量的关系中更多的是相关关系而不是确定性关系,许多物理学中公式看起来是确定性关系,实际上由于公式的使用范围,测量误差等的影响,试验得到的数据之间是相关关系.
5.一般地,用回归直线进行拟合的一般步骤为:
(1)作出散点图,判断散点是否在一条直线附近;
(2)如果散点在一条直线附近,用公式(*)求出
,并写出线性回归方程.
4.线性回归方程
中的系数
满足:
![]()
由此二元一次方程组便可依次求出
的值:
(*)
3. 一般地,设有(x,y)的n对观察数据如下:
|
|
|
|
|
…… |
|
|
|
|
|
|
…… |
|
当a,b使![]()
取得最小值时,就称
为拟合这n对数据的线性回归方程,将该方程所表示的直线称为回归直线.
湖北省互联网违法和不良信息举报平台 | 网上有害信息举报专区 | 电信诈骗举报专区 | 涉历史虚无主义有害信息举报专区 | 涉企侵权举报专区
违法和不良信息举报电话:027-86699610 举报邮箱:58377363@163.com