2. 线性回归方程
中
,
的意义是:以
为基数,
每增加1个单位,
相应地平均增加
个单位;
1. 线性回归模型
与确定性函数
相比,它表示
与
之间是统计相关关系(非确定性关系)其中的随机误差
提供了选择模型的准则以及在模型合理的情况下探求最佳估计值
,
的工具;
2.练习:
练习第
题.
1.例题:
例1.下表给出了我国从
年至
年人口数据资料,试根据表中数据估计我国
年的人口数.
|
年份 |
|
|
|
|
|
|
|
|
|
|
|
|
人口数/百万 |
|
|
|
|
|
|
|
|
|
|
|
解:为了简化数据,先将年份减去
,并将所得值用
表示,对应人口数用
表示,得到下面的数据表:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
作出
个点
构成的散点图,
由图可知,这些点在一条直线附近,可以用线性回归模型
来表示它们之间的关系.
根据公式(1)可得
![]()
这里的
分别为
的估
计值,因此线性回归方程
为![]()
由于
年对应的
,代入线性回归方程
可得
(百万),即
年的人口总数估计为13.23亿.
例2. 某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本
(万元)与人均产出
(万元)的数据:
|
人均 资本 |
|
|
|
|
|
|
|
|
|
|
|
人均 产出 |
|
|
|
|
|
|
|
|
|
|
(1)设
与
之间具有近似关系
(
为常数),试根据表中数据估计
和
的值;
(2)估计企业人均资本为
万元时的人均产出(精确到
).
分析:根据
,
所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归方程处理.但由对数运算的性质可知,只要对
的两边取对数,就能将其转化为线性关系.
解(1)在
的两边取常用对数,可得
,设
,
,
,则
.相关数据计算如图
所示.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
人均资本 |
3 |
4 |
5.5 |
6.5 |
7 |
8 |
9 |
10.5 |
11.5 |
14 |
|
2 |
人均产出 |
4.12 |
4.67 |
8.68 |
11.01 |
13.04 |
14.43 |
17.5 |
25.46 |
26.66 |
45.2 |
|
3 |
|
0.47712 |
0.60 |
0.74036 |
0.81291 |
0. |
0.90309 |
0.95424 |
1.02119 |
1.0607 |
1.14613 |
|
4 |
|
0.6149 |
0.66932 |
0.93852 |
1.04179 |
1.11528 |
1.15927 |
1.24304 |
1.40586 |
1.42586 |
1.65514 |
仿照问题情境可得
,
的估计值
,
分
别为
由
可得
,即
,
的估计值分别为
和
.
(2)由(1)知
.样本数据及回归曲线的图形如图
(见书本
页)
当
时,
(万元),故当企业人均资本为
万元时,人均产值约为
万元.
4. 化归思想(转化思想)
在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,
从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式.
(1)
,令
,
,则有
.
(2)
,令
,
,
,则有
.
(3)
,令
,![]()
,
,则有
.
(4)
,令
,
,
,则有
.
(5)
,令
,
,则有
.
3. 线性回归方程
中
,
的意义是:以
为基数,
每增加1个单位,
相应地平均增加
个单位;
2.探求线性回归系数的最佳估计值:
对于问题②,设有
对观测数据![]()
,根据线性回归模型,对于每一个
,对应的随机误差项
,我们希望总误差越小越好,即要使
越小越好.所以,只要求出使
取得最小值时的
,
值作为
,
的估计值,记为
,
.
注:这里的
就是拟合直线上的点
到点
的距离.
用什么方法求
,
?
回忆《数学3(必修)》“2.4线性回归方程”P71“
热茶问题”中求
,
的方法:最小二乘法.
利用最小二乘法可以得到![]()
,
的计算公式为
,
其中
,![]()
由此得到的直线
就称为这
对数据的回归直线,此直
线方程即为线性回归方程.其中
,
分别为
,
的估计值,
称为回归截距,
称为回归系数,
称为回归值.
在前面质点运动的线性回归方程
中,
,
.
1.线性回归模型的定义:
我们将用于估计
值的线性函数
作为确定性函数;
的实
际值与估计值之间的误差记为
,称之为随机误差;
将
称为线性回归模型.
说明:(1)产生随机误差的主要原因有:
①所用的确定性函数不恰当引起的误差;
②忽略了某些因素的影响;
③存在观测误差.
(2)对于线性回归模型,我们应该考虑下面两个问题:
①模型是否合理(这个问题在下一节课解决);
②在模型合理的情况下,如何估计
,
?
思考,讨论:这些点并不都在同一条直线上,上述直线并不能精确地反映
与
之间的关系,
的值不能由
完全确定,它们之间是统计相关关系,
的实际值与估计值之间存在着误差.
2.问题:在时刻
时,质点的运动位置一定是
吗?
湖北省互联网违法和不良信息举报平台 | 网上有害信息举报专区 | 电信诈骗举报专区 | 涉历史虚无主义有害信息举报专区 | 涉企侵权举报专区
违法和不良信息举报电话:027-86699610 举报邮箱:58377363@163.com