当前位置:网站首页>基于最小二乘法的线性回归分析方程中系数的估计
基于最小二乘法的线性回归分析方程中系数的估计
2022-08-02 14:10:00 【杨老头软工】
一、问题描述
一元线性回归分析时一种非常简单也是非常基本的回归理论,能够用来刻画两个变量之间的以线性关系的变化趋势,进而预测未知点处的数据。
回归分析就是根据已知数据的变化趋势来确定回归函数(方程),其中回归系数待定,而后利用一些数值方法或者统计方法来估计回归系数。
一元线性回归分析就是估计方程y=kx+b是中的系数k和b,常见的方法有:计算数学的方法——最小二乘法、统计方法——最大似然估计法、机器学习方法——感知机等,此外还可以利用矩阵的运算(其实是极小值解而已)来直接求解。
本文以y = 2x + 1和y=-2x+5的数据进行拟合为例,给出了利用最小二乘法来估计回归系数的方法及matlab实现。
二、数学推导
问题描述:
如上图所示,假设已知数据点(xi,yi),i=1…n,且经过散点图的观察基本满足线性变化趋势,据此求出红色直线的函数表达式。
如上图所示,最小二乘法就是利用途中黑色线段所表示已知点到回归曲线的距离平方和最小来估计回归函数中待定系数。
公式推导如下:
把(xi,yi)代入y=kx+b得:
构造最小二乘函数(距离平方和):
对k和b分别求偏导数得:
上述方程组两端同时除以数据点个数n得:
方程(2)可以进一步转化为:
其中
将
代入(1)得:
将k代入
即可得到系数b,至此,回归方程中的两个系数计算完毕。
三、Matlab程序
1.根据散点图判读曲线变化趋势
trainX = linspace( 0, 2, 50 );
trainY = 2 * trainX + 1 + randn( size( trainX ) )*0.4;
plot( trainX, trainY, 'b.', 'markersize', 20 )
如下图所示:
从图中点的分布情况可以看出基本呈现线性增长的趋势,因此可以考虑使用y=kx+b来拟合该组数据。
2.回归系数计算如下:
n = length( trainX );
xu = sum( trainX ) / n;
yu = sum( trainY ) / n;
k1 = sum( trainX .* trainY ) - n * xu * yu;
k2 = sum( trainX .* trainX ) - n * xu * xu;
k = k1 / k2;
b = yu - k * xu;
计算结果为:
K = 1.8467, b = 1.2669
3.完整的代码如下:
% 利用最小二乘法估计线性回归函数y = kx + b中的系数k和b
clear all
clc
%生成训练数据
trainX = linspace( 0, 2, 50 );
trainY = 2 * trainX + 1 + randn( size( trainX ) )*0.4;
%绘制散点图
plot( trainX, trainY, 'b.', 'markersize', 20 )
%估计回归系数
n = length( trainX );
xu = sum( trainX ) / n;
yu = sum( trainY ) / n;
k1 = sum( trainX .* trainY ) - n * xu * yu;
k2 = sum( trainX .* trainX ) - n * xu * xu;
k = k1 / k2;
b = yu - k * xu;
%绘制回归函数曲线(直线)
hold on
x = [ -0.5 ; 2.5 ];
y = k * x + b; %回归方程
plot( x, y, 'r', 'LineWidth', 2 );
title( 'LSM : y = 2x + 1' )
axis( [ -0.5, 2.5, -1, 7 ] )
拟合结果如下:
修改语句 “trainY = 2 * trainX + 1 + randn( size( trainX ) )*0.1;”
为不同的函数关系,即可得到不同回归曲线。例如修改为
“trainY = -2 * trainX -5 + randn( size( trainX ) )*0.4;”
可以得到如下拟合图像:
四、补充说明
最小二乘法是一种非常优秀的利用求函数极值来估计回归方程中参数的方法,事实上,极大似然法估计回归系数的目标函数虽然不一样,但是结果和直接利用最小二乘法估计的结果是一样。
边栏推荐
- 5. Use RecyclerView to elegantly achieve waterfall effect
- cmake配置libtorch报错Failed to compute shorthash for libnvrtc.so
- Mysql连接错误解决
- PyTorch⑦---卷积神经网络_非线性激活
- GICv3/v4-软件概述
- Failed to install using npx -p @storybook/cli sb init, build a dedicated storybook by hand
- 机器学习和深度学习中的梯度下降及其类型
- 蓝牙温度检测系统(基于BT08-B蓝牙模块)
- DP4344兼容CS4344-DA转换器
- PyTorch(15)---模型保存和加载
猜你喜欢
PyTorch⑤---卷积神经网络_卷积层
为android系统添加产品的过程
轻量化AlphaPose
FP7195大功率零压差全程无频闪调光DC-DC恒流芯片(兼容调光器:PWM调光,无极调光,0/1-10V调光)
Win10 computer can't read U disk?Don't recognize U disk how to solve?
Win11电脑一段时间不操作就断网怎么解决
Win11没有本地用户和组怎么解决
Win11 computer off for a period of time without operating network how to solve
win10无法直接用照片查看器打开图片怎么办
PyTorch(11)---卷积神经网络_一个小的神经网络搭建model
随机推荐
FP7195芯片PWM转模拟调光至0.1%低亮度时恒流一致性的控制原理
What should I do if I install a solid-state drive in Win10 and still have obvious lags?
STM32LL库——USART中断接收不定长信息
数据偏见的背后是什么
A clean start Windows 7?How to load only the basic service start Windows 7 system
FP7128内置MOS降压恒流调光深度0.01%高辉共阳调光方案
PyTorch④---DataLoader的使用
golang之GMP调度模型
DP4301无线收发SUB-1G芯片兼容CC1101智能家居
关系代数、SQL与逻辑式语言
Win11声卡驱动如何更新?Win11声卡驱动更新方法
【系统设计与实现】基于flink的分心驾驶预测与数据分析系统
FP7195转模拟恒流调光芯片在机器视觉光源的应用优势
How to solve Win11 without local users and groups
【STM32学习1】基础知识与概念明晰
win10 system update error code 0x80244022 how to do
PyTorch⑦---卷积神经网络_非线性激活
Win11系统找不到dll文件怎么修复
FP6293电池升压5V-12V大电流2APWM模式升压方案
如何用硬币模拟1/3的概率,以及任意概率?