当前位置:网站首页>机器学习之线性回归详解
机器学习之线性回归详解
2022-07-01 10:07:00 【HUIM_Wang】
机器学习之线性回归详解
线性回归的算法:
重点介绍梯度下降算法。
评估模型好坏的方法:损失函数(lost function)
最简单常见的损失函数:最小均方差(mse)
公式如下:
预测房价数据,假如模型y=1,最终的值60132无实际意义,但是在对比之下,值越小越好。最好的最小均方差是尽量接近0的,但是根据数据样本不同,不可能等于0
假如预测房价,特征值是面积,目标值是房价,需要拟合出一条线,计算出权重m和b
步骤一:假设m=0,即y=b,则b为唯一的可调参数,利用最小均方差公式,计算出最小的最小均方差,在此过程中拟合出一个最优的参数b
从上得知,“最优”的b值应该是mse=612对应的241附近,这样的话较为符合房价的价格。(这个过程需要一个一个地找最小mse对应的b,比较麻烦,并且图中给的b是从1开始找的,因为不确定b的值,一旦b的值为负值就麻烦了)
为了能尽快并且准确地找到最合适的b,需要引入一个新概念:学习速率(learning rate)
先看一组图:
需要找到最小的mse对应的b点
不管b从何值开始取,都需要让计算机根据线的趋势动态地找到最小mse值,即求导数,
根据上图,求出的导最小值是-8,对应着最小均方差,此时b=241
尽管如此,此时的b仍是我们用肉眼观察到的最小值,并且b的变化和取值是我们人工加上去的f,计算机可理解不了,我们需要根据一些信号量来调整b的变化。
假如曲线很陡峭的话,例如图b,斜率的值会负的很离谱,那接下来的预测点就是在曲线的右边而不是左边;如果是图a情况,斜率会很大,应该让b往左边偏移 ,也就是说如果斜率为负值,那么接下来的猜测点应该往右移,如果为正值,应该往左移,直到曲线趋于平缓,导数接近于0.
上面我们提到了学习速率(learning rate),它可以根据mse对b的导数,最快地找到最合适的b,如果导数负的越大,那么它就应该变化的越多,如果导数越小,越接近于0,那么它应该变化的越小。
学习速率是一个值,例如0.0001,学习速率是这样用的:本次的b=上一个b - 上一个导数 * 学习速率,如此循环迭代下去,可以很快的找到最接近0的导数对应的b 。
如果学习速率越小的话,例如0.000001,那么b的值变化的越慢,如果学习速率越大的话,例如0.1、0.8,b值变化的越快。变化的越慢就代表要进行大量的迭代,计算量大,不过最终求出的b值会越精确;变化的越快计算量也相应少了很多,但是b值可能不是最好的那个。
如下图:当学习速率为0.00001、0.001,0.01、0.1时:
当learning rate 为0.2时,b慢慢的趋近于245,导数慢慢的趋近于0
learning rate的值不能太大,否则b只会离正确的点越来越远
为了简化模型,以上便是y=mx+b,(m=0)情况下,求可调参数也就是权重b的值。(这是一种极端情况,正常情况下m≠0)
所以一般情况下我们要对m和b分别求导:
同理,得出:
边栏推荐
- It is interesting to understand MMAP in this way!
- PO模式深入封装
- 渗透常用工具-Goby
- Win11账号被锁定无法登录怎么办?Win11账号被锁定无法登录
- BSN长话短说之十:如何保证NFT的安全
- scratch大鱼吃小鱼 电子学会图形化编程scratch等级考试二级真题和答案解析2022年6月
- Dotnet console uses microsoft Maui. Getting started with graphics and skia
- 日本教授起诉英特尔FPGA与SoC产品侵犯一项设计专利
- 数据中台咋就从“小甜甜”变成了“牛夫人”?
- CentOS configures discuz prompt, please check whether the MySQL module is loaded correctly
猜你喜欢
C [byte array] and [hexadecimal string] mutual conversion - codeplus series
Have you learned the necessary global exception handler for the project
The latest masterpiece of Alibaba, which took 182 days to produce 1015 pages of distributed full stack manual, is so delicious
一个悄然崛起的国产软件,低调又强大!
7-Zip boycotted? The callers have committed "three crimes": pseudo open source, unsafe, and the author is from Russia!
苹果放大招!这件事干的太漂亮了……
Zero foundation software testing must see, 10 years of testing old bird's conscience suggestions (a total of 15)
CSDN's one-stop cloud service is open for internal testing, and new and old users are sincerely invited to grab the fresh
SQL server2014 failed to delete the database, with an error offset of 0x0000
Initial experience of Flink, a mainstream real-time stream processing computing framework
随机推荐
MySQL常用命令
Which securities company has a low, safe and reliable Commission for stock trading and account opening
About database: how to avoid deadlock in gbase 8s
亿学学堂帮个人开的证券账户安全吗?是不是有套路
Who's still buying three squirrels
SQL 化是 ETL 增量生产的第一步,这样的架构的核心能力是什么?
Who has the vision to cross the cycle?
7-Zip boycotted? The callers have committed "three crimes": pseudo open source, unsafe, and the author is from Russia!
This is the best flash popular science article I have ever seen!
leetcode:111. Minimum depth of binary tree
About widthstep of images in opencv
What should I learn in the zero foundation entry test? It's the most comprehensive. Just learn from it
我喜欢两个男人。。。
在通达信上买基金安全吗?
京东与腾讯续签三年战略合作协议;起薪涨至26万元!韩国三星SK争相加薪留住半导体人才;Firefox 102 发布|极客头条...
Is it safe to do fund fixed investment on CICC securities?
Cortex M4 systick details
“中移链”国密引擎在BSN正式上线
在中金证券上做基金定投安全吗?
IPv6 learning notes