当前位置:网站首页>高斯分布Gaussian distribution、線性回歸、邏輯回歸logistics regression
高斯分布Gaussian distribution、線性回歸、邏輯回歸logistics regression
2022-06-27 06:06:00 【芒果很芒~】
高斯分布Gaussian distribution/正態分布Normal distribution
1.廣泛的存在
2020年11月24日,探月工程嫦娥五號探測器發射成功。其運轉軌道至關重要,根據開普勒三大定律可以計算出一條曲線,但曲線只是一個理想軌道,現實中的軌道是有誤差的,如何解决呢?這個問題困擾了科學界多年,直到高斯出版了《天體運行論》才有具體解决方案。書中介紹了一個方法:最小二乘法,前提是測量誤差要符合正態分布。
“高富帥”,一個國家的成年男性的身高符合高斯分布;“雙11”,產品的銷售量也是符合高斯分布;“CET-4/6”,學生的考試成績也符合高斯分布;“疫情隔離14天”,14天就是由高斯分布計算出來的……如此多截然不同事件的背後都有高斯分布的影子。
上海隨機抽取了1000名男子,記錄每個人的身高,將數據劃分為50個區間,繪制頻數直方圖,發現身高174cm的人數最多,左右兩端特別矮/高的人很少。將數據擴大10倍/100倍/10000倍,將區間繪制更細。可繪制出一條平滑曲線 —— 高斯分布/正態分布。
2.高斯分布
正態分布/高斯分布曲線像山峰,有高低陡緩,(中間高,兩邊低,兩邊對稱)。由兩個參數决定:均值μ(代錶數據的平均水平)、標准差σ(代錶數據的離散程度,標准差越大,一些數值離平均值差距較大,越離散,山峰越緩慢;標准差越小,數值較接近平均值,越集聚,山峰越陡。)

例:德芙巧克力VS蘋果,德芙包裝上顯示43g,但與實際存在細微誤差,其重量滿足均值為43g的高斯分布,標准差非常小。將每個蘋果稱重,其重量也滿足高斯分布,假設平均重量為250g,那麼蘋果的實際重量圍繞均值250g左右對稱分布,較於德福,其標准差非常大。

3.3σ-准則

(μ-σ,μ+σ)區間,事件落入其中的概率為68.2%;(μ-2σ,μ+2σ),事件落入的概率為95.4%;(μ-3σ,μ+3σ),事件落入的概率為99.73%;有人覺得 3σ-准則不够嚴苛,就有了六西格瑪管理質量標准,即把區間擴大到(μ-6σ,μ+6σ),落入的概率為99.9998%,落入區間之外的概率僅為十億分之二。
4.高爾頓釘板實驗 — “九章”量子計算機問世



“九章”中國量子計算新突破,求解數學算法高斯玻色取樣的速度只需200秒,而目前的超級計算機要用6億年。
玻色采樣裝置不只高爾頓釘板實驗的左右兩種選擇了,而是會相互作用,且一次不止投放一個光子,可能是大批量的光子一起投入,這會導致高耗時的問題。
線性回歸 — 最小二乘法
繪制商場中咖啡店的日均人流量(自變量x)與日均收入(被預測的變量,應變量y)的數據的散點圖。
線性回歸:用一條直線來擬合自變量和因變量之間的關系(線性方程y=kx+b)
如何得到這條直線?—— 最小二乘法。線性回歸得到估計值,估計值與實際值越近越好,代錶估計的值越准確。

邏輯回歸logistics regression = 線性回歸+sigmoid函數
數據挖掘中的一種算法,有啥用?用來解决二分類問題。不要被邏輯回歸的“回歸”二字所欺騙!!!
分類問題:判斷數據所屬類別的問題。二分類問題:分類問題的目標類只有兩種類別


回歸和分類的區別?回歸模型的輸出時連續的,分類模型的輸出是離散的。

把線性回歸的函數值作為sigmoid函數的輸入


如何求解
損失函數越小,回歸模型越好!


求解不用手算,代碼可以搞定!可用spark框架
边栏推荐
- Nlp-d62-nlp competition d31 & question brushing D15
- 汇编语言-王爽 第11章 标志寄存器-笔记
- Webrtc series - Nomination and ice of 7-ice supplement for network transmission_ Model
- 多线程基础部分Part 1
- Small program of C language practice (consolidate and deepen the understanding of knowledge points)
- JVM整体结构解析
- Database - index
- 下载cuda和cudnn
- 693. 交替位二进制数
- 【Cocos Creator 3.5.1】event. Use of getbutton()
猜你喜欢

Double position relay jdp-1440/dc110v
![[FPGA] design and implementation of frequency division and doubling based on FPGA](/img/84/75d473d3d8e670260ba16d06705c2f.png)
[FPGA] design and implementation of frequency division and doubling based on FPGA

函数栈帧的形成与释放

信息系统项目管理师---第七章 项目成本管理

Leetcode99 week race record

426 binary tree (513. find the value in the lower left corner of the tree, 112. sum of paths, 106. construct a binary tree from the middle order and post order traversal sequence, 654. maximum binary

My opinion on test team construction

IAR Systems全面支持芯驰科技9系列芯片
![Navigation [machine learning]](/img/79/8311a409113331e72f650a83351b46.png)
Navigation [machine learning]
软件测试年终总结报告模板
随机推荐
vscode korofileheader 的配置
Wechat applet refreshes the current page
1317. convert an integer to the sum of two zero free integers
Spark 之 built-in functions
Built in functions of spark
Multithreading basic Part3
[collection] Introduction to basic knowledge of point cloud and functions of point cloud catalyst software
The restart status of the openstack instance will change to the error handling method. The openstack built by the container restarts the compute service method of the computing node and prompts the gi
Open the door small example to learn ten use case diagrams
JVM的垃圾回收机制
openstack实例重启状态就会变成错误处理方法,容器搭建的openstack重启计算节点compute服务方法,开机提示Give root password for maintenance处理方法
【养成系】常用正则表达式
The SCP command is used in the expect script. The perfect solution to the problem that the SCP command in the expect script cannot obtain the value
免费的 SSH 和 Telnet 客户端PuTTY
How to check the frequency of memory and the number of memory slots in CPU-Z?
Codeforces Round #802 (Div. 2)
mysql 查询时将状态改为相对应的文字
Altium Designer 19 器件丝印标号位置批量统一摆放
Assembly language - Wang Shuang Chapter 3 notes and experiments
Spark 之 WholeStageCodegen
