当前位置:网站首页>Distribution gaussienne, régression linéaire, régression logistique

Distribution gaussienne, régression linéaire, régression logistique

2022-06-27 06:07:00 Les mangues sont très brillantes

Distribution gaussienneGaussian distribution/Distribution normaleNormal distribution

1.Une présence étendue

2020Année11Mois24Jour,Lancement réussi de la sonde Chang'e 5.Son orbite est critique,Une courbe peut être calculée à partir des trois lois de Kepler,Mais la courbe n'est qu'une piste idéale,Il y a une erreur dans l'orbite réelle,Comment le résoudre??Cette question a hanté la communauté scientifique pendant des années,Jusqu'à ce que Gauss publie《Théorie du Mouvement céleste》Il n'y a que des solutions concrètes.Le livre présente une méthode:Méthode des moindres carrés,À condition que l'erreur de mesure soit conforme à la distribution normale.

“Gao Fu Shuai”,La taille des hommes adultes d'un pays correspond à la distribution gaussienne;“Double11”,Le volume des ventes du produit est également conforme à la distribution gaussienne;“CET-4/6”,Les résultats des examens des étudiants sont également conformes à la distribution gaussienne;“Isolement épidémique14Oh, mon Dieu.”,14Le ciel est calculé à partir de la distribution gaussienne……Derrière tant d'événements très différents, il y a des ombres gaussiennes.

Shanghai a choisi au hasard1000Hommes,Notez la taille de chacun,Diviser les données en50Intervalles,Tracer un histogramme de fréquence,J'ai trouvé la taille174cmLe plus grand nombre,Les extrémités gauche et droite sont particulièrement courtes/Les grands sont rarement.Élargir les données10X/100X/10000X,Dessinez la section plus fine.Une courbe lisse peut être tracée —— Distribution gaussienne/Distribution normale.

2.Distribution gaussienne

Distribution normale/Courbe de distribution gaussienneComme un pic.,Il y a des hauts et des bas, des hauts et des bas,(Hauteur moyenne,Bas des deux côtés,Symétrie des deux côtés). Déterminé par deux paramètres :Moyenneμ( Moyenne des données représentatives )、Écart typeσ( Représente le degré de dispersion des données ,Plus l'écart type est grand, Certaines valeurs sont loin de la moyenne , Plus discrète , Plus le pic est lent ;Plus l'écart type est faible, La valeur est proche de la moyenne , Plus l'agglomération , Plus la montagne est raide .)

Exemple: Du chocolat Dev VSPommes, L'emballage de Dev montre 43g, Mais il y a une petite erreur par rapport à la réalité , Son poids satisfait à la valeur moyenne de 43gLa distribution gaussienne de, L'écart type est très faible . Peser chaque pomme , Son poids répond également à la distribution gaussienne , Supposons que le poids moyen soit 250g, Alors la pomme Poids réel autour de la moyenne 250gDistribution symétrique gauche - droite, Par rapport à Defoe , L'écart type est très élevé .

3.3σ-Lignes directrices

 

 (μ-σ,μ+σ)Section, La probabilité qu'un événement tombe est 68.2%;(μ-2σ,μ+2σ), La probabilité que l'événement tombe est 95.4%;(μ-3σ,μ+3σ), La probabilité que l'événement tombe est 99.73%;Certains pensent 3σ- Les règles ne sont pas assez strictes , Il y a six Sigma Gérer les normes de qualité , C'est - à - dire que l'intervalle est étendu à (μ-6σ,μ+6σ), La probabilité de tomber est 99.9998%, La probabilité de tomber en dehors de l'intervalle n'est que de deux parties par milliard .

4. Galton nailboard Experiment — “Chapitre 9” L'ordinateur quantique est sorti

 

 “Chapitre 9” Une nouvelle percée dans l'informatique quantique en Chine , Résoudre les algorithmes mathématiques Gauss Bose Sampling La vitesse de 200Secondes, Et les superordinateurs actuels utilisent 6Milliards d'années.

L'appareil d'échantillonnage Bose n'est pas seulement le choix de la gauche et de la droite dans l'expérience de Galton nailboard , Mais ils interagissent , Et plus d'un photon à la fois , Peut - être un grand nombre de photons , Cela peut entraîner des problèmes de temps .

Régression linéaire — Méthode des moindres carrés

Tracer le flux quotidien moyen de personnes dans les cafés du centre commercial (Argumentsx) Et le revenu journalier moyen ( Variables prévues , Variable attendue y) Un diagramme de dispersion des données .

Régression linéaire:AvecUne ligne droite Pour ajuster la relation entre les variables indépendantes et dépendantes (Équation linéairey=kx+b)

Comment obtenir cette ligne ?—— Méthode des moindres carrés. Estimation obtenue par régression linéaire , Plus l'estimation est proche de la valeur réelle, mieux c'est. , Représente une estimation plus précise .

Régression logiquelogistics regression = Régression linéaire+sigmoidFonctions

Un algorithme d'exploration des données ,À quoi bon?? Utilisé pour résoudre les problèmes de classification secondaire . Pas de régression logique “Retour” Tricher en deux mots !!!

Questions de classification: Problèmes liés à la détermination de la catégorie de données .Ii) Questions de classification: Il n'y a que deux catégories d'objectifs pour les problèmes de classification

 La différence entre régression et classification? Résultats continus du modèle de régression ,La sortie du modèle de classification est discrète.

  En prenant la valeur de la fonction de régression linéaire comme sigmoidEntrée de la fonction

 

 Comment résoudre

Plus la fonction de perte est petite, Le meilleur modèle de régression ! 

  La solution n'a pas besoin d'être calculée manuellement , Le Code peut gérer !DisponiblesparkCadre

 

原网站

版权声明
本文为[Les mangues sont très brillantes]所创,转载请带上原文链接,感谢
https://yzsam.com/2022/178/202206270559415198.html