当前位置:网站首页>余弦距离介绍
余弦距离介绍
2022-08-03 19:08:00 【xiaozheng123121】
目录
作者:CSDN博主「深度学习视觉」
原文链接:https://blog.csdn.net/lucky_kai/article/details/89514868
————————————————
概述: 在机器学习领域中,通常将特征表示为向量的形式,所以在分析两个特征向量之间的相似性时,常用余弦相似度表示。
例如将两篇文章向量化,余弦距离可以避免因为文章的长度不同而导致距离偏大,余弦距离只考虑两篇文章生成的向量的夹角。
余弦相似度的取值范围是[-1,1],相同两个向量的之间的相似度为1。
余弦距离的取值范围是[0,2]。
余弦相似度的定义公式为 c o s ( A , B ) = A ⋅ B ∥ A ∥ 2 ∥ B ∥ 2 cos(A,B)=\frac{A\cdot B}{\left\|A \right\|_2\left\|B \right\|_2} cos(A,B)=∥A∥2∥B∥2A⋅B
归一化后: ∥ A ∥ 2 = 1 , ∥ B ∥ 2 = 1 , ∥ A ∥ 2 ∥ B ∥ 2 = 1 \left\|A\right\|_2=1, \left\|B\right\|_2=1, \left\|A\right\|_2\left\|B\right\|_2=1 ∥A∥2=1,∥B∥2=1,∥A∥2∥B∥2=1
余弦距离: d i s t ( A , B ) = 1 − c o s ( A , B ) = ∥ A ∥ 2 ∥ B ∥ 2 − A ⋅ B ∥ A ∥ 2 ∥ B ∥ 2 dist(A,B)=1-cos(A,B)=\frac{\left\|A \right\|_2\left\|B \right\|_2-A\cdot B}{\left\|A \right\|_2\left\|B \right\|_2} dist(A,B)=1−cos(A,B)=∥A∥2∥B∥2∥A∥2∥B∥2−A⋅B,距离恒大于0
欧式距离:
由公式可以看出归一化后,欧式距离与余弦距离存在单调性关系。此时两种距离的值域都为[0,2]。
欧式距离与余弦距离的对比:
1.欧式距离的数值受到维度的影响,余弦相似度在高维的情况下也依然保持低维完全相同时相似度为1等性质。
2.欧式距离体现的是距离上的绝对差异,余弦距离体现的是方向上的相对差异。
边栏推荐
- 力扣刷题之合并两个有序数组
- 首届MogDB征文活动开启啦!
- pytest接口自动化测试框架 | Jenkins集成初探
- X86 function call model analysis
- Shell编程案例
- Climbing Stairs (7/30)
- Web项目中简单使用线程池
- MySQL读写分离的三种实现方案
- Don't look down upon the WebSocket!Long connection, stateful, two-way, full-duplex king is Fried
- Power button brush the topic of merging two orderly array
猜你喜欢
6000 字+,帮你搞懂互联网架构演变历程!
Zhong Hua, senior architect of Ali: China-Taiwan strategic thinking and architecture practice; including internal implementation manual
基于DMS的数仓智能运维服务,知多少?
梅科尔工作室-14天华为培训七
2022年7月国产数据库大事记
面试突击:什么是粘包和半包?怎么解决?
Mkke:为什么无法从Oracle 11g或12c升级到Oracle 23c?
Cobalt Strike (CS) 逆向初探
分享即时通讯开发之WebSocket:概念、原理、易错常识、动手实践
WEB 渗透之CSRF
随机推荐
学弟:我适不适合转行做软件测试?
安装radondb mysql遇到问题
Alibaba senior experts create a learning architecture from scratch, including Alibaba's internal technology stack PPT, PFD actual combat
online 方式创建索引触发trigger怎么办?
Postgresql中的pg_memory_barrier_impl和C的volatile
Don't look down upon the WebSocket!Long connection, stateful, two-way, full-duplex king is Fried
Cobalt Strike (CS) 逆向初探
剑指Offer 56.数组中数字出现的次数
Chrome浏览器开发新截图工具,安全浏览器截图方法
【HCIP】MPLS实验
首届MogDB征文活动开启啦!
201709-3 CCF jason查询 (满分题解)
Confused!Ali was abused on the one hand, but was fortunate to be promoted to Huawei's technology, and successfully got the offer, with an annual salary of 40w
【WPS-OFFICE-Word】 WPS中样式的运作原理?样式自动更新、自动改变如何处理?样式的管理方法?
力扣刷题之求两数之和
丙二醇二乙酸酯(Propylene Glycol Diacetate)
MySQL【变量、流程控制与游标】
[Notes] Introduction to machine learning
POJ 3041 Asteroids(最大匹配数=最小点覆盖)
Postgresql-xl全局快照与GTM代码走读(支线)