当前位置:网站首页>余弦距离介绍
余弦距离介绍
2022-08-03 19:08:00 【xiaozheng123121】
目录
作者:CSDN博主「深度学习视觉」
原文链接:https://blog.csdn.net/lucky_kai/article/details/89514868
————————————————
概述: 在机器学习领域中,通常将特征表示为向量的形式,所以在分析两个特征向量之间的相似性时,常用余弦相似度表示。
例如将两篇文章向量化,余弦距离可以避免因为文章的长度不同而导致距离偏大,余弦距离只考虑两篇文章生成的向量的夹角。
余弦相似度的取值范围是[-1,1],相同两个向量的之间的相似度为1。
余弦距离的取值范围是[0,2]。
余弦相似度的定义公式为 c o s ( A , B ) = A ⋅ B ∥ A ∥ 2 ∥ B ∥ 2 cos(A,B)=\frac{A\cdot B}{\left\|A \right\|_2\left\|B \right\|_2} cos(A,B)=∥A∥2∥B∥2A⋅B
归一化后: ∥ A ∥ 2 = 1 , ∥ B ∥ 2 = 1 , ∥ A ∥ 2 ∥ B ∥ 2 = 1 \left\|A\right\|_2=1, \left\|B\right\|_2=1, \left\|A\right\|_2\left\|B\right\|_2=1 ∥A∥2=1,∥B∥2=1,∥A∥2∥B∥2=1
余弦距离: d i s t ( A , B ) = 1 − c o s ( A , B ) = ∥ A ∥ 2 ∥ B ∥ 2 − A ⋅ B ∥ A ∥ 2 ∥ B ∥ 2 dist(A,B)=1-cos(A,B)=\frac{\left\|A \right\|_2\left\|B \right\|_2-A\cdot B}{\left\|A \right\|_2\left\|B \right\|_2} dist(A,B)=1−cos(A,B)=∥A∥2∥B∥2∥A∥2∥B∥2−A⋅B,距离恒大于0
欧式距离:
由公式可以看出归一化后,欧式距离与余弦距离存在单调性关系。此时两种距离的值域都为[0,2]。
欧式距离与余弦距离的对比:
1.欧式距离的数值受到维度的影响,余弦相似度在高维的情况下也依然保持低维完全相同时相似度为1等性质。
2.欧式距离体现的是距离上的绝对差异,余弦距离体现的是方向上的相对差异。
边栏推荐
- ADS 2023 Download Link
- [笔记]机器学习之前言介绍
- 云图说丨初识华为云微服务引擎CSE
- Postgresql source code (64) Query execution - data structure and execution process before submodule Executor (2) execution
- 软件测试回归案例,什么是回归测试?
- 【C语言学习笔记(七)】C语言重定向输入与输出
- 实时渲染器不止lumion,Chaos Vantage你值得一试
- 2022年7月国产数据库大事记
- MySQL如何 drop 大表
- MySQL 啥时候用表锁,啥时候用行锁?这些你都应该知道吧
猜你喜欢
随机推荐
Postgresql source code (65) analysis of the working principle of the new snapshot system Globalvis
基于ck+redash构建MySQL慢日志+审计日志展示平台
Mkke:为什么无法从Oracle 11g或12c升级到Oracle 23c?
mysql跨库关联查询(dblink)
力扣刷题之分数加减运算(每日一题7/27)
How does MySQL permanently support Chinese input once and for all?
一文搞懂│php 中的 DI 依赖注入
pg_memory_barrier_impl in Postgresql and C's volatile
普通用户如何利用小红书赚钱呢?小红书的流量是真的吗?
Matlab论文插图绘制模板第42期—气泡矩阵图(相关系数矩阵图)
选出表中的中位数记录[构造左右边界 || 问题转换]
网络协议-TCP、UDP区别及TCP三次握手、四次挥手
【计网】二、物理层
Oracle 脚本实现简单的审计功能
阿里巴巴政委体系-第五章、阿里政委体系建设
Chrome浏览器开发新截图工具,安全浏览器截图方法
ctfshow php特性
dd命令:用于读取、转换并输出数据
pytest接口自动化测试框架 | 基于Pytest的Web UI自动化测试框架介绍
云图说丨初识华为云微服务引擎CSE