当前位置:网站首页>度量学习(Metric learning、损失函数、triplet、三元组损失、fastreid)
度量学习(Metric learning、损失函数、triplet、三元组损失、fastreid)
2022-08-04 05:29:00 【TigerZ*】




1)离线挖掘
训练集所有数据经过计算得到对应的embedding,根据embedding计算得到(a,p)和(a,n)之间的距离,根据这个距离判断三元组属于semi-hard triplets,hard triplets还是easy triplets中的哪一类。Offline triplet mining 仅仅用于选择hard或者semi-hard的三元组类型,因为easy triplet太容易了,没有必要训练。总得来说,这个方法效率不高。
2)在线挖掘(不要慌,使用pytorch实现均仅仅需要几行代码便可实现)
为每一batch动态挖掘有用的三元组,即只计算batch中的triplets。假设一个batch的数据有P个人,每人K张图片,则共包含P*K张人脸。针对valid triplet的挑选(即构成A-P-N对),有如下两种策略:
Batch all:计算所有的valid triplet,对hard 和 semi-hard triplets上的loss进行平均(easy triplets不参与计算,平均会导致loss很小),可以得到PK(K-1)(PK-K)个三元组。
Batch hard: 对于每一个锚点,选择距离最大的正样本(a,p)和距离最小的负样本(a,n),可以得到PK个三元组。
加权:对于每一个锚点,通过样本到anchor的最大距离加权计算所有样本到anchor的距离的加权和(正负样本同理),可以得到PK个三元组(逻辑上其实并不再是真实存在的三元组,为加权均值,包含easy,semi-hard 和hard)。
再详细理解可以参考:https://zhuanlan.zhihu.com/p/266916361
Fastreid(截止20210730)实现了batch hard 和加权的功能,,可以参考对应的实现:https://github.com/JDAI-CV/fast-reid/blob/master/fastreid/modeling/losses/triplet_loss.py


triplet loss同时拉近一对正样本和一对负样本,这就导致在选取样本对的时候,当前样本对只能够关注一对负样本对,而缺失了对其他类别样本的区分能力。
为了改善这种情况,N-pair loss就选取了多个负样本对,即一对正样本对,选取其他所有不同类别的样本作为负样本与其组合得到负样本对。如果数据集中有 N个类别,则每个正样本对 yii都对应了N-1个负样本对。




边栏推荐
- Various commands such as creating a new user in postgresql
- 软著撰写注意事项
- Logistic Regression --- Introduction, API Introduction, Case: Cancer Classification Prediction, Classification Evaluation, and ROC Curve and AUC Metrics
- (十)树的基础部分(一)
- 剑指 Offer 2022/7/5
- MFC 打开与保存点云PCD文件
- Attention Is All You Need(Transformer)
- 【CV-Learning】目标检测&实例分割
- Install dlib step pit record, error: WARNING: pip is configured with locations that require TLS/SSL
- 光条中心提取方法总结(二)
猜你喜欢

TensorFlow2 study notes: 4. The first neural network model, iris classification

双重指针的使用

postgresql 事务隔离级别与锁

MFC读取点云,只能正常显示第一个,显示后面时报错

动手学深度学习_softmax回归

Logistic Regression --- Introduction, API Introduction, Case: Cancer Classification Prediction, Classification Evaluation, and ROC Curve and AUC Metrics

安卓连接mysql数据库,使用okhttp

Jupyter Notebook installed library;ModuleNotFoundError: No module named 'plotly' solution.

TensorFlow2学习笔记:7、优化器

Halcon缺陷检测
随机推荐
字典特征提取,文本特征提取。
计算某像素点法线
TensorFlow2学习笔记:4、第一个神经网模型,鸢尾花分类
(TensorFlow) - detailed explanation of tf.variable_scope and tf.name_scope
(十六)图的基本操作---两种遍历
2020-10-19
oracle的number与postgresql的numeric对比
Endnote编辑参考文献
postgres recursive query
Thread 、Handler和IntentService的用法
TensorFlow2学习笔记:7、优化器
TensorFlow2学习笔记:6、过拟合和欠拟合,及其缓解方案
Thoroughly understand box plot analysis
彻底搞懂箱形图分析
空洞卷积
[CV-Learning] Semantic Segmentation
【深度学习21天学习挑战赛】1、我的手写被模型成功识别——CNN实现mnist手写数字识别模型学习笔记
【论文阅读】Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation
SQL练习 2022/7/3
pytorch学习-没掌握的点