当前位置:网站首页>度量学习(Metric learning、损失函数、triplet、三元组损失、fastreid)
度量学习(Metric learning、损失函数、triplet、三元组损失、fastreid)
2022-08-04 05:29:00 【TigerZ*】
1)离线挖掘
训练集所有数据经过计算得到对应的embedding,根据embedding计算得到(a,p)和(a,n)之间的距离,根据这个距离判断三元组属于semi-hard triplets,hard triplets还是easy triplets中的哪一类。Offline triplet mining 仅仅用于选择hard或者semi-hard的三元组类型,因为easy triplet太容易了,没有必要训练。总得来说,这个方法效率不高。
2)在线挖掘(不要慌,使用pytorch实现均仅仅需要几行代码便可实现)
为每一batch动态挖掘有用的三元组,即只计算batch中的triplets。假设一个batch的数据有P个人,每人K张图片,则共包含P*K张人脸。针对valid triplet的挑选(即构成A-P-N对),有如下两种策略:
Batch all:计算所有的valid triplet,对hard 和 semi-hard triplets上的loss进行平均(easy triplets不参与计算,平均会导致loss很小),可以得到PK(K-1)(PK-K)个三元组。
Batch hard: 对于每一个锚点,选择距离最大的正样本(a,p)和距离最小的负样本(a,n),可以得到PK个三元组。
加权:对于每一个锚点,通过样本到anchor的最大距离加权计算所有样本到anchor的距离的加权和(正负样本同理),可以得到PK个三元组(逻辑上其实并不再是真实存在的三元组,为加权均值,包含easy,semi-hard 和hard)。
再详细理解可以参考:https://zhuanlan.zhihu.com/p/266916361
Fastreid(截止20210730)实现了batch hard 和加权的功能,,可以参考对应的实现:https://github.com/JDAI-CV/fast-reid/blob/master/fastreid/modeling/losses/triplet_loss.py
triplet loss同时拉近一对正样本和一对负样本,这就导致在选取样本对的时候,当前样本对只能够关注一对负样本对,而缺失了对其他类别样本的区分能力。
为了改善这种情况,N-pair loss就选取了多个负样本对,即一对正样本对,选取其他所有不同类别的样本作为负样本与其组合得到负样本对。如果数据集中有 N个类别,则每个正样本对 yii都对应了N-1个负样本对。
边栏推荐
猜你喜欢
线性回归02---波士顿房价预测
[Deep Learning 21-Day Learning Challenge] 3. Use a self-made dataset - Convolutional Neural Network (CNN) Weather Recognition
[Deep Learning 21 Days Learning Challenge] 1. My handwriting was successfully recognized by the model - CNN implements mnist handwritten digit recognition model study notes
(十六)图的基本操作---两种遍历
光条中心提取方法总结(一)
YOLOV4流程图(方便理解)
【CV-Learning】Image Classification
Simple and clear, the three paradigms of database design
[Deep Learning 21 Days Learning Challenge] 2. Complex sample classification and recognition - convolutional neural network (CNN) clothing image classification
动手学深度学习_线性回归
随机推荐
SQL练习 2022/7/3
简单明了,数据库设计三大范式
光条中心提取方法总结(二)
TensorFlow2 study notes: 8. tf.keras implements linear regression, Income dataset: years of education and income dataset
MFC读取点云,只能正常显示第一个,显示后面时报错
WARNING: sql version 9.2, server version 11.0.Some psql features might not work.
Image-Adaptive YOLO for Object Detection in Adverse Weather Conditions
postgresql 事务隔离级别与锁
审稿意见回复
安卓连接mysql数据库,使用okhttp
TensorFlow2 study notes: 5. Common activation functions
fill_between in Matplotlib; np.argsort() function
TypeError: load() missing 1 required positional argument: ‘Loader‘
[Deep Learning 21 Days Learning Challenge] 2. Complex sample classification and recognition - convolutional neural network (CNN) clothing image classification
Comparison of oracle's number and postgresql's numeric
Attention Is All You Need(Transformer)
图像resize
SQL练习 2022/7/2
MySQL leftmost prefix principle [I understand hh]
PyTorch