当前位置:网站首页>论文阅读 (64):Weakly-supervised Video Anomaly Detection with Robust Temporal Feature Magnitude Learning
论文阅读 (64):Weakly-supervised Video Anomaly Detection with Robust Temporal Feature Magnitude Learning
2022-08-02 06:39:00 【因吉】
1 引入
1.1 题目
1.2 代码
Torch:https://github.com/tianyu0207/RTFM
1.3 摘要
弱监督视频级别异常检测是一个典型的多示例学习 (Multi-instance learning, MIL) 问题,每一个视频看作是一个包含多个帧的包,目的是判断包中是否包含异常片段。目前的检测方法性能优异,但它们对正实例,即异常视频中罕见的异常片段的识别,在很大程度上受到了支配性负实例的影响,特别是当异常事件是与正常事件相比时只有很小差异的细微异常时。在许多忽略重要视频时间依赖性的方法中,这个问题更加严重。
为了解决这个问题,提出了健壮性时间特征量级学习:
1)训练了一个特征量级学习函数来有效地识别正实例,大大提高了MIL方法对异常视频负实例的鲁棒性;
2)采用空洞卷积 (Dilated convolutions) 和自注意力机制来捕获长距离和短距离的时间依赖性,从而更可靠地学习特征量级。
1.4 Bib
@inproceedings{
Tian:2021:49754986,
author = {
Yu Tian and Guan Song Pang and Yuan Hong Chen and Rajvinder Singh and Johan W Verjans and Gustavo Carneiro},
title = {
Weakly-supervised video anomaly detection with robust temporal feature magnitude learning},
booktitle = {
{
IEEE/CVF} International Conference on Computer Vision},
pages = {
4975--4986},
year = {
2021},
url = {
https://openaccess.thecvf.com/content/ICCV2021/html/Tian_Weakly-Supervised_Video_Anomaly_Detection_With_Robust_Temporal_Feature_Magnitude_Learning_ICCV_2021_paper.html}
}
2 RTFM
RTFM的目的是基于弱标记视频来最大程度地区分异常视频和正常视频。给定训练视频的集合 D = { ( F i , y i ) } i = 1 ∣ D ∣ \mathcal{D}=\{(\mathbf{F}_i,y_i)\}_{i=1}^{|\mathcal{D}|} D={(Fi,yi)}i=1∣D∣,其中 F ∈ F ⊂ R T × D \mathbf{F}\in\mathcal{F}\subset\mathbb{R}^{T\times D} F∈F⊂RT×D是 T T T个视频帧的 D D D维预计算特征,例如I3D和C3D; y ∈ Y = { 0 , 1 } , 1 y\in\mathcal{Y}=\{0,1\},1 y∈Y={ 0,1},1表示异常, 0 0 0反之。令 r θ , ϕ ( F ) = f ϕ ( s θ ( F ) ) r_{\theta,\phi}(\mathbf{F})=f_{\phi}(s_\theta(\mathbf{F})) rθ,ϕ(F)=fϕ(sθ(F))表示RTFM模型,其将返回一个 T T T维特征 [ 0 , 1 ] T [0,1]^T [0,1]T以表示视频帧是否异常。
模型的训练包括包括端到端多尺度时间特征学习、特征量级学习,以及MIL 分类器。损失函数如下:
min θ , ϕ ∑ i , j = 1 ∣ D ∣ ℓ s ( s θ ( F i ) , s θ ( F j ) , y i , y j ) + ℓ f ( f ϕ ( s θ ( F i ) ) , y i ) , \min_{\theta,\phi}\sum_{i,j=1}^{|\mathcal{D}|}\ell_s(s_\theta(\mathbf{F}_i),s_\theta(\mathbf{F}_j),y_i,y_j)+\ell_f(f_\phi(s_\theta(\mathbf{F}_i)),y_i), θ,ϕmini,j=1∑∣D∣ℓs(sθ(Fi),sθ(Fj),yi,yj)+ℓf(fϕ(sθ(Fi)),yi),其中 s θ : F → X ⊂ R T × D s_\theta: \mathcal{F}\rightarrow\mathcal{X}\subset\mathbb{R}^{T\times D} sθ:F→X⊂RT×D是时间特征提取器、 f ϕ : X → [ 0 , 1 ] T f_\phi: \mathcal{X}\rightarrow[0,1]^T fϕ:X→[0,1]T是一个帧级分类器、$$

边栏推荐
- 实例029:反向输出
- 【图像隐藏】基于matlab混合DWT-HD-SVD数字图像水印方法技术【含Matlab源码 2007期】
- .NET Static Code Weaving - Rougamo Release 1.1.0
- Reverse resolve dns server
- 2020美亚团队赛复盘
- How does abaqus quickly import the assembly of other cae files?
- Ue after video tutorial first
- [Dataset][VOC] Eyewear dataset 6000 in VOC format
- 海缆探测仪TSS350(二)
- 【暑期每日一题】洛谷 P1551 亲戚
猜你喜欢

CAT1 4G+以太网开发板腾讯云手机微信小程序显示温度和下发控制

Pagoda+FastAdmin 404 Not Found

实例029:反向输出
![[Dataset][VOC] Male and female dataset voc format 6188 sheets](/img/72/d3e46a820796a48b458cd2d0a18f8f.png)
[Dataset][VOC] Male and female dataset voc format 6188 sheets

optional

_2_顺序表

System.Security.SecurityException: 未找到源,但未能搜索某些或全部事件日志。不可 访问的日志: Security

MQ带来的一些问题、及解决方案

See the picture to understand | How to choose sales indicators to measure the health of business growth

PWA 踩坑 - 第一次加载页面后无法获取CacheStorage某些资源
随机推荐
反射课后习题及做题记录
正则表达式的理解学习
At age 94, pioneer Turing award winner, computational complexity theory, Juris Hartmanis, died
Resolving C# non-static field, method or property "islandnum.Program.getIslandCount(int[][], int, int)" requires an object reference
聊天机器人如何提升独立站的营销水平?
速看!PMP新考纲、PMBOK第七版解读
技术管理三级跳
实验7 MPLS实验
The second day HCIP
php删除一维数组中一个值
Summer Summary (3)
看图就懂|衡量业务增长健康的销售指标如何选择
【机器学习】实验2布置:基于回归分析的大学综合得分预测
HCIP 第四天
docker 安装mysql
Vscode连接远程服务器出现‘Acquiring lock on/home/~’问题
File upload vulnerability (2)
chrome plugin development guide
Specified URL is not reachable,caused by :‘Read timed out
交换--STP协议