当前位置:网站首页>论文阅读 (64):Weakly-supervised Video Anomaly Detection with Robust Temporal Feature Magnitude Learning
论文阅读 (64):Weakly-supervised Video Anomaly Detection with Robust Temporal Feature Magnitude Learning
2022-08-02 06:39:00 【因吉】
1 引入
1.1 题目
1.2 代码
Torch:https://github.com/tianyu0207/RTFM
1.3 摘要
弱监督视频级别异常检测是一个典型的多示例学习 (Multi-instance learning, MIL) 问题,每一个视频看作是一个包含多个帧的包,目的是判断包中是否包含异常片段。目前的检测方法性能优异,但它们对正实例,即异常视频中罕见的异常片段的识别,在很大程度上受到了支配性负实例的影响,特别是当异常事件是与正常事件相比时只有很小差异的细微异常时。在许多忽略重要视频时间依赖性的方法中,这个问题更加严重。
为了解决这个问题,提出了健壮性时间特征量级学习:
1)训练了一个特征量级学习函数来有效地识别正实例,大大提高了MIL方法对异常视频负实例的鲁棒性;
2)采用空洞卷积 (Dilated convolutions) 和自注意力机制来捕获长距离和短距离的时间依赖性,从而更可靠地学习特征量级。
1.4 Bib
@inproceedings{
Tian:2021:49754986,
author = {
Yu Tian and Guan Song Pang and Yuan Hong Chen and Rajvinder Singh and Johan W Verjans and Gustavo Carneiro},
title = {
Weakly-supervised video anomaly detection with robust temporal feature magnitude learning},
booktitle = {
{
IEEE/CVF} International Conference on Computer Vision},
pages = {
4975--4986},
year = {
2021},
url = {
https://openaccess.thecvf.com/content/ICCV2021/html/Tian_Weakly-Supervised_Video_Anomaly_Detection_With_Robust_Temporal_Feature_Magnitude_Learning_ICCV_2021_paper.html}
}
2 RTFM
RTFM的目的是基于弱标记视频来最大程度地区分异常视频和正常视频。给定训练视频的集合 D = { ( F i , y i ) } i = 1 ∣ D ∣ \mathcal{D}=\{(\mathbf{F}_i,y_i)\}_{i=1}^{|\mathcal{D}|} D={(Fi,yi)}i=1∣D∣,其中 F ∈ F ⊂ R T × D \mathbf{F}\in\mathcal{F}\subset\mathbb{R}^{T\times D} F∈F⊂RT×D是 T T T个视频帧的 D D D维预计算特征,例如I3D和C3D; y ∈ Y = { 0 , 1 } , 1 y\in\mathcal{Y}=\{0,1\},1 y∈Y={ 0,1},1表示异常, 0 0 0反之。令 r θ , ϕ ( F ) = f ϕ ( s θ ( F ) ) r_{\theta,\phi}(\mathbf{F})=f_{\phi}(s_\theta(\mathbf{F})) rθ,ϕ(F)=fϕ(sθ(F))表示RTFM模型,其将返回一个 T T T维特征 [ 0 , 1 ] T [0,1]^T [0,1]T以表示视频帧是否异常。
模型的训练包括包括端到端多尺度时间特征学习、特征量级学习,以及MIL 分类器。损失函数如下:
min θ , ϕ ∑ i , j = 1 ∣ D ∣ ℓ s ( s θ ( F i ) , s θ ( F j ) , y i , y j ) + ℓ f ( f ϕ ( s θ ( F i ) ) , y i ) , \min_{\theta,\phi}\sum_{i,j=1}^{|\mathcal{D}|}\ell_s(s_\theta(\mathbf{F}_i),s_\theta(\mathbf{F}_j),y_i,y_j)+\ell_f(f_\phi(s_\theta(\mathbf{F}_i)),y_i), θ,ϕmini,j=1∑∣D∣ℓs(sθ(Fi),sθ(Fj),yi,yj)+ℓf(fϕ(sθ(Fi)),yi),其中 s θ : F → X ⊂ R T × D s_\theta: \mathcal{F}\rightarrow\mathcal{X}\subset\mathbb{R}^{T\times D} sθ:F→X⊂RT×D是时间特征提取器、 f ϕ : X → [ 0 , 1 ] T f_\phi: \mathcal{X}\rightarrow[0,1]^T fϕ:X→[0,1]T是一个帧级分类器、$$
边栏推荐
- Swagger的简单介绍,集成,以及如何在生产环境中关闭swagger,在测试和开发环境中自动打开
- 2020美亚团队赛复盘
- CAT1 4G+以太网开发板腾讯云手机微信小程序显示温度和下发控制
- [npm install error report collection] - npm ERR! code ENOTEMPTY npm ERR! syscall rmdir
- 论文《Deep Multifaceted Transformers for Multi-objective Ranking in Large-Scale E-commerce Recommender》
- Ue after video tutorial first
- 张驰课堂:六西格玛测量系统的误差分析与判定
- 解决:- SPY: No data found for this date range, symbol may be delisted报错
- 振兴农村循环经济 和数链串起农业“生态链”
- 文件上传漏洞(二)
猜你喜欢
随机推荐
关于ue4.27像素流送打包后的本地服务器问题
File upload vulnerability (2)
[21天学习挑战赛——内核笔记](一)——设备树的概述(硬件、目标、效果、文件类型)
Specified URL is not reachable,caused by :‘Read timed out
【论文精读】Geometric Structure Preserving Warp for Natural Image Stitching
张驰课堂:六西格玛培训工具——箱线图
2022.07.31(LC_6132_使数组中所有元素都等于零)
实例027:递归输出
Wuhan 2022 organizing of the high-performance computing added new ecological development of high-performance computing
_2_顺序表
About the local server problem after ue4.27 pixel streaming package
(部分不懂,笔记整理未完成)【图论】差分约束
.NET静态代码织入——肉夹馍(Rougamo) 发布1.1.0
论文《Deep Multifaceted Transformers for Multi-objective Ranking in Large-Scale E-commerce Recommender》
System.Security.SecurityException: 未找到源,但未能搜索某些或全部事件日志。不可 访问的日志: Security
In-depth analysis of the initialization of member variables and local variables
新产品立大功 伟世通第二季度营收双增
Resolving C# non-static field, method or property "islandnum.Program.getIslandCount(int[][], int, int)" requires an object reference
【图像去噪】基于matlab双立方插值和稀疏表示图像去噪【含Matlab源码 2009期】
数据库概论-MySQL的数据表的基本操作