当前位置:网站首页>Time Series Data Augmentation for Deep Learning: A Survey 之论文阅读
Time Series Data Augmentation for Deep Learning: A Survey 之论文阅读
2022-06-24 07:54:00 【理心炼丹】
原始题目:Time Series Data Augmentation for Deep Learning: A Survey
中文翻译:深度学习的时间序列数据增强:综述
发表时间:2022年3月31日
平台:IJCAI 2022-02
来源:DAMO Academy, Alibaba Group, Bellevue, WA, USA
文章链接:https://arxiv.org/pdf/2002.12478.pdf
开源代码:
摘要
深度学习最近在许多时间序列分析任务中表现得非常好。深度神经网络的优越性能很大程度上依赖于大量的训练数据来避免过拟合。然而,许多现实世界的时间序列应用的标记数据可能是有限的,如医学时间序列的分类和 AIOps 的异常检测。作为提高训练数据规模和质量的有效方法,数据增强是深度学习模型成功应用于时间序列数据的关键。本文系统地回顾了不同的时间序列数据增强方法。我们建议对这些方法进行分类,然后通过强调它们的优点和局限性,对这些方法进行结构化审查。我们还实证比较了不同的数据增强方法的不同任务,包括时间序列分类,异常检测和预测。最后,我们讨论并强调了未来的五个方向,以提供有用的研究指导。
6 结论
随着深度学习模型在时间序列数据上的普及,有限的标签数据需要有效的数据增强方法。本文对时间序列数据增强方法在不同任务中的应用进行了综述。我们将回顾的方法分为基本方法和先进方法,总结每个类别的代表性方法,并在典型任务中进行实证比较,并指出未来的研究方向。
1. 引言

图1:时间序列数据增强技术的分类(taxonomy)
本文旨在填补上述空白,总结现有的时间序列数据增强方法在常见任务中的应用,包括时间序列预测、异常检测、分类等,并提供有远见的未来发展方向。为此,我们提出了一种时间序列数据增强方法的分类,如图1所示。在分类法的基础上,对这些数据增强方法进行了系统的评述。我们首先从时域的简单变换开始讨论。然后在变换后的频率域和时频域讨论更多的时间序列变换。
除了时间序列在不同域的转换,我们还总结了更高级的方法,包括基于分解的方法、基于模型的方法和基于学习的方法。对于基于学习的方法,我们进一步将其分为嵌入空间、深度生成模型(DGMs)和自动化数据增强方法。为了证明数据增强的有效性,我们在三个典型的时间序列任务中对增强方法进行了初步评估,包括时间序列分类、异常检测和预测。最后,我们讨论并强调了五个未来的方向: 增强(时频域、非平衡类、选择与组合、高斯过程和深度生成模型)。
4.2时间序列异常检测
考虑到时间序列异常检测存在数据稀缺和数据不平衡的问题,采用数据增强的方法产生更多的标注数据是有益的。我们在[Gao等人,2020]中简要总结了结果,其中基于 U-Net 的网络被设计并在公开的 Yahoo! 数据集[Laptev等人,2015]用于时间序列异常检测。不同设置下的性能比较如表2所示,分别是对原始数据(U-Net-Raw)、分解残差(U-Net-DeW)和数据增强残差(U-Net-DeWA)应用该模型(U-Net)进行的性能比较。应用的数据增强方法包括翻转、裁剪、标签扩张(expansion)和基于APP的频域增强。可以看出,分解有助于F1分数的提高,数据扩充进一步提高了性能。

表2:基于数据增强的时间序列异常检测的 precision, recall, and F1 score的提升。
边栏推荐
- [ES6 breakthrough] promise is comparable to native custom encapsulation (10000 words)
- [e325: attention] VIM editing error
- 阿里资深软件测试工程师推荐测试人员必学——安全测试入门介绍
- Spark - the number of leftouterjoin results is inconsistent with that of the left table
- 【输入法】迄今为止,居然有这么多汉字输入法!
- Code written by mysql, data addition, deletion, query and modification, etc
- 【牛客】HJ1 字符串最后一个单词的长度
- 216. combined summation III enumeration method
- Depens:*** but it is not going to be installed
- Yolox backbone -- implementation of cspparknet
猜你喜欢

Groovy通过withCredentials获取Jenkins凭据
Depens:*** but it is not going to be installed

从华为WeAutomate数字机器人论坛,看政企领域的“政务新智理”

数云发布2022美妆行业全域消费者数字化经营白皮书:全域增长破解营销难题

浮点数表示法(总结自CS61C和CMU CSAPP)

The native applet uses canvas to make posters, which are scaled to the same scale. It is similar to the uniapp, but the writing method is a little different

【gdb调试工具】| 如何在多线程、多进程以及正在运行的程序下调试
![[MySQL from introduction to mastery] [advanced part] (I) character set modification and underlying principle](/img/db/e581087e550a2e460f12047685c48f.png)
[MySQL from introduction to mastery] [advanced part] (I) character set modification and underlying principle

12、 Demonstration of all function realization effects

Opencv daily function structure analysis and shape descriptor (7) finding polygon (contour) / rotating rectangle intersection
随机推荐
荐书丨《好奇心的秘密》:一个针尖上可以站多少跳舞的小天使?
RISC-V架构下 FPU Context 的动态保存和恢复
The native applet uses canvas to make posters, which are scaled to the same scale. It is similar to the uniapp, but the writing method is a little different
2022-06-23:给定一个非负数组,任意选择数字,使累加和最大且为7的倍数,返回最大累加和。 n比较大,10的5次方。 来自美团。3.26笔试。
Alibaba Senior Software Testing Engineer recommends testers to learn -- Introduction to security testing
玄铁E906移植----番外0:玄铁C906仿真环境搭建
Implementation process of tcpdump packet capturing
Squid proxy application
When programmers are asked if they can repair computers... | daily anecdotes
当程序员被问会不会修电脑时… | 每日趣闻
深入解析 Apache BookKeeper 系列:第三篇——读取原理
Webrtc series - network transmission 5: select the optimal connection switching
学习太极创客 — ESP8226 (十二)ESP8266 多任务处理
tcpdump抓包实现过程
Squid代理服务器应用
leetcode——错误的集合
华为路由器:ipsec技术
pm2 部署 nuxt3.js 项目
[noi Simulation Competition] geiguo and time chicken (structure)
1704. judge whether the two halves of a string are similar