当前位置:网站首页>Meta Learning 简述
Meta Learning 简述
2022-07-02 06:26:00 【MezereonXP】
Meta Learning 简述
先来回顾一下,传统的机器学习或者说深度学习的流程:
- 确定训练和测试数据集
- 确定模型结构
- 初始化模型参数(通常是一些惯用的随机分布)
- 初始化优化器类型和参数
- 进行训练,直到收敛
Meta Learning的目的是去学习一些在步骤2,3,4的参数,我们称之为元知识(meta- knowledge)
不妨对其进行形式化
假设数据集为 D = { ( x 1 , y 1 ) , . . . , ( x N , y N ) } D = \{(x_1,y_1),...,(x_N,y_N)\} D={ (x1,y1),...,(xN,yN)} 其中 x i x_i xi 是输入, y i y_i yi 是输出标签
我们的目的是得到一个预测模型 y ^ = f ( x ; θ ) \hat{y} = f(x;\theta) y^=f(x;θ) , 其中 θ \theta θ 表示模型的参数, x x x 为输入同时 y ^ \hat{y} y^ 是预测的输出
优化的形式为:
θ ∗ = arg min θ L ( D ; θ , ω ) \theta^*=\arg \min_{\theta} \mathcal{L}(D;\theta,\omega) θ∗=argθminL(D;θ,ω)
其中的 ω \omega ω 就是元知识,包括:
- 优化器类型
- 模型结构
- 模型参数的初始分布
- …
我们会对已有的数据集 D D D 进行任务划分,切分成多个任务集合,每一个任务集合包括一个训练集合以及一个测试集合,其形式为:
D s o u r c e = { ( D s o u r c e t r a i n , D s o u r c e v a l ) ( i ) } i = 1 M D_{source} = \{(D^{train}_{source},D^{val}_{source})^{(i)}\}_{i=1}^{M} Dsource={ (Dsourcetrain,Dsourceval)(i)}i=1M
优化目标为:
ω ∗ = arg max ω log p ( ω ∣ D s o u r c e ) \omega^* = \arg \max_{\omega} \log p(\omega|D_{source}) ω∗=argωmaxlogp(ω∣Dsource)
也就是在我们切分的多个任务集合中,找到一组配置(也就是元知识),使其对于这些任务来说最优。
一般称这个步骤为元训练(meta-training)
找到 ω ∗ \omega^* ω∗ 之后,便可以应用到一个目标任务数据集 D t a r g e t = { ( D t a r g e t t r a i n , D t a r g e t v a l ) } D_{target} = \{(D_{target}^{train}, D_{target}^{val})\} Dtarget={ (Dtargettrain,Dtargetval)}
在这上面进行传统的训练,也就是找到一个最优的模型参数 θ ∗ \theta^* θ∗
θ ∗ = arg max θ log p ( θ ∣ ω ∗ , D t a r g e t t r a i n ) \theta^* = \arg\max_{\theta}\log p(\theta|\omega^*, D_{target}^{train}) θ∗=argθmaxlogp(θ∣ω∗,Dtargettrain)
这个步骤称之为元测试(meta-testing)
边栏推荐
- [learning notes] matlab self compiled Gaussian smoother +sobel operator derivation
- What if the laptop can't search the wireless network signal
- Regular expressions in MySQL
- Faster-ILOD、maskrcnn_benchmark训练coco数据集及问题汇总
- EKLAVYA -- 利用神经网络推断二进制文件中函数的参数
- 浅谈深度学习中的对抗样本及其生成方法
- Yolov3 trains its own data set (mmdetection)
- Label propagation
- Common CNN network innovations
- PPT的技巧
猜你喜欢
【MnasNet】《MnasNet:Platform-Aware Neural Architecture Search for Mobile》
【MagNet】《Progressive Semantic Segmentation》
基于onnxruntime的YOLOv5单张图片检测实现
图像增强的几个方法以及Matlab代码
What if the laptop can't search the wireless network signal
MoCO ——Momentum Contrast for Unsupervised Visual Representation Learning
程序的内存模型
Replace self attention with MLP
How do vision transformer work?【论文解读】
【Sparse-to-Dense】《Sparse-to-Dense:Depth Prediction from Sparse Depth Samples and a Single Image》
随机推荐
Solve the problem of latex picture floating
用全连接层替代掉卷积 -- RepMLP
Replace self attention with MLP
open3d环境错误汇总
【FastDepth】《FastDepth:Fast Monocular Depth Estimation on Embedded Systems》
How do vision transformer work?【论文解读】
Deep learning classification Optimization Practice
PHP returns the corresponding key value according to the value in the two-dimensional array
win10解决IE浏览器安装不上的问题
Win10 solves the problem that Internet Explorer cannot be installed
图片数据爬取工具Image-Downloader的安装和使用
[CVPR‘22 Oral2] TAN: Temporal Alignment Networks for Long-term Video
Faster-ILOD、maskrcnn_benchmark安装过程及遇到问题
iOD及Detectron2搭建过程问题记录
机器学习理论学习:感知机
Pointnet understanding (step 4 of pointnet Implementation)
Yolov3 trains its own data set (mmdetection)
【MagNet】《Progressive Semantic Segmentation》
【MobileNet V3】《Searching for MobileNetV3》
Eklavya -- infer the parameters of functions in binary files using neural network