当前位置:网站首页>Meta Learning 简述
Meta Learning 简述
2022-07-02 06:26:00 【MezereonXP】
Meta Learning 简述
先来回顾一下,传统的机器学习或者说深度学习的流程:
- 确定训练和测试数据集
- 确定模型结构
- 初始化模型参数(通常是一些惯用的随机分布)
- 初始化优化器类型和参数
- 进行训练,直到收敛
Meta Learning的目的是去学习一些在步骤2,3,4的参数,我们称之为元知识(meta- knowledge)
不妨对其进行形式化
假设数据集为 D = { ( x 1 , y 1 ) , . . . , ( x N , y N ) } D = \{(x_1,y_1),...,(x_N,y_N)\} D={ (x1,y1),...,(xN,yN)} 其中 x i x_i xi 是输入, y i y_i yi 是输出标签
我们的目的是得到一个预测模型 y ^ = f ( x ; θ ) \hat{y} = f(x;\theta) y^=f(x;θ) , 其中 θ \theta θ 表示模型的参数, x x x 为输入同时 y ^ \hat{y} y^ 是预测的输出
优化的形式为:
θ ∗ = arg min θ L ( D ; θ , ω ) \theta^*=\arg \min_{\theta} \mathcal{L}(D;\theta,\omega) θ∗=argθminL(D;θ,ω)
其中的 ω \omega ω 就是元知识,包括:
- 优化器类型
- 模型结构
- 模型参数的初始分布
- …
我们会对已有的数据集 D D D 进行任务划分,切分成多个任务集合,每一个任务集合包括一个训练集合以及一个测试集合,其形式为:
D s o u r c e = { ( D s o u r c e t r a i n , D s o u r c e v a l ) ( i ) } i = 1 M D_{source} = \{(D^{train}_{source},D^{val}_{source})^{(i)}\}_{i=1}^{M} Dsource={ (Dsourcetrain,Dsourceval)(i)}i=1M
优化目标为:
ω ∗ = arg max ω log p ( ω ∣ D s o u r c e ) \omega^* = \arg \max_{\omega} \log p(\omega|D_{source}) ω∗=argωmaxlogp(ω∣Dsource)
也就是在我们切分的多个任务集合中,找到一组配置(也就是元知识),使其对于这些任务来说最优。
一般称这个步骤为元训练(meta-training)
找到 ω ∗ \omega^* ω∗ 之后,便可以应用到一个目标任务数据集 D t a r g e t = { ( D t a r g e t t r a i n , D t a r g e t v a l ) } D_{target} = \{(D_{target}^{train}, D_{target}^{val})\} Dtarget={ (Dtargettrain,Dtargetval)}
在这上面进行传统的训练,也就是找到一个最优的模型参数 θ ∗ \theta^* θ∗
θ ∗ = arg max θ log p ( θ ∣ ω ∗ , D t a r g e t t r a i n ) \theta^* = \arg\max_{\theta}\log p(\theta|\omega^*, D_{target}^{train}) θ∗=argθmaxlogp(θ∣ω∗,Dtargettrain)
这个步骤称之为元测试(meta-testing)
边栏推荐
- The difference and understanding between generative model and discriminant model
- 解决latex图片浮动的问题
- 使用百度网盘上传数据到服务器上
- open3d学习笔记二【文件读写】
- Faster-ILOD、maskrcnn_benchmark安装过程及遇到问题
- PHP returns the abbreviation of the month according to the numerical month
- 【MobileNet V3】《Searching for MobileNetV3》
- Timeout docking video generation
- 【BiSeNet】《BiSeNet:Bilateral Segmentation Network for Real-time Semantic Segmentation》
- Network metering - transport layer
猜你喜欢

【深度学习系列(八)】:Transoform原理及实战之原理篇

【Random Erasing】《Random Erasing Data Augmentation》

Semi supervised mixpatch

Traditional target detection notes 1__ Viola Jones

Installation and use of image data crawling tool Image Downloader

【MagNet】《Progressive Semantic Segmentation》

【AutoAugment】《AutoAugment:Learning Augmentation Policies from Data》

【双目视觉】双目立体匹配

【Mixed Pooling】《Mixed Pooling for Convolutional Neural Networks》

Translation of the paper "written mathematical expression recognition with bidirectionally trained transformer"
随机推荐
【Programming】
PHP returns the corresponding key value according to the value in the two-dimensional array
【双目视觉】双目矫正
ABM论文翻译
【Hide-and-Seek】《Hide-and-Seek: A Data Augmentation Technique for Weakly-Supervised Localization xxx》
【Wing Loss】《Wing Loss for Robust Facial Landmark Localisation with Convolutional Neural Networks》
程序的执行
【学习笔记】Matlab自编高斯平滑器+Sobel算子求导
Translation of the paper "written mathematical expression recognition with bidirectionally trained transformer"
iOD及Detectron2搭建过程问题记录
用全连接层替代掉卷积 -- RepMLP
[learning notes] numerical differentiation of back error propagation
Conversion of numerical amount into capital figures in PHP
Regular expressions in MySQL
Network metering - transport layer
【DIoU】《Distance-IoU Loss:Faster and Better Learning for Bounding Box Regression》
How to turn on night mode on laptop
【FastDepth】《FastDepth:Fast Monocular Depth Estimation on Embedded Systems》
win10解决IE浏览器安装不上的问题
Handwritten call, apply, bind