Meta Learning (Hongyi Li)

Meta Learning

Introduction

Meta Learning = Learn 2 Learn

Life-Long Learning & Meta Learning

Life-Long Learning: 不断用同一个模型进行学习

Meta Learning: 不同任务拥有不同的模型

ML

Meta Learning

Machine Learning & Meta Learning

Training

Loss函数,多任务loss值之和

数据集划分

ML为训练集&测试集,Meta Learning为训练任务&测试任务

Meta Learning常与few-shot learning联系,仅用少量数据集进行训练

Support & Query set

整体流程

Omniglot

Few-Shot Classification

常见方法

MAML

固定模型架构,仅针对初始化参数

MAML & Model Pre-Training



MAML训练仅update一次,测试中为取得更好效果可update多次

Example:拟合三角函数


数学推理

first-order approximation 近似简化计算


实际应用:

MAML参数进行两次update:

(1)得到训练后参数theta

(2)得到theta对loss的偏微分,用于更新初始参数

Reptile

训练

区别:Pre-train & MAML & Reptile

Gradient Descent as LSTM

V1

GD视为LSTM简化版:

input & forget gate的参数并非学习而来,而是人为设定

LSTM for GD

动态调整学习率并对先前参数进行处理

training

简化运算

实际应用

LSTM适用于所有参数的更新,仅有一个LSTM cell

training&testing 应用不同model:CNN&RNN (MAML无法做到)

v2

下层LSTM类似于倒数(加速度)

Metric-based Approach

概述

Face Verification & Face Identification

Face Identification:判断是一组人中哪一个

Face Verification:判断是否是同一个人

Face Verification训练

类似word2vec

实例

Prototypical Network

效果大于Matching

n-shots情景,对embedding取平均值:

Matching Network:

Relation Network

不同于Prototypical Network & Matching Network,Relation Network采用两个module,第一个用于提取embedding,第二个用于计算class与test set的embedding之间的相似度。

(彩色长方体为提取出的各类别embedding,黄色为输入embedding)

之前方法的相似度使用特定的计算方式(eg.余弦)

Imaginary Data

GAN网络部分与learning+prediction网络共同权重更新进行训练

Test as RNN

一般思路 general

但实验中模型无法成功训练

MANN & SNAIL

SNAIL类似wavenet网络构造,加强输入之间的联系


   Reprint policy


《Meta Learning (Hongyi Li)》 by Liangyu Cui is licensed under a Creative Commons Attribution 4.0 International License
  TOC