Few-shot Learning - ZJU

前言：对少样本学习的综述主要基于ECCV2020最新的一篇综述文章《Learning from Few Samples: A Survey》和之前看到的一篇《Generalizing from a few examples: A survey on few-shot learning》

Learning from Few Samples: A Survey: 对目前提出的少样本方法做了分类

Generalizing from a few examples: A survey on few-shot learning: 从问题设置、技术、应用和理论方面进行了介绍（详见组会ppt: A Survey on Few-shot Learning）

下面主要对《Learning from Few Samples: A Survey》中不同的少样本方法进行介绍

Introduction

The gap between humans and machines

从数据集角度考虑
- 深度学习算法在大型(平衡标记)数据集和强大的计算机算力的支持下，能够实现图像识别、语音识别、自然语言处理和理解、视频分析等应用，且在某些情况下由于人类。
- 人工智能的终极目标之一是能够对任何给定的任务有匹敌人类或优于人类的性能，为了实现这一目标，必须减少对对大型平衡标记数据集的依赖。然而，当标签数据稀少(仅少量样本的)时，当前基于大型数据集提出的算法模型在执行相应任务时性能显著下降。
- 数据集的分布存在长尾现象，且标记数据集需要时间、人力等资源，成本昂贵
从学习范式考虑
- 分析人类的学习方式可以发现，人类能够基于很少的数据，很快地学习到新的类别
- 人类能够实时学习新的概念或新的类，而机器必须经历一个expensive offline process (即对整个模型反复的训练和再训练，以学习新的类)
how to learn with small labeled data

ref: WSDM2020 tutorial
- Model-wise
  - transfer & reuse previous learned knowledge
    - transfer learning
    - multi-tasks learning
    - meta-learning
  - utilize the extra-knowledge (e.g. domain expert)
    - enrich representations using knowledge graph
    - domain-knowledge driven regularization
- Data-wise
  - data augmentation from labeled/unlabeled data

The potential solutions —— bridge the gap

meta learning/few-shot learning/low-shot learning/zero-shot learning等，目标是使模型更好地推广到由少量标记样本组成的新任务中
Few-shot learning and Meta-learning:
- 在few-shot learning中，其基本思想是用大量含有多个类别的数据样本集合训练模型，并在测试过程中，为该模型提供新的类别的集合
- 在meta learning中，目标是概括或学习学习的过程，在这个过程中，模型根据特定任务进行训练，并在新集合汇总使用不同类别的函数。目标是找到最佳的超参数和模型权重，使模型能够轻松适应新任务
Transfer Learning and Self-Supervised Learning:
- transfer learning的总体目标是从一组任务中学习知识或经验，并将其转移到类似领域的任务中。用于训练模型以获取知识的任务具有大量的标记样本，而目标任务具有相对较少的标记数据，不足以训练模型并将其收敛到特定任务，需要通过先对源任务中的知识进行迁移。
  - 迁移学习的性能取决于两个任务之间的相关性
  - 对于每个新的迁移任务，如何迁移需要人工确定，而元学习技术能够自动适应新的任务
- self-supervised learning技术的训练基于两个步骤：第一步，在预先定义的pretext task上训练模型，即利用大量未标记的数据样本集训练模型；第二步，学习的模型参数用于训练或微调下游任务的模型。
- meta learning 和few-shot learning的理念域自监督学习非常相似，都是使用先验知识，完成一个新的任务
- 研究表明，自监督学习可以与few-shot learning结合使用，以提高模型对新类别的性能

Taxonomy and Organization

meta learning, few-shot/low-shot/one-shot/zero-shot learning等技术的主要目的都是通过基于先验知识或经验的迭代训练，使深度学习模型从少样本中更好地推广到新的类别。先验知识是通过在一个由大量样本组成的标记数据集上训练样本得到的，然后利用这些知识来完成仅有有限样本的新任务。

Data Augmentation Based

基于数据扩充的技术在有监督学习领域非常popular。传统的增强技术(如缩放、裁剪、旋转等)常用来扩展训练数据集的大小，目标是使模型具有更好的泛化性(通用型)，避免过拟合/欠拟合。

在元学习空间，其思想是通过增加最小可用样本和生成更多不同样本来拓展先验知识以训练模型

Introduction

Taxonomy and Organization

Data Augmentation Based

LaSO: Label-Set Operations networks

Recognition by Shrinking and Hallucinating Features

Learning via Saliency-guided Hallucination

Low-Shot Learning from Imaginary Data

A Maximum-Entropy Patch Sampler

Image Deformation Meta-Networks

Embedding Based

Relation Network

Prototypical Network

Learning in localization of realistic settings

Learning for Semi-Supervised Classiﬁcation

Transferable Prototypical Networks

Matching Network

Task dependent adaptive metric learning

Representative-based metric learning

Task-Aware Feature Embedding

Optimization Based

LSTM-based Meta Learner

Memory Augmented Networks based Learning

Model Agnostic based Meta Learning

Task-Agnostic Meta-Learning

Meta-SGD

Learning to Learn in the Concept Space

∆-encoder

Semantic Based

Learning with Multiple Semantics

Learning via Aligned Variational Autoencoders (VAE)

Learning by Knowledge Transfer With Class Hierarchy

Future Direction

Reference

CATALOG

FEATURED TAGS

FRIENDS