nxj 【TPAMI-2019】Meta-Transfer Learning through Hard Tasks

关键词：元学习；迁移学习

贡献

提出了元迁移学习（MTL, Meta-Transfer Learning），该方法学习如何将深度神经网络的权值转移到小样本学习中任务
Meta：指训练多个任务；Transfer：学习每个任务的DNN权重的缩放和偏置（SS, Scale and Shift）来实现迁移
其次，提出了Hard Tasks（HT）进一步提高MTL的学习效率
在有监督和半监督的环境下，我们在minimagenet、tieredImageNet和Fewshot-CIFAR100（FC100）这三个具有挑战性的基准上对五类小样本分类任务进行了实验，验证了本文提出的HT模式训练的MTL方法具有很好的性能。消融研究表明，SS和HT两个组件有助于快速收敛和高精度。
另外，在每个任务上加入元梯度正则化，利用当前任务和前一任务的元梯度加权和对每个任务进行优化。其目的是迫使元学习器在以后的学习中不要忘记旧知识。

IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI) 2019,
（由CVPR 2019《Meta-transfer learning for few-shot learning》扩充）

作者：Qianru Sun, Yaoyao Liu, Zhaozheng Chen, Tat-Seng Chua, and Bernt Schiele, Fellow, IEEE

机构：新加坡管理大学、马克斯·普朗克信息研究所、新加坡国立大学

样本过少的情况下→数据增强 / 元学习→现阶段MAML仍有缺点

元学习被应用于小样本学习：关键的想法是利用大量相似的小样本任务来学习如何使基础学习器适应一个新的任务
元学习是一种基于任务级优化的方法。其目的是从相似的小样本学习任务中转移经验，相关方法遵循一个包含两个循环的统一训练过程。内循环学习一个基础学习器(base learner)完成一个单独的任务，外循环使用学习基础学习器的验证性能来优化元学习器。
一种先进的代表性方法称为模型不可知元学习（MAML），它学习寻找最佳的初始化状态，使基础学习器可以快速适应新的任务
- i）这些方法通常需要大量类似的元训练任务，成本高昂；
- ii）每个任务通常由一个低复杂度的基础学习器建模，如浅层神经网络（SNN），避免模型过拟合到实拍训练数据，从而无法部署更深入、更强大的体系结构
传统的meta-batch包含许多随机任务，没有考虑不同任务的困难程度。
最近的一些工作尝试使用在大规模数据集上预先训练的DNN，但大多是以直接的方式，例如：①将其权重作为元训练的热启动；②冻结其卷积层作为基础学习器的特征提取器。