초록

Model-agnostic meta-learning (MAML)은 퓨샷 분류와 같은 다양한 컴퓨터 비전 분야들에 대해 잘 동작하는 최적화 기반 메타 학습 알고리즘이다. MAML의 목적은 모델이 적은 수의 적응 단계만으로도 새로운 태스크에 잘 조정될 수 있게끔 하는 파라미터의 초기값 (initialization)을 학습하는 것이다. 그러나 분류기의 그래디언트 노름이 백본의 그래디언트 노름보다 훨씬 크기 때문에 모델은 유사한 특징 표현 (feature representation)을 바탕으로 분류기의 결정 경계를 학습하는 데에 집중한다. 이뿐만 아니라 높은 레벨 레이어의 그래디언트 노름은 낮은 레벨, 혹은 중간 레벨의 레이어들의 그래디언트 노름보다 작다. 이로 인해 MAML의 백본은 주어진 태스크의 일반적인 특징들을 학습하게 되고 그 결과 내부 루프에서 효율적이지 못한 적응 과정을 수행하게 된다.

이러한 문제를 해결하기 위해 본 논문은 메타 학습을 위한 문맥적 그래디언트 조정 기법을 제안한다. 제안 기법은 백본의 그래디언트 노름을 조정함으로써 백본이 내부 루프에서 주어진 태스크의 특징적인 정보를 학습할 수 있도록 촉진한다. 이를 위해 먼저 태스크에 의존적인 문맥 파라미터를 도입하여 태스크에 대한 정보를 학습하도록 한다. 그래디언트 노름 조정에 사용되는 조정 인자는 문맥 파라미터를 입력으로 하는 부가적인 네트워크로부터 생성된다. 그렇기 때문에 백본의 그래디언트 노름은 주어진 태스크에 적합한 형태로 조정될 수 있다. 그래디언트 노름을 조정하는 과정에는 배치 정규화의 성질을 이용한다. 배치 정규화는 웨이트가 조정됐을 때 오직 역전파 과정에서만 연산값이 변하는 성질을 가진다. 이러한 성질을 이용하면 보다 간단하게 백본의 그래디언트를 조정할 수 있다. 실험 결과, 제안 기법은 효과적으로 백본이 태스크의 특징적인 정보를 학습하도록 장려하고, 퓨샷 분류에 사용되는 다양한 데이터셋에서 MAML 대비 정량적, 정성적으로 상당히 향상된 분류 결과를 보여준다.