Meta-Learning

Оновлено: 31.07.2023

Що таке мета-навчання?

У контексті машинного навчання метанавчання стосується застосування алгоритмів ML для оптимізації та навчання ML-моделей. Оскільки метанавчання стає все більш популярним і з'являються нові підходи до метанавчання, життєво важливо мати базове розуміння того, що це таке і як його можна використовувати.

  • Мета-навчання в системі штучного інтелекту - це можливість навчитися виконувати різноманітні складні завдання, застосовуючи концепції, які вона вивчила для одного завдання, до інших видів діяльності.
.

У більшості випадків системи штучного інтелекту потрібно навчити виконувати завдання, вивчивши серію дрібних завдань. Агентам штучного інтелекту важко передавати свій досвід, оскільки навчання зазвичай займає тривалий період часу. Розробка цих моделей і методологій може допомогти ШІ в узагальненні процесів навчання та швидшому набутті нових навичок. Існує багато дрібних підзадач.

  • Іншими словами, алгоритми машинного навчання, які навчаються на основі метаданих і результатів машинного навчання, називаються метанавчанням у навчанні з підкріпленням та інших моделях машинного навчання.
.

Як саме працює мета-навчання?

Мета-навчання здійснюється різними способами, залежно від типу і характеру робочого завдання. Завдання метанавчання, з іншого боку, зазвичай передбачає перенесення параметрів першої мережі в параметри другої мережі/оптимізатора.

У метанавчанні є два процеси навчання. Після завершення декількох етапів навчання на базовій моделі зазвичай навчається модель метанавчання. Прямий прохід навчання для оптимізаційної моделі виконується після фаз прямого, зворотного та оптимізаційного навчання, які тренують базову модель.

Градієнти для кожного мета-параметра обчислюються після обчислення мета-втрат. В результаті цього змінюються метапараметри оптимізатора в машинному навчанні.

  • Один з методів визначення мета-втрат полягає в тому, щоб завершити проходження вихідної моделі прямого навчання, а потім об'єднати втрати, які були розраховані раніше

У багатьох моделях глибокого навчання можна знайти сотні тисяч, якщо не мільйони, параметрів. Створення метанавчального агента з абсолютно новим набором параметрів було б дуже дорогим з точки зору обчислень, тому часто використовується метод, відомий як спільне використання координат (coordinate-sharing). Проектування метанавчальника/оптимізатора таким чином, щоб він вивчав лише один параметр з базової моделі, а потім клонував цей параметр замість усіх інших, називається "спільне використання координат" (coordinate-sharing). Результатом є те, що параметри оптимізатора не залежать від параметрів моделі.

Чому це важливо?

Для вдосконалення рішень машинного навчання використовуються методи метанавчання. Переваги метанавчання численні.

Підвищена чіткість прогнозування моделі:

  1. Оптимізація алгоритму навчання: Наприклад, пошук найкращих результатів шляхом налаштування гіперпараметрів. В результаті мета-алгоритм навчання виконує цю оптимізаційну діяльність, яку зазвичай виконує людина.
  2. Допомога алгоритмам навчання адаптуватися до мінливих умов;
  3. Виявлення підказок для покращення алгоритмів навчання
.

Здешевлення та прискорення процесу навчання:

  1. Зменшити кількість необхідних експериментів для прискорення процесів навчання

Підвищення узагальнюваності моделей:

  1. Навчання розв'язувати різноманітні проблеми - це не єдине завдання: Метанавчання не пов'язане з навчанням однієї моделі на одному наборі даних.
.

Різні типи мета-навчання

Метанавчання часто використовується для покращення продуктивності нейронної мережі, яка вже існує. Підходи метанавчання оптимізаторів працюють шляхом зміни гіперпараметрів іншої нейронної мережі для покращення продуктивності базової нейронної мережі. В результаті цільова мережа повинна покращити виконання завдання, на якому вона навчається. Використання мережі для покращення результатів градієнтного спуску є прикладом оптимізатора метанавчання.

Метанавчання на основі метрики - це використання нейронних мереж для визначення того, чи успішно використовується метрика і чи досягає мережа або мережі бажаної метрики. Мета-навчання на основі метрики схоже на навчання з кількома пострілами, оскільки мережа тренується і навчається метричному простору, використовуючи лише кілька зразків. Крім того, воно застосовується в усіх доменах, і мережі, які відхиляються від нього, вважаються невдалими.

Модель, яка повторюється. Техніка метанавчання, яка застосовується до мереж довготривалої короткочасної пам'яті та рекурентних нейронних мереж, відома як метанавчання. Цей метод працює, спочатку навчаючи модель LSTM для вивчення певного набору даних, а потім використовуючи цю модель як основу для іншої моделі, що навчається. При цьому враховується стратегія оптимізації, яка використовувалася для навчання основної моделі. Мета-успадкована параметризація навчання дозволяє йому швидко ініціалізуватися і збігатися, але при цьому мати можливість оновлюватися відповідно до нових обставин.