Active Learning in Machine Learning

Оновлено: 31.07.2023

Що таке активне навчання?

Активне навчання - це підвид ML, в якому система навчання може взаємодіяти з людиною, щоб класифікувати дані з бажаним результатом. Алгоритм ML проактивно вибирає підмножину примірників для наступної класифікації з пулу немаркованих даних. Ключова передумова, що лежить в основі концепції алгоритму активного навчання, полягає в тому, що надання алгоритму ML можливості вибирати дані, на яких він бажає навчатися, дозволяє йому, можливо, досягти більшого ступеня точності, вимагаючи при цьому меншої кількості навчальних міток.

Як результат, активні учні можуть ставити запитання в інтерактивному режимі протягом усього етапу навчання. Ці запити, як правило, надходять у вигляді екземплярів даних, які не позначені тегами, і людині-коментатору пропонується зробити це.

Застосування активного навчання

Оскільки створення моделей NLP передбачає навчання на даних, які були позначені тегами для позначення частин мови, іменованих сутностей тощо, машинне активне навчання виявилося надзвичайно корисним. Отримати набори даних, які мають таке маркування, а також достатню кількість унікальних точок даних може бути складно.

Він також використовується в медичній візуалізації та інших ситуаціях, коли є обмежена кількість даних, які людина-анотатор може класифікувати як необхідні для допомоги алгоритму. Хоча іноді це може бути трудомістким процесом, оскільки модель повинна постійно модифікуватися і навчатися залежно від періодичних оновлень маркувань, вона, тим не менш, може заощадити час порівняно з традиційними підходами до збору даних.

Як використовувати активне навчання?

Активне машинне навчання може застосовуватися трьома способами:

  • Стратегія вибірки на основі потоку, в якій точки даних, що залишилися, оцінюються одна за одною, і алгоритм вимагає позначення для кожної точки даних, яка виявилася достатньо корисною. Ця процедура може потребувати значних людських зусиль.
  • Стратегія вибірки на основі пулу, в якій спочатку переглядається весь набір даних, щоб алгоритм міг вибрати, які змінні будуть найбільш корисними для побудови моделі. Цей метод має вищу ефективність, ніж вибіркова вибірка на основі потоку, але він вимагає значної кількості комп'ютерної потужності та пам'яті.
  • Метод синтезу запиту на приналежність, в якому алгоритм створює власні фіктивні точки даних. Цей метод застосовується лише в окремих випадках, коли генерування надійних точок даних є можливим.
.

Підкріплення та активне навчання

Навчання з підкріпленням - це заснований на поведінковій психології цілеспрямований метод, який дозволяє отримувати інформацію з навколишнього середовища. Це означає, що агент буде вдосконалюватися і вчитися в міру його використання. Це схоже на те, як люди вчаться на наших невдачах. По суті, ми використовуємо стратегію навчання з підкріпленням. Початкове навчання відсутнє, оскільки агент вчиться методом проб і помилок, із заздалегідь визначеною системою винагороди, яка надає зворотний зв'язок про те, наскільки оптимальною була та чи інша дія. Таке навчання не потребує даних, оскільки створює їх у процесі роботи.

Активне глибоке навчання більше схоже на контрольоване навчання. Це напівкерований метод навчання, в якому моделі навчаються на немаркованих і маркованих даних. Напівкероване навчання базується на гіпотезі, що маркування невеликої вибірки даних може дати результати, які є настільки ж точними, а можливо, і більш точними, ніж повністю марковані навчальні дані. Єдина проблема полягає в тому, щоб з'ясувати, який цей відсоток. Активне машинне навчання передбачає динамічне і поступове маркування даних протягом усього етапу навчання, щоб алгоритм міг вибрати, на якій мітці йому найкраще вчитися.

Активне чи пасивне машинне навчання

Більшість адаптивних систем зараз базуються на методологіях активного або пасивного навчання. В активній стратегії навчання використовується тест на виявлення зсуву для оновлення навчальної моделі залежно від зсуву, який спостерігається в потоці даних. Система навчання при пасивному навчанні постійно оновлюється, припускаючи, що навколишнє середовище постійно змінюється. Немає необхідності в тесті на виявлення зсуву.