Model Retraining

Оновлено: 31.07.2023

Що таке перепідготовка моделей?

Перенавчання ML-моделі - це адаптація раніше навченої моделі до нової задачі або покращення її продуктивності на існуючій задачі за рахунок використання іншого набору даних.

Щоб перенавчити модель, візьміть вже навчену модель і змініть її параметри, навчивши її на новому наборі даних. Це досягається за допомогою "навчання з кількох пострілів", коли модель навчається на обмеженій кількості мічених даних. Після перенавчання модель може бути використана або для виконання нових завдань, або для покращення її продуктивності на вихідних даних.

  • Перенавчання моделей може бути корисною практикою, оскільки це може заощадити час і обчислювальні ресурси порівняно з навчанням моделі з нуля. ІТ також може покращити продуктивність.
.

Чому і коли варто перенавчати свою модель?

Перш ніж перенавчати модель машинного навчання, ви повинні добре розуміти сценарії використання вашої компанії. Коли і як часто вам потрібно оновлювати модель, має вирішальне значення в певних сценаріях. Алгоритми, що використовуються в комерційних додатках, потребують постійного перенавчання. Так само, як моделі ML, навчені на поведінкових даних, потребують частішого перенавчання, ніж моделі, навчені на виробничих даних, через динамічну природу перших, другі потребують рідшого перенавчання.

Вам потрібно з'ясувати, з чого ви почали з вашими метриками після запуску моделі у виробництво. Цей метод ґрунтується на тому, що погіршення продуктивності моделі під час виробництва слугує сигналом для перенавчання. Якщо точність вашої моделі опускається нижче порогового значення, яке ви встановили за допомогою істини, процес перенавчання розпочнеться негайно. Цей метод передбачає наявність передової системи моніторингу на виробництві.

Затримка в отриманні первинної інформації є недоліком, який залежить від продуктивності моделі у виробництві. Для отримання повної історії про позику або кредитну модель може знадобитися від 30 до 90 днів. Вам доведеться почекати, щоб почати автоматизоване перенавчання моделі, поки ви не отримаєте результати, які, можливо, вже вплинули на компанію.

Цей метод найкраще підходить для ситуацій, коли голі факти можуть бути встановлені за короткий проміжок часу. Прогнози, зроблені моделями, можна відстежувати в режимі реального часу.

Можна відстежувати попередні дані у виробництві, щоб виявити зміни в розподілі. Звідси ви можете зробити висновок, що ваша модель потребує оновлення або що ви перебуваєте в дуже динамічному середовищі. Якщо ваша модель у процесі виробництва не надає вам негайного зворотного зв'язку або істинних даних, ця стратегія є надійним варіантом для вивчення.

Тригер на основі продуктивності можна використовувати разом з цим методом. Коли ваша модель буде запущена у виробництво, її продуктивність може знизитися через дрейф даних, що може призвести до того, що вона не зможе досягти мінімально допустимого рівня продуктивності. Для машинного навчання, що перенавчає модель, це негайно ініціює збірку.

Цей евристичний метод перенавчання моделей виконується вручну і часто використовує традиційні методи. Цей метод використовується переважною більшістю стартапів, і він має потенціал для підвищення продуктивності моделей, але в кінцевому підсумку не є найкращим варіантом. Важливо автоматизувати процеси машинного навчання в комерційних умовах.

Вам потрібно знати, як часто слід перенавчати модель? Регулярне і безперервне навчання машинного навчання - найпростіший і найприродніший метод. Ви можете передбачити, коли конвеєр перенавчання вашої моделі буде активовано, вибравши інтервал перенавчання. Від того, як часто оновлюватимуться навчальні дані, залежатиме, наскільки точними будуть ваші прогнози. Тільки якщо це має сенс для вашого бізнес-кейсу, ви повинні перенавчати модель на основі інтервалу. В іншому випадку, випадковий вибір часового вікна може додати непотрібних ускладнень і навіть призвести до менш точного прогнозу, ніж раніше.

Значення перепідготовки моделей

Безперервне навчання моделі машинного навчання - це ключ до оптимальної продуктивності.

  • Покращуйте продуктивність моделі. Оновлюйте навчальні дані та регулярно перенавчайте модель, щоб підвищити її точність та ефективність. Покращення результатів F1, точності, пригадування та акуратності - ось можливі результати.
  • Зменшення зсуву моделі. Додавання нових даних, які точніше відображають різноманітність реального світу, та відстеження ефективності моделі на різних групах протягом безперервного навчання може зменшити упередженість моделі.
  • Економічна ефективність. Безперервне навчання може заощадити час і гроші порівняно з початком роботи зі щойно перенавченою моделлю. Ви можете заощадити час і обчислювальні потужності, почавши з попередньо навченої моделі.
  • Адаптивність. Продуктивність моделі може знижуватися з часом, якщо її не оновлювати, щоб врахувати мінливий характер даних і світ за межами лабораторії. Модель можна безперервно навчати, щоб врахувати ці зміни і зберегти її продуктивність.
.

Насамкінець, постійне навчання моделей допомагає підтримувати їх в актуальному стані, покращує продуктивність, зменшує упередженість, підвищує стійкість і заощаджує витрати.