ML Model Management

Оновлено: 31.07.2023

MLOps включає в себе управління моделями. У великих масштабах моделі, засновані на машинному навчанні, повинні бути надійними і відповідати всім потребам бізнесу. Для цього потрібна раціональна, зручна політика управління моделями. Побудова, навчання, зміна версій і розповсюдження моделей машинного навчання - все це виконується за допомогою управління моделями ML.

Працюючи над новими моделями машинного навчання або застосовуючи їх до нових областей, дослідники проводять багато тестів, використовуючи різні оптимізатори, архітектури моделей, функції втрат, змінні, параметри та вхідні дані. Ці експерименти використовуються для пошуку оптимальної конфігурації моделі.

Однак, якщо у вас немає механізму для моніторингу конфігурацій моделі та її продуктивності між випробуваннями, все може піти шкереберть, оскільки ви не зможете визначити і вибрати найкращу відповідь. Стежити за всіма випробуваннями та результатами, навіть якщо це лише один дослідник, який займається окремим дослідженням, важко.

Ось чому ви керуєте моделями. Це дозволяє вам, вашій команді та вашій компанії:

  • Вирішуйте типові проблеми компанії проактивно.
  • Відстежуйте дані, код, метрики та версії моделей, щоб забезпечити повторюваність експериментів.
  • Для полегшення повторного використання, пакуйте та надавайте моделі в повторюваних конфігураціях.
.

Частини управління моделлю ML

Архітектура моделі ML складається з наступних частин:

  • Системи управління версіями - допомагають розробникам моделей машинного навчання в управлінні змінами вихідного коду. З іншого боку, управління версіями даних - це набір інструментів і методів управління моделями, який має на меті адаптувати процес управління версіями до світу даних, щоб керувати змінами моделі у зв'язку з наборами даних і навпаки.
  • Кодова контрольна точка - тут керуються зміни у вихідному коді моделі
  • Локатор експериментів - відстежує, збирає та організовує дані про навчання/валідацію/продуктивність моделі впродовж кількох прогонів з різними конфігураціями та наборами даних.
  • Реєстр моделей - це комплексна система моніторингу моделей ML, які були навчені, запущені та розгорнуті.
  • Спостереження за моделлю - використовується для відстеження продуктивності виводу моделі та виявлення будь-яких симптомів Serving Skew, який виникає, коли зміни даних призводять до того, що продуктивність розгорнутої моделі падає нижче оцінки/точності, яку вона мала в навчальному середовищі.
.

Важливість управління моделями ВК

Керування моделями - важливий компонент будь-якого робочого процесу машинного навчання. Воно дозволяє легко контролювати управління життєвим циклом моделі ML від генерації моделі до її розгортання, включаючи конфігурацію, експерименти та відстеження різних експериментів.

Важливо зазначити, що в управлінні моделями ми працюємо з двома речами:

  • Моделі - тут ми обробляємо пакування, розгортання і тактику, моніторинг і перенавчання.
  • Експерименти - тут ми відстежуємо втрати, метрики навчання, фотографії, текст і будь-яку іншу інформацію, яку ви маєте, а також версійність конвеєра, дані і код.

Без управління моделями командам з обробки даних було б важко генерувати, відстежувати, порівнювати, розгортати та реплікувати моделі.

Спеціальні підходи є альтернативою модельному управлінню і можуть призвести до того, що дослідники створюватимуть проекти ВК, які не будуть повторюваними, стійкими, масштабованими або скоординованими.

Ось ще кілька міркувань про важливість управління моделями:

  • Забезпечує створення єдиного джерела інформації;
  • Дозволяє створювати версії моделей для забезпечення стандартів та узгодженості;
  • Проблеми (недостатня відповідність, надмірна відповідність, упередженість або продуктивність) легше вирішити, роблячи рішення більш відстежуваним та сумісним із законами.
  • Ви можете проводити дослідження і розробки швидше і ефективніше.
  • Команди стають більш продуктивними і мають сильне почуття мети.
  • ML Завдяки використанню різних передових практик і технологій, управління моделями може сприяти співпраці навколо коду, даних і документації.
.