Model Registry

Оновлено: 31.07.2023

Основна мета реєстру моделей - мати центральне місце для зберігання моделей, готових до виробництва. Розробники можуть об'єднувати свої ресурси з ресурсами інших груп та зацікавлених сторін у реєстрі, щоб спільно контролювати життєвий цикл моделей в організації. Фахівець з даних може подавати підготовлені моделі до реєстру моделей. Після цього моделі можуть бути протестовані, перевірені та розгорнуті для роботи.

Модельний реєстр складається з:

  • Централізоване сховище для всіх видів моделей, де вони зберігаються для швидкого пошуку додатками (або сервісами). За відсутності центрального сховища для артефактів моделей, розробники були б змушені зберігати свої напрацювання у неорганізованих файлах у центральному сховищі вихідного коду. Реєстр моделей з відкритим кодом спрощує цей процес, надаючи центральне сховище моделей ML для цих моделей.
.

Консолідоване сховище дозволяє командам, що працюють з даними, бачити поточний стан усіх моделей одночасно.

  • Співпраця для управління життєвим циклом активів. Реєстр моделей пропонує командам з протидії відмиванню грошей спільний модуль для роботи з моделями та обміну ними. Він полегшує співпрацю в таких сферах:

  1. Усунення розриву між експериментами та виробництвом.
  2. Надання командам централізованого інтерфейсу для спільної роботи з моделями.
  3. Надання інтерфейсу споживання моделей для наступних систем.

Важливість реєстрації моделі

Без реєстру моделей інженери машинного навчання більш схильні обирати короткі шляхи або робити дорогі помилки.

Ось що може статися, якщо нехтувати реєстрацією моделі:

  • Неправильно позначені артефакти моделі. Може бути важко визначити, які артефакти (файли) походять з якого навчального завдання. Якщо ці дані передаються електронною поштою або в миттєвому чаті, їх легко переплутати.
  • Втрата або видалення даних трапляється, коли команди не зберігають історію того, як і коли вони використовували певні набори даних.
  • Відсутні або невідомі версії вихідного коду. Навіть найкращі моделі можуть давати неочікувані або неправильні результати. Втрата оригінального коду або забуття того, яка версія була використана для навчання моделі, є поширеною пасткою, якщо не було вжито жодних запобіжних заходів. Анулювання існуючої моделі, а потім навчання нової для кращого розуміння проблеми може призвести до непотрібних повторень.
  • Недокументована продуктивність моделі. Під час ітерацій команди швидко накопичують кілька версій моделі для певної роботи. Якщо дані про продуктивність моделі розподілені між кількома блокнотами або файлами, може бути складно зробити змістовне порівняння між ітераціями моделі.
.

Як працює реєстр моделей ML

Кожній моделі в реєстрі моделей надається унікальний ідентифікатор, часто відомий як ідентифікатор моделі або UUID. Багато комерційних програм для ведення реєстрів також надають можливість відстежувати численні версії однієї і тієї ж моделі. Команди з науки про дані та машинного навчання можуть використовувати ідентифікатор моделі та її версію, щоб впевнено порівнювати та розгортати моделі.

Крім того, інструменти реєстру забезпечують зберігання параметрів або вимірювань. Під час реєстрації моделі для ілюстрації, навчання та оцінювання завдання можуть записувати налаштування гіперпараметрів та показники ефективності (наприклад, точність). Зберігання цих значень полегшує порівняння моделей. Ця інформація допомагає командам визначити, чи є оновлена версія моделі кращою за попередні версії, коли вони будують нові моделі. Численні програми для ведення реєстру мають графічний інтерфейс користувача для відображення цих параметрів і показників.

Загалом, типові реєстри складаються з цих компонентів:

  • Об'єктне сховище для зберігання артефактів моделі та великих бінарних файлів.
  • Напівструктурована або організована база даних для зберігання метаданих моделі.
  • Графічний інтерфейс користувача для вивчення та порівняння вивчених моделей.
  • Програмний API для отримання артефактів моделі та інформації за ідентифікатором моделі.
.

Використання інструментів реєстру моделей має важливе значення для побудови життєздатної архітектури MLOps. Реєстри моделей полегшують дослідження та розробку даних і прискорюють розгортання моделей. Вони роблять складні аудити та управління практично життєздатними.