Model Parameters

Оновлено: 31.07.2023

Що таке параметри в машинному навчанні?

Ефективність моделі визначається різними параметрами. Модель вважається хорошою, якщо вона досягає високої точності у виробничих або тестових даних і може ефективно узагальнювати невідомі дані. Якщо її легко впровадити у виробництво та масштабувати.

  • Параметри моделі машинного навчання визначають, як вхідні дані перетворюються на бажаний результат, тоді як гіперпараметри керують формою моделі. Майже всі стандартні методи навчання містять атрибути гіперпараметрів, які необхідно ініціалізувати перед початком навчання моделі.
.

Хороші та правильні моделі

Хороші моделі визначаються як такі, що не є ні надмірно пристосованими, ні недостатньо пристосованими. Правильно підігнані моделі - це моделі з найменшими мінімальними похибками зсуву та дисперсії.

Ви можете оцінити точність навчання та тестування одночасно. Ви не можете покладатися на один тест для визначення продуктивності моделі. Оскільки тестових наборів недостатньо, для їх моделювання використовується K-кратна перехресна перевірка та вибірка з бутстрапінгом.

Що ж таке помилки в моделюванні? Помилки моделювання визначаються як помилки, що погіршують прогностичну здатність моделі. Нижче наведено три найпоширеніші типи помилок моделювання:

  • Дисперсійна похибка визначається як дисперсія, помічена в поведінці моделі. Параметри моделі в машинному навчанні будуть працювати по-різному на різних вибірках. Через ступінь свободи для точок даних, якщо функції або атрибути в моделі збільшуються, дисперсія також збільшується.
.

  • Помилка зміщення: Це тип помилки, яка може трапитися в будь-який момент під час процесу моделювання, починаючи з етапу збору даних. Це може статися під час аналізу даних, які визначають ознаки. Також під час поділу даних на три категорії: навчальні, валідаційні та тестові. Через зсув розміру класу на алгоритми впливає клас, який має більшу кількість членів, ніж інші класи.
  • Випадкові помилки: Це помилки, які виникають в результаті невідомих причин.
.

Випробування моделі

Валідація - це процес визначення того, наскільки добре працює модель. Не факт, що якщо ваша модель добре працює на етапі навчання, вона буде добре працювати і на виробництві. Якщо вам потрібно перевірити вашу модель, ви завжди повинні розділити дані на два сегменти: один для навчальних даних, а інший для тестових.

У багатьох випадках виявляється, що для поділу на навчальну та тестову групи недостатньо даних. Як наслідок, перевірка помилки моделі на тестових даних може бути не найкращим способом передбачити помилку на виробничих даних. В умовах, коли немає великої кількості великих даних, існує безліч стратегій, які можна використовувати для оцінки помилки моделі на виробництві. "Перехресна перевірка" - одна з таких стратегій.

  • Перехресна перевірка - це метод оцінки продуктивності моделі на раніше не бачених даних. Модель будується і тестується кілька разів.
.

Користувач визначає, скільки разів буде виконано обстеження. Користувач повинен вибрати значення, відоме як "k", яке є цілим числом. Кроки в послідовності повторюються стільки разів, скільки встановлено значення "k". Щоб виконати перехресну перевірку, ви повинні спочатку розділити вихідні дані на різні складові за допомогою випадкових функцій.

Гіперпараметри vs параметри

Гіперпараметр - це стандартний параметр, який діє за будь-яких обставин. Їх називають важливим компонентом моделі. Ви не зобов'язані дотримуватися налаштувань за замовчуванням; якщо цього вимагає випадок, ви можете внести зміни.

Дуже важливо мати три набори даних, таких як навчальні, тестові та валідаційні, щоразу, коли ви змінюєте параметр за замовчуванням, щоб досягти необхідної точності та уникнути порушень даних.

Ваги та коефіцієнти, які алгоритм витягує з даних, називаються параметрами моделі. Параметри моделі нейронних мереж враховують, як змінна-предиктор впливає на цільову змінну. Гіперпараметри повністю залежать від поведінки алгоритмів на етапі навчання. Кожен алгоритм має свій набір гіперпараметрів, наприклад, параметр глибини для дерев рішень.

  • Матриця конфузії - таблиця, яка описує, наскільки добре класифікація працює на наборі тестових даних.
.

  • Точність - Це оцінка, яка генерується при узагальненні класу. Здатність моделі узагальнювати належним чином.
.

  • Відкликання - визначає, наскільки добре модель передбачила істинні точки даних як істинні точки даних.
.

  • Точність - Описує, скільки позитивних точок даних розпізнає модель і скільки з них є справді позитивними.
.