Logistic Regression
Оновлено: 31.07.2023
Цей вид аналізу даних зазвичай використовується для прогнозного моделювання, а також у додатках ML. Залежна змінна в цьому методі аналізу є або кінцевою, або категоричною: або A, або B (бінарна регресія), або діапазон кінцевих можливостей A, B, C або D (множинна регресія). Оцінюючи ймовірності за допомогою рівняння логістичної регресії, вона використовується в статистичному програмному забезпеченні для розуміння зв'язку між залежною змінною та однією або кількома незалежними змінними.
Ця форма аналізу може допомогти вам спрогнозувати шанси настання певної події або прийняття певного рішення. Наприклад, ви можете визначити, наскільки ймовірно, що відвідувач вибере пропозицію на вашому сайті.
Відомі характеристики відвідувачів, такі як сайти, з яких вони прийшли, частота відвідування вашого сайту та активність на ньому, можуть бути розглянуті у вашому дослідженні. Моделі логістичної регресії допоможуть вам з'ясувати, які відвідувачі з найбільшою ймовірністю приймуть - або відхилять - вашу пропозицію. Як наслідок, ви зможете приймати більш обґрунтовані рішення щодо того, як просувати вашу пропозицію або саму пропозицію.
Логістична регресія та машинне навчання
Машинне навчання дає можливість машинам (комп'ютерам) "вчитися" без необхідності чіткого програмування. Коли завдання, яке вивчає машина, базується на двох значеннях або бінарній класифікації, логістичний метод працює добре. У випадку з наведеним вище прикладом, ваш комп'ютер може використовувати такий аналіз для прийняття рішень про те, як просувати вашу пропозицію, і діяти самостійно. А за наявності додаткових даних він може з часом покращити свою роботу.
Нижче наведено кілька прикладів моделей прогнозування на основі логістичного аналізу:
- Змішаний, багатозначний та впорядкований логіт, дискретний вибір та узагальнена лінійна модель
Застосування
Коли ви розглядаєте різноманітні категоріальні результати, такі як A, B або C, багаточленний аналіз, безумовно, може допомогти. Однак бінарний аналіз (так чи ні, присутній чи відсутній) є більш поширеним. Варіанти не обмежені, навіть якщо наслідки обмежені. За допомогою бінарної логістичної регресії можна вивчати все - від бейсбольної статистики до схильності до зсувів і аналізу почерку.
Цей вид аналітики також можна застосувати до різноманітних статистичних ідей та застосувань:
- Аналітичний текст
- Спільне дослідження
- Початок з нуля з використанням статистики
- Регресія, яка не є лінійною
- Програмне забезпечення для кластерного аналізу та кластерна статистика
Логістичний регресійний аналіз, багатовимірний аналіз, нейронні мережі, дерева рішень і лінійна регресія - всі вони виграють від використання інструментів статистичного аналізу. Однак, якщо вам потрібно розмістити масивні набори даних локально, в хмарі або в гібридній хмарі, вам також потрібно розглянути варіанти апаратних і хмарних обчислень.
Недоліки
Також корисно знати, коли ця форма аналізу не спрацьовує. Ось деякі небезпеки, про які слід знати:
- Вимагається валідність незалежних змінних. Прогностична цінність моделі буде знижена, якщо змінні є неправильними або неповними.
- Слід уникати суперечливих результатів. Температура, час та інші змінні з відкритим кодом зроблять модель менш точною.
- Не об'єднуйте дані з різних джерел. Модель буде схильна переоцінювати релевантність деяких даних, якщо вони пов'язані між собою.
- Слід уникати надмірної підгонки та завищення результатів. Ці моделі статистичного аналізу є точними, але вони не є безпомилковими або безпомилковими.
Підсумок
Прогностичні моделі, створені за допомогою цього методу, можуть мати сприятливий вплив на вашу компанію чи організацію. Ви можете покращити процес прийняття рішень, використовуючи ці моделі для аналізу зв'язків і прогнозування наслідків. Наприклад, команда аналітиків виробника може використовувати логістичний регресійний аналіз, який є частиною пакету статистичного програмного забезпечення, щоб знайти кореляцію між відмовами деталей машин і тривалістю зберігання цих деталей на складі. На основі знань, отриманих в результаті цього дослідження, команда може змінити графіки поставок або терміни монтажу, щоб уникнути повторних відмов.
Спостерігаючи за поведінкою клієнтів, бізнес може виявити тенденції, які сприятимуть утриманню персоналу або виробництву більш прибуткових товарів.