Linear Regression

Оновлено: 31.07.2023

Найбільш фундаментальним і широко використовуваним видом прогнозного аналізу є лінійна регресія. Мета регресії полягає в тому, щоб розглянути дві речі:

  • Чи можна спрогнозувати результуючу змінну за допомогою набору предикторних змінних?
  • Які фактори, зокрема, є значущими предикторами результуючої змінної і як вони впливають на результуючу змінну?

Ці оцінки регресії використовуються для того, щоб проілюструвати, як одна залежна змінна взаємодіє з однією або кількома незалежними змінними. Y= c + b*x є найбільш спрощеною характеристикою регресійної моделі з однією залежною та однією незалежною змінною, де y - оцінка залежної змінної, c - константа, b - коефіцієнт регресії, x - оцінка незалежної змінної.

  • Лінійний регресійний аналіз - це статистичний метод для прогнозування значення однієї змінної на основі значення іншої. Залежна змінна - це змінна, яку ви хочете спрогнозувати. Незалежна змінна - це змінна, яку ви використовуєте для прогнозування значення іншої змінної.
.

Залежна змінна в регресії має кілька назв. Вона також відома як критеріальна змінна, ендогенна змінна або регресор. Екзогенні змінні, предикторні змінні та регресори - це терміни для позначення незалежних змінних.

Пошук лінійного зв'язку між метою та однією або кількома змінними здійснюється за допомогою лінійної регресії. Проста та множинна лінійна регресія - це дві форми лінійної регресії.

Проста лінійна регресія - Для виявлення зв'язку між двома неперервними змінними підходить проста лінійна регресія. Предиктором або незалежною змінною є одна змінна, а відгуком або залежною змінною - інша. Вона шукає статистичні, а не детерміновані зв'язки. Якщо одна змінна може бути точно описана іншою, зв'язок між двома змінними вважається детермінованим. Наприклад, можна точно спрогнозувати температуру за Фаренгейтом, використовуючи температуру в градусах Цельсія. При визначенні зв'язку між двома змінними статистичні залежності не є коректними.

Важливість лінійної регресії

Лінійно-регресійні моделі є простими і надають базовий математичний метод для створення прогнозів. Лінійна регресія може використовуватися в різних корпоративних та академічних середовищах.

Лінійна регресія використовується в різних галузях, включаючи біологічні, поведінкові, екологічні та соціальні науки, а також бізнес. Лінійні регресійні моделі виявилися надійним і науковим засобом прогнозування майбутнього. Оскільки лінійна регресія є добре відомим статистичним процесом, її характеристики добре вивчені, а моделі лінійної регресії можна швидко навчити.

Застосування

Існує три важливих застосування регресійного аналізу:

  • оцінка сили предикторів - регресію можна використовувати для визначення величини впливу незалежної змінної на залежну змінну.
  • прогнозування впливу - її можна використовувати для прогнозування того, як зміни вплинуть на людей. Іншими словами, регресійний аналіз дозволяє визначити, наскільки сильно змінюється залежна змінна при зміні однієї або декількох незалежних змінних.
.

  • прогнозування трендів - прогнозує тренди та майбутні значення. Точкові оцінки можна отримати за допомогою регресійного аналізу.
.

Прикінцеві нотатки

Підгонка моделі є ключовим аспектом при виборі моделі для дослідження. Коли ви додаєте незалежні змінні до моделі лінійної регресії, ви завжди збільшуєте пояснену дисперсію моделі. З іншого боку, надмірна підгонка може статися, коли в моделі занадто багато змінних, що зменшує узагальнюваність моделі. Проста модель, як правило, є кращою за складнішу. Лише випадково деякі змінні в моделі з великою кількістю змінних можуть виявитися статистично значущими.

Використовуючи методи лінійної регресії, бізнес-лідери та керівники організацій можуть приймати більш обґрунтовані рішення. Організації отримують багато даних, і лінійна регресія дозволяє їм використовувати ці дані замість того, щоб покладатися на досвід та інтуїцію, щоб краще управляти реальністю. Ви можете перетворити величезні обсяги неструктурованих даних на корисну інформацію.

Ви також можете використовувати лінійну регресію для отримання більш глибоких знань, виявляючи закономірності та зв'язки, які ваші колеги по бізнесу могли бачити, але не усвідомлювали раніше. Наприклад, аналіз даних про продажі та покупки може виявити специфічні звички покупців у певні дні або в певний час. Регресійний аналіз може дати керівникам бізнесу уявлення про те, коли продукція їхньої компанії користуватиметься найбільшим попитом.