Autoregressive Model

Оновлено: 31.07.2023

Що таке авторегресійна модель?

Авторегресійна (AR) модель - це тип статистичної моделі, яка використовує минулі значення часового ряду для прогнозування майбутніх значень. Вона базується на припущенні, що поточне значення часового ряду залежить від його минулих значень, а зв'язок між поточними та минулими значеннями описується набором коефіцієнтів.

  • Щоб спрогнозувати результат наступного кроку, авторегресійна модель використовує результати попередніх кроків як вхідні дані для регресійної моделі.
.

Авторегресійна модель може бути записана як:

y(t) = c + w_1y(t-1) + w_2y(t-2) + ... + w_py(t-p) + e(t)

де:

  • y(t) - поточне значення часового ряду;
  • y(t-1) - значення часового ряду на попередньому часовому кроці;
  • y(t-2) - значення часового ряду два часових кроки тому і так далі;
  • Коефіцієнти w_1, w_2, ...w_p - коефіцієнти авторегресії, які визначають силу та напрямок зв'язку між поточним значенням часового ряду та його минулими значеннями; та
  • Постійна c - член зсуву, а e(t) - член випадкової помилки.

Авторегресійна модель мови

Авторегресійна мовна модель - це тип моделі машинного навчання, яка використовує методи авторегресії для передбачення наступного слова в послідовності слів на основі слів, які були до нього. Її можна використовувати для таких завдань, як обробка природної мови та машинний переклад.

У мові програмування R функція arima() може бути використана для підбору авторегресійної моделі в R до часового ряду.

VAR та CAR

Векторна авторегресійна модель (VAR) - це тип авторегресійної моделі, яка використовується для моделювання зв'язку між кількома часовими рядами.

Умовна авторегресійна модель (УАМ) - це тип авторегресійної моделі, яка використовується для моделювання просторових даних, таких як дані, зібрані з сітки локацій. Вона базується на припущенні, що значення змінної в певному місці залежить від значень змінної в сусідніх місцях.

Методи авторегресійної моделі

Щоб спрогнозувати значення наступного часового кроку, моделі авторегресії зазвичай аналізують ступінь кореляції між даними на попередніх часових кроках (лагові змінні).

При позитивній кореляції дві змінні рухаються в одному напрямку - вгору або вниз. Кажуть, що між двома змінними існує негативна кореляція, якщо значення цих змінних мають тенденцію коливатися в протилежних напрямках, наприклад, одна зростає, а інша падає. У будь-якому випадку, зв'язок між результатом і вхідними даними можна виміряти за допомогою елементарного статистичного аналізу.

Імовірність того, що минуле може передбачити майбутнє, тим вища, чим сильніший цей зв'язок, позитивний чи негативний. Або, інакше кажучи, чим більше значення має це значення в алгоритмі DL.

Термін "автокореляція" використовується для опису зв'язку між змінною та нею самою в попередні періоди часу.

Крім того, передбачуваність набору даних часового ряду зменшується, якщо всі вхідні змінні мають слабкий зв'язок або взагалі не мають зв'язку з кінцевою вихідною змінною - що може бути добре використано при навчанні глибоких нейронних мереж.