Mean Square Error (MSE)
Оновлено: 31.07.2023
Оцінка моделі є важливою частиною розробки системної моделі. У випадках, коли метою моделі є прогнозування, середньоквадратична похибка прогнозів є гарним показником для оцінки точності моделі.
- Середньоквадратична помилка оцінює близькість лінії регресії до групи точок даних. Це функція ризику, яка відповідає прогнозованому значенню втрат від квадратичної помилки.
Середньоквадратична похибка обчислюється шляхом обчислення середнього значення, особливо середнього значення, квадратів похибок, отриманих з даних функції.
Середньоквадратична похибка (MSE) - це міра похибки алгоритмів прогнозування. Ця статистика кількісно виражає середньоквадратичну дисперсію між спостережуваними та передбачуваними значеннями. Коли в моделі немає помилок, MSE дорівнює 0. Цінність моделі зростає пропорційно до ступеня помилки, яку вона містить. Середньоквадратичну похибку часто називають MSD - середньоквадратичне відхилення.
Наприклад, середня квадратична помилка в регресії може вказувати на середній квадрат залишку.
MSE зменшується, коли точки даних більше відповідають лінії регресії, що свідчить про меншу похибку моделі. Модель з меншою кількістю помилок дає точніші прогнози.
Якщо MSE високе, точки даних досить сильно розкидані від центрального моменту, тоді як низьке значення означає протилежне. Коли точки даних щільно групуються навколо свого середнього значення, MSE буде скромним (середнім). Це показує, що значення ваших даних розподілені нормально, немає асиметрії, і, що найважливіше, менше помилок, де помилки визначаються тим, наскільки далеко ваші точки даних знаходяться від середнього значення.
- Менше MSE => Похибка менша => Оцінювач кращий
Аналіз середньоквадратичної похибки
MSE - це середня різниця між спостережуваними та очікуваними значеннями, виміряна у квадратних одиницях. Використання квадратних одиниць замість натуральних робить інтерпретацію менш очевидною.
- Задача зведення розбіжностей у квадрат є багатогранною.
Зведення різниць у квадрат усуває від'ємні різниці середніх квадратів похибок і гарантує, що середня квадратична похибка завжди буде більшою або дорівнюватиме нулю. Зазвичай це значення завжди додатне. Тільки модель без помилок матиме нульове значення MSE. У реальності цього не відбувається.
Більше того, піднесення до квадрату збільшує ефект більших неточностей. Ці обчислення карають більші помилки непропорційно більше, ніж менші. Цей атрибут необхідний, якщо ви хочете, щоб помилок у вашій моделі було менше.
Середньоквадратична похибка - це міра точності, яка використовує натуральні одиниці даних; вона обчислюється шляхом піднесення до квадрата MSE. Для подальшого пояснення, MSE можна порівняти з дисперсією, а RMSE - зі стандартним відхиленням, відповідно.
Формула середньої квадратичної похибки:
Де:
- Yi - побачене значення i.
- відповідає очікуваному значенню
- n = кількість входжень
Оцінки середньоквадратичної похибки досить близькі до обчислень дисперсії.
Калькулятор середньоквадратичної похибки обчислює спостережуване значення, віднімаючи очікуване значення, а потім підносячи його до квадрата. Повторіть для кожного спостереження. Потім розділіть загальну кількість спостережень на суму квадратів значень.
Чисельник - це сума квадратів помилок (SSE), яка мінімізується за допомогою лінійної регресії. Для того, щоб обчислити MSE, потрібно просто поділити SSE на загальну кількість спостережень у дослідженні.
Середньоквадратична похибка, часто відома як MSE, - це функція ризику, яка оцінює квадрат помилок, знайдених під час статистичного аналізу. Використовуйте MSE під час регресії, якщо ви вважаєте, що ваша мета є нормально розподіленою і хочете покарати великі помилки більше, ніж маленькі.