Gaussian Distribution
Оновлено: 31.07.2023
Що таке гаусівський розподіл?
Розподіл Гауса, також відомий як нормальний розподіл, є неперервним розподілом ймовірностей, який широко використовується в статистичному моделюванні та машинному навчанні. Це дзвоноподібна крива, яка симетрична навколо свого середнього значення і характеризується середнім значенням і стандартним відхиленням.
Широке розмаїття явищ реального світу може бути адекватно змодельоване за допомогою гауссового розподілу. Простіше кажучи, центральна гранична теорема є математичним втіленням інтуїтивно зрозумілої реальності, що при агрегуванні численні вимірювані величини мають тенденцію до однакових значень з невеликими відхиленнями.
Це графічне зображення центральної граничної теорії (ЦГТ) в дії, що показує, як величезна кількість точок даних кластеризується разом. Згідно з ЦГТ, зі збільшенням кількості значень у сумі випадкових величин, розподіл цих значень буде наближатися до гауссового. Численні приклади реальних даних, таких як основний стан квантового гармонійного осцилятора або розподіл демографічних ознак серед населення, можуть бути описані за допомогою гауссового розподілу.
Важливість гауссового розподілу
Важливість цього розподілу полягає в тому, що він описує розподіл багатьох природних явищ, таких як розподіл зросту або IQ людей.
Однією з головних причин є центральна гранична теорема, яка стверджує, що сума великої кількості незалежних і однаково розподілених випадкових величин буде мати нормальний розподіл, незалежно від розподілу окремих змінних. Це означає, що якщо у вас є велика вибірка даних, розподіл вибіркового середнього буде приблизно нормальним, навіть якщо вихідні дані не розподілені нормально.
- Гауссівський розподіл важливий тому, що він є поширеною і корисною моделлю для даних, а також тому, що він дозволяє проводити ефективні обчислення в статистичному аналізі.
Ще однією причиною є його технологічність. Багато статистичних методів і моделей ґрунтуються на припущенні, що дані розподілені нормально, і це припущення дозволяє проводити простіші та ефективніші розрахунки. Наприклад, якщо набір даних розподілений нормально, ви можете використовувати стандартний нормальний розподіл (окремий випадок гаусівського розподілу із середнім значенням 0 і стандартним відхиленням 1) для обчислення ймовірностей і статистичних висновків.
Він широко використовується в багатьох галузях, включаючи фізику, інженерію, економіку та біологію, для представлення природних явищ та аналізу даних.
Формула гауссового розподілу
- f(x) = (1 / sqrt(2 * pi * sigma^2)) * exp(-((x - mu)^2) / (2 * sigma^2))
У цій формулі:
- X - дійсне число, що представляє можливе значення неперервної випадкової величини;
- mu - середнє значення розподілу, а сигма - стандартне відхилення;
- (1 / sqrt(2 * pi * sigma^2)) - коефіцієнт нормалізації, який гарантує, що площа під кривою розподілу дорівнює 1; і
- exp(-((x - mu)^2) / (2 * sigma^2)) - дзвоноподібна крива, яка має центр в середньому значенні mu і стандартне відхилення sigma.
Обернений гаусівський розподіл
Це безперервний розподіл ймовірностей, який часто використовується для моделювання часу, необхідного для виконання завдання, або відстані, пройденої частинкою.
Він визначається цією функцією:
- f(x) = (sqrt(lambda / (2 * pi * x^3))) * exp(-lambda * (x - mu)^2 / (2 * mu^2 * x))
У цій формулі:
- X - додатне дійсне число, що представляє можливе значення неперервної випадкової величини;
- mu - середнє значення розподілу, а лямбда - параметр масштабу.
- (sqrt(lambda / (2 * pi * x^3)))- коефіцієнт нормалізації, який гарантує, що площа під кривою розподілу дорівнює 1; і
- exp(-lambda * (x - mu)^2 / (2 * mu^2 * x))- дзвоноподібна крива, яка має центр у середньому значенні mu і параметр масштабу lambda.
Обернений гаусівський розподіл має кілька властивостей, які роблять його корисним для моделювання певних типів даних. Він має важчий хвіст, ніж у гаусівського розподілу, а це означає, що він з більшою ймовірністю дає екстремальні значення. Він також має нахил вправо, оскільки розподіл зміщений вправо від середнього значення. Це робить його корисним для моделювання даних, які мають довгий хвіст або зміщені вправо.
Фінансовий ринок та гаусівський розподіл
Вважається, що ціни на активи та цінова поведінка підпорядковуються нормальному розподілу. Точки в історії цін можуть бути побудовані трейдерами в спробі змоделювати останній рух цін як нормальний розподіл. Ймовірність переоцінки або недооцінки активу тим вища, чим більше його ціна відхиляється від середнього значення. Потенційні угоди можуть бути запропоновані, дивлячись на стандартні відхилення. Оскільки на довгих часових інтервалах важко визначити, коли входити в угоду і виходити з неї, більшість трейдерів, які використовують цю практику, обмежують свої операції більш короткими проміжками часу.
Аналогічно, кілька статистичних теорій намагаються описати вартість активів, виходячи з припущення, що вони підпорядковуються нормальному розподілу. На практиці розподіл цін має "жирні хвости", а отже, їхня ексцес часто перевищує 3. Ціни цих активів відхилилися більш ніж на три стандартних відхилення від середнього значення, що значно відрізняється від того, що можна було б очікувати від нормально розподіленого набору даних. Минулі показники не можуть достовірно передбачити майбутні результати, навіть якщо актив дотримувався нормального розподілу протягом тривалого періоду часу.