Decision Tree

Оновлено: 31.07.2023

У машинному навчанні класифікація - це двоетапний процес, який включає як навчання, так і прогнозування. Модель будується на основі навчальних даних у процесі навчання. На етапі прогнозування модель використовується для прогнозування реакції на надані дані. Дерево рішень є одним з найбільш простих і часто використовуваних методів класифікації.

  • Алгоритм дерева рішень є частиною сімейства алгоритмів керованого навчання.
.

Підхід дерева рішень також може бути використаний для вирішення проблем регресії та класифікації.

Вивчаючи основні правила прийняття рішень, виведені з минулих даних, метою використання дерева рішень є розробка навчальної моделі, яка може бути використана для прогнозування класу або значення цільової змінної

Використовуючи дерева рішень для прогнозування мітки класу запису, ми починаємо з кореня. Порівнюється вміст кореня та атрибут запису. Ми йдемо по гілці, яка відповідає цьому значенню, і переходимо до наступного вузла на основі порівняння.

Типи дерева рішень

Тип дерев рішень, які ми маємо, визначається типом цільової змінної, яку ми маємо. Існує два її типи:

  • Дерево рішень з категоріальною змінною: Дерево рішень з категоріальною змінною - це дерево рішень з категоріальною цільовою змінною.
  • Дерево рішень з неперервною змінною: Дерево рішень з неперервною змінною - це дерево рішень з неперервною цільовою змінною.
.

Приклади класифікуються за допомогою дерев рішень шляхом сортування вздовж дерева від кореня до листків/кінцевих вузлів, причому класифікація здійснюється на основі листків/кінцевих вузлів.

Кожна вершина дерева являє собою тестовий випадок для деякої властивості, а кожне ребро, що спускається з вершини, відповідає потенційним рішенням тестового випадку. Це циклічна процедура, яка повторюється для кожного піддерева з коренем у новій вершині.

Як це працює?

Рішення про стратегічне розбиття має значний вплив на точність дерева. Критерії прийняття рішень для дерев класифікації та регресії відрізняються.

Щоб вирішити, чи потрібно розбивати вузол на кілька підвузлів, дерева рішень використовують різні методи. З кожним поколінням підвузлів однорідність створених підвузлів зростає. Коли цільова змінна збільшується, чистота вузла покращується. На основі всіх відповідних параметрів дерево рішень розділяє вузли на підвузли, а потім вибирає розбиття, яке створює найбільш однорідні підвузли.

Тип цільових змінних також враховується при виборі алгоритму.

Переваги дерева рішень

  • Складні процеси ефективно описуються за допомогою дерев рішень - Дерева рішень графічно зображують причинно-наслідкові зв'язки, пропонуючи спрощене розуміння потенційно складного процесу. Навіть якщо ви ніколи раніше не будували дерева рішень, вони прості і зрозумілі.
  • Дерева рішень дають збалансовану перспективу процесу прийняття рішень, враховуючи як ризик, так і винагороду. Хоча консультації з іншими можуть бути корисними при прийнятті важливих рішень, надмірне покладання на думку колег, друзів чи родини може бути проблематичним. Наприклад, вони можуть не володіти всіма фактами. Замість фактів або ймовірності на їхні поради вам можуть впливати їхні упередження.
  • Вигоди і ризики прояснюються за допомогою дерев рішень, які мають прогностичну структуру, що дозволяє вам скласти карту багатьох варіантів і, нарешті, визначити, який курс дій має найбільші шанси на успіх. В результаті ви можете захистити свій вибір від невиправданих ризиків або несприятливих наслідків.
  • Дерева рішень можна адаптувати - Оскільки дерева рішень є нелінійними, вони дозволяють дослідити, підготувати і спрогнозувати кілька альтернативних результатів для ваших рішень, незалежно від того, коли вони відбудуться.
.

Висновок

Ваші здібності до прийняття рішень можна значно покращити, використовуючи дерева рішень. Процес визначення вашого ключового вибору (корінь), різних напрямків дій (гілки) і перспективних результатів (листя), а також зважування ризиків, переваг і шансів на успіх дасть вам можливість побачити процес прийняття рішень з висоти пташиного польоту.