Feature Vector
Оновлено: 31.07.2023
Вступ
Вектор ознак - це конкретна спостережувана властивість явища, яку можна виміряти. Параметри зросту та ваги в категорії людей є наочним прикладом, оскільки їх можна спостерігати та вимірювати.
Зазвичай ми покладаємося на комп'ютерні функції для вилучення корисної інформації для прогнозування іншої функції, припускаючи, що вони мають статичний або нелінійний зв'язок. Результати побудованої моделі машинного навчання продемонструють правильність цього твердження.
- Вектор ознак - це n-вимірний вектор числових ознак, які описують деякий об'єкт при розпізнаванні образів у машинному навчанні
Багато алгоритмів машинного навчання покладаються на числові представлення об'єктів, оскільки вони спрощують обробку та статистичний аналіз. Вектор - це не що інше, як список числових значень. Зрозуміло, що вектор - це просто список обчислених значень ознаки. Значень, які були знайдені.
Набір даних зазвичай розбивається на декілька екземплярів, кожен з яких має власний набір ознак. Кожному прикладу відповідає один вектор ознак, який містить всі числові значення для цього прикладу об'єкта.
Всі вектори ознак зазвичай складаються в матрицю дизайну, де кожен рядок представляє вектор для одного прикладу, а кожен стовпець - всі значення для цієї ознаки в прикладах.
Уявіть, що ви організували дані у вигляді електронної таблиці, де стовпчики представляють ваші характеристики, а рядки - різні вибірки. Подумайте про це: якщо ви запитаєте трьох людей про їхню стать і вік, ви отримаєте таблицю з трьома рядками (3 людини) і двома стовпчиками (зріст, вага).
Тепер кожен рядок можна інтерпретувати як один вектор функції. У нашому прикладі вектор функції матиме два виміри (зріст, вага). Оскільки виміри походять з різних областей, величина вектора функції може не мати прямого застосування для нас за відсутності фізики (на противагу, порівняйте вектор швидкості). Тим не менш, ми змогли обчислити величину (після нормалізації). Орієнтація вектора функцій, з іншого боку, є важливою, оскільки вона відображає самі значення функцій.
Різниця між вектором ознак та картою ознак
Вектор - це стислий тип представлення об'єкта. Послідовні елементи вектора не мають просторового зв'язку з вихідним об'єктом.
Просторово-реляційна конструкція об'єкта представлена картою функцій. Два сусіди, з'єднані одним ребром, є проекцією двох локальних атрибутів об'єкта на такій функціональній карті.
Інтенсивність зв'язку показується краєм на карті особливостей у порівнянні з реальним об'єктом.
Нижче наведено приклад вектора функцій мозку: колір, щільність, форма, відстань, жорсткість. Концептуальна схема розуму містить опис нейронної мережі, коркові карти, розподілені по всьому мозку, і регіональну карту, зосереджену на позначеннях головного мозку, потиличної, префронтальної і лобової ділянок. В обох випадках вузли, або певні властивості, пов'язані з їхнім оточенням.
Крім того, видобування або збирання ознак є сумішшю мистецтва і науки, а інженерія ознак - це процес проектування систем для цього. Це вимагає поєднання автоматизованих методів, інтуїції та досвіду експерта, а також тестування різних можливостей.
Функціональні вектори та їх застосування
Вектори широко використовуються в ML через їхню корисність і практичність у числовому представленні об'єктів для допомоги в різноманітних аналізах. Оскільки існує багато методів порівняння векторів між собою, вони є корисними для досліджень. Евклідова відстань - це простий спосіб виміряти вектори двох об'єктів.
- Вектори використовуються в задачах класифікації, штучних нейронних мережах та алгоритмах k-найближчих сусідів
Вектори ознак у машинному навчанні використовуються для математичного опису числових характеристик об'єкта. Вони мають вирішальне значення в різноманітних програмах машинного навчання та розпізнавання образів. Простіше кажучи, вектор ознак в інтелектуальному аналізі даних має вирішальне значення. Для того, щоб алгоритми ML виконували аналіз інтерпретації, їм зазвичай потрібне числове представлення об'єктів. Вектори ознак - це математичні еквіваленти векторів пояснювальних змінних, що використовуються в таких методах, як лінійна регресія.
Розміри градієнтів, країв, інтенсивність кольору RGB, площі, а також інші характеристики можуть бути використані в обробці зображень. Через легкість, з якою характеристики зображення, такі як згадані вище, можуть бути математично оцінені, якщо їх помістити у вектори, вектори ознак є особливо поширеними для аналізу обробки зображень.
Вектори ознак надзвичайно корисні для класифікації тексту та боротьби зі спамом. Це можуть бути IP-адреси, структури тексту, частоти слів або заголовки листів.