F-score

Оновлено: 31.07.2023

Що таке F-score?

F-бали (також відомі як оцінка F1 або F-міра) - це показник, який використовується для оцінки ефективності моделі машинного навчання. Вона поєднує в собі точність і запам'ятовування в єдиному показнику.

Формула F-міри:

  • F-score = 2 * (точність * відгук) / (точність + відгук)

Точність позитивних прогнозів вимірюється за допомогою згадування, тоді як виявлення всіх позитивних випадків у даних вимірюється за допомогою точності. F-рахунок коливається від 0 до 1, причому вищі значення вказують на кращі показники.

F-критерій у машинному навчанні часто використовується, коли потрібно збалансувати точність і відгук, і особливо корисний, коли позитивний клас зустрічається рідко. У системі медичної діагностики може бути важливіше забезпечити високу точність моделі (щоб мінімізувати ризик пропущених діагнозів), тоді як у фільтрі спаму першочерговим завданням є забезпечення високої точності (щоб мінімізувати кількість помилкових спрацьовувань).

У деяких випадках може виникнути потреба зважити точність та пригадування по-різному, і в цьому випадку F-рахунок можна модифікувати, щоб він був середньозваженим гармонійним значенням точності та пригадування. Це називається F-бета оцінка, де бета - це вага, що застосовується до пригадування.

Рахунок F-2

Оцінка F-2 - це варіант вимірювання F1, метрика, яка використовується для оцінки продуктивності моделі машинного навчання. Як і F-score, F-2 поєднує в собі точність і запам'ятовування в єдиному показнику. Однак оцінка F-2 робить більший акцент на запам'ятовуванні, ніж стандартна оцінка F-1.

Оцінка F-2 визначається наступним чином:

  • Оцінка F-2 = (1 + 2^2) * (точність * відгук) / (2^2 * точність + відгук)

Оцінка F-2 варіюється від 0 до 1, причому вищі значення вказують на кращі показники.

Ця оцінка часто використовується, коли метою є пріоритетність відтворення над точністю. Як ми вже згадували в нашому прикладі з медичним діагнозом, може бути важливіше забезпечити високу точність відтворення моделі (щоб мінімізувати ризик пропущених діагнозів). Оцінка F-2 може бути використана для відображення цього акценту.

Варто зазначити, що оцінка F-2 - це лише один із способів зважити точність і згадати компоненти оцінки F. Інші поширені ваги включають оцінку F-0,5, яка робить більший акцент на точності.

Застосування F-рахунку

  • Завдання класифікації. F-рахунок часто використовується для оцінки ефективності класифікатора, особливо коли метою є збалансування точності та запам'ятовування.
  • Завдання пошуку інформації. Показник F можна використовувати для оцінки продуктивності пошукової системи або іншої системи пошуку інформації. Точність показує, наскільки добре знайдені документи відповідають запиту, тоді як відгук оцінює, скільки відповідних результатів було знайдено.
  • Гіперпараметрична оптимізація. F-рахунок можна використовувати як метрику продуктивності при оптимізації гіперпараметрів моделі машинного навчання. Це може бути корисно для пошуку найкращого набору гіперпараметрів для заданої задачі.
  • Порівняння моделей. F-рахунок можна використовувати для порівняння продуктивності різних моделей машинного навчання на одному завданні. Це може бути корисно при виборі найкращої моделі для конкретного застосування.
.

Варто зазначити, що F-рахунок - це лише одна з метрик, яку можна використовувати для оцінки ефективності моделі машинного навчання. Інші поширені метрики включають точність, площу під кривою (AUC) і втрату логів. Відповідна метрика буде залежати від специфіки завдання і цілей моделі.