F-score
Оновлено: 31.07.2023
Що таке F-score?
F-бали (також відомі як оцінка F1 або F-міра) - це показник, який використовується для оцінки ефективності моделі машинного навчання. Вона поєднує в собі точність і запам'ятовування в єдиному показнику.
Формула F-міри:
- F-score = 2 * (точність * відгук) / (точність + відгук)
Точність позитивних прогнозів вимірюється за допомогою згадування, тоді як виявлення всіх позитивних випадків у даних вимірюється за допомогою точності. F-рахунок коливається від 0 до 1, причому вищі значення вказують на кращі показники.
F-критерій у машинному навчанні часто використовується, коли потрібно збалансувати точність і відгук, і особливо корисний, коли позитивний клас зустрічається рідко. У системі медичної діагностики може бути важливіше забезпечити високу точність моделі (щоб мінімізувати ризик пропущених діагнозів), тоді як у фільтрі спаму першочерговим завданням є забезпечення високої точності (щоб мінімізувати кількість помилкових спрацьовувань).
У деяких випадках може виникнути потреба зважити точність та пригадування по-різному, і в цьому випадку F-рахунок можна модифікувати, щоб він був середньозваженим гармонійним значенням точності та пригадування. Це називається F-бета оцінка, де бета - це вага, що застосовується до пригадування.
Рахунок F-2
Оцінка F-2 - це варіант вимірювання F1, метрика, яка використовується для оцінки продуктивності моделі машинного навчання. Як і F-score, F-2 поєднує в собі точність і запам'ятовування в єдиному показнику. Однак оцінка F-2 робить більший акцент на запам'ятовуванні, ніж стандартна оцінка F-1.
Оцінка F-2 визначається наступним чином:
- Оцінка F-2 = (1 + 2^2) * (точність * відгук) / (2^2 * точність + відгук)
Оцінка F-2 варіюється від 0 до 1, причому вищі значення вказують на кращі показники.
Ця оцінка часто використовується, коли метою є пріоритетність відтворення над точністю. Як ми вже згадували в нашому прикладі з медичним діагнозом, може бути важливіше забезпечити високу точність відтворення моделі (щоб мінімізувати ризик пропущених діагнозів). Оцінка F-2 може бути використана для відображення цього акценту.
Варто зазначити, що оцінка F-2 - це лише один із способів зважити точність і згадати компоненти оцінки F. Інші поширені ваги включають оцінку F-0,5, яка робить більший акцент на точності.
Застосування F-рахунку
- Завдання класифікації. F-рахунок часто використовується для оцінки ефективності класифікатора, особливо коли метою є збалансування точності та запам'ятовування.
- Завдання пошуку інформації. Показник F можна використовувати для оцінки продуктивності пошукової системи або іншої системи пошуку інформації. Точність показує, наскільки добре знайдені документи відповідають запиту, тоді як відгук оцінює, скільки відповідних результатів було знайдено.
- Гіперпараметрична оптимізація. F-рахунок можна використовувати як метрику продуктивності при оптимізації гіперпараметрів моделі машинного навчання. Це може бути корисно для пошуку найкращого набору гіперпараметрів для заданої задачі.
- Порівняння моделей. F-рахунок можна використовувати для порівняння продуктивності різних моделей машинного навчання на одному завданні. Це може бути корисно при виборі найкращої моделі для конкретного застосування.
Варто зазначити, що F-рахунок - це лише одна з метрик, яку можна використовувати для оцінки ефективності моделі машинного навчання. Інші поширені метрики включають точність, площу під кривою (AUC) і втрату логів. Відповідна метрика буде залежати від специфіки завдання і цілей моделі.