Pascal
Оновлено: 31.07.2023
Здатність комп'ютерних мереж знаходити потрібні типи об'єктів на зображенні/сцені називається розпізнаванням об'єктів. Навчальні дані для виявлення об'єктів надаються у форматах XML або JSON. Кожне представлення має свої переваги та недоліки. Для навчання моделі ML розпізнавання об'єктів на зображенні необхідно використовувати набір даних, що містить всю інформацію про об'єкти, присутні на зображенні. Анотування - це метод, який створює набір даних, що містить характеристики всіх об'єктів на зображенні. Анотація допомагає зіставити об'єкт з відповідною міткою, намалювавши обмежувальну рамку навколо об'єкта. Прямокутний прямокутник, який називається "обмежувальною рамкою", використовується для символізації кожного зіставлення об'єкт-мітка. Позиція об'єкта на зображенні відображається за допомогою обмежувальних рамок, які є набором координат або значень.
Pascal VOC
Цей набір даних містить стандартизовані зображення для таких завдань, як виявлення та сегментація об'єктів. Ці набори даних створено за допомогою інструментів, які відповідають встановленим стандартам для оцінки та порівняння різних методологій. Файли PASCAL VOC були визначені як еталон виявлення об'єктів у 2008 році. З 2005 по 2012 рік було проведено низку змагань з розпізнавання об'єктів з використанням стандартизованого формату файлів для зберігання анотацій до зображень. Конкурс PASCAL VOC складався з двох ключових компонентів:
- Стандартна програма оцінювання та загальнодоступний набір даних.
- Щорічний турнір, а також воркшоп.
Основною метою цієї вправи було визначити здатність моделей виконувати наступні завдання:
- Перевірити, чи є предмет на зображенні, класифікувавши його.
- Визначити, де розташовані предмети на зображенні.
Зі значними змінами в наборі даних ця серія конкурсів завершилася в 2012 році. PASCAL VOC тепер пропонує стандартизовані набори зображень для більш ніж 20 різних класів, які часто використовуються для задач класифікації.
Структура Pascal VOC
- Папка - папка, яка містить набір даних. Цей параметр допомагає ідентифікувати анотовані фотографії всередині теки.
- Назва файлу - назва файлу зображення, на якому розміщено дані. Цей параметр вказує відносний шлях до файлу анотованого зображення.
- Шлях - абсолютний шлях до файлу зображення.
- Джерело - вказує, де файл спочатку зберігався в базі даних.
- Розмір - ширина, висота і глибина зображення.
- Складний об'єкт - вказує, чи важко розпізнати об'єкт на фотографії, де 0 - легко, а 0 - важко.
Заключна думка
База даних PASCAL VOC використовується для розпізнавання та сегментації об'єктів. Її зберігання у вигляді XML-файлів дозволяє нам легко змінювати набори даних, зберігаючи при цьому єдиний формат.