:: ECONOMY :: СУЧАСНІ ДАТАСЕТИ ДЛЯ НАВЧАННЯ МОДЕЛЕЙ КОМП’ЮТЕРНОГО ЗОРУ: ОГЛЯД І ХАРАКТЕРИСТИКА :: ECONOMY :: СУЧАСНІ ДАТАСЕТИ ДЛЯ НАВЧАННЯ МОДЕЛЕЙ КОМП’ЮТЕРНОГО ЗОРУ: ОГЛЯД І ХАРАКТЕРИСТИКА
:: ECONOMY :: СУЧАСНІ ДАТАСЕТИ ДЛЯ НАВЧАННЯ МОДЕЛЕЙ КОМП’ЮТЕРНОГО ЗОРУ: ОГЛЯД І ХАРАКТЕРИСТИКА
 
UA  PL  EN
         

Світ наукових досліджень. Випуск 52

Термін подання матеріалів

19 травня 2026

До початку конференції залишилось днів 6



  Головна
Нові вимоги до публікацій результатів кандидатських та докторських дисертацій
Редакційна колегія. ГО «Наукова спільнота»
Договір про співробітництво з Wyzsza Szkola Zarzadzania i Administracji w Opolu
Календар конференцій
Архів
  Наукові конференції
 
 Лінки
 Форум
Наукові конференції
Наукова спільнота - інтернет конференції
Світ наукових досліджень www.economy-confer.com.ua

 Голосування 
З яких джерел Ви дізнались про нашу конференцію:

соціальні мережі;
інформування електронною поштою;
пошукові інтернет-системи (Google, Yahoo, Meta, Yandex);
інтернет-каталоги конференцій (science-community.org, konferencii.ru, vsenauki.ru, інші);
наукові підрозділи ВУЗів;
порекомендували знайомі.
з СМС повідомлення на мобільний телефон.


Результати голосувань Докладніше

 Наша кнопка
www.economy-confer.com.ua - Економічні наукові інтернет-конференції

 Лічильники
Українська рейтингова система

СУЧАСНІ ДАТАСЕТИ ДЛЯ НАВЧАННЯ МОДЕЛЕЙ КОМП’ЮТЕРНОГО ЗОРУ: ОГЛЯД І ХАРАКТЕРИСТИКА

 
24.04.2026 09:57
Автор: Граф Євген Сергійович, студент, Київський національний університет будівництва і архітектури; Терейковська Людмила Олексіївна, доктор технічних наук, професор, Київський національний університет будівництва і архітектури
[26. Технічні науки;]

Розвиток комп’ютерного зору тісно пов’язаний із доступністю великих і якісних наборів даних. Саме датасети визначають ефективність навчання моделей, їх здатність до узагальнення та застосування в реальних умовах. У сучасних умовах особливої актуальності набуває аналіз існуючих рішень у сфері створення датасетів, їх характеристик, переваг і обмежень.

Метою даної роботи є огляд сучасних датасетів комп’ютерного зору, аналіз їх структури, особливостей анотації та визначення тенденцій їх розвитку.

Датасет ImageNet — один із найбільш масштабних наборів даних для задач класифікації зображень. Датасет містить понад 14 мільйонів зображень, організованих у понад 20 тисяч категорій відповідно до ієрархії WordNet. Категорії формуються за принципом семантичної близькості понять: від загальних (наприклад, «транспорт», «тварини») до більш спеціалізованих («пасажирський літак», «сибірський хаскі»). Кожна категорія містить сотні й тисячі зображень, що відображають різні ракурси, масштаби та умови освітлення об’єктів. Для анотації використовувався crowdsourcing, що забезпечило високу якість розмітки. Важливим аспектом є те, що ImageNet став основою для змагання ILSVRC, яке сприяло розвитку глибоких нейронних мереж [1].

Датасет COCO був створений для розв’язання більш складних задач комп’ютерного зору. На відміну від ImageNet, COCO містить зображення з реальних сцен, де одночасно присутні кілька об’єктів, що взаємодіють між собою. Датасет включає різні типи анотацій: обмежувальні рамки, маски сегментації та ключові точки для аналізу положення людини. Крім того, кожне зображення може містити текстовий опис сцени, що робить можливим використання датасету для задач генерації описів (image captioning). Це дозволяє застосовувати COCO для детекції об’єктів, сегментації та аналізу сцен [2].

Датасет Open Images Dataset, розроблений компанією Google, містить понад 9 мільйонів зображень і близько 6000 категорій. Його особливістю є багаторівнева анотація, яка включає не лише класи об’єктів, а й відношення між ними. Це дозволяє використовувати датасет для складних задач аналізу сцен і взаємодій об’єктів. Разом із тим великий обсяг даних потребує значних обчислювальних ресурсів для обробки та навчання моделей [3].

Датасет SA-1B, створений компанією Meta, включає понад 11 мільйонів зображень і більше 1,1 мільярда масок сегментації. Особливістю є class-agnostic підхід, при якому сегментація виконується без попереднього визначення класу об’єкта. Розмітка здійснювалась із використанням напівавтоматичного підходу (data engine), що дозволило суттєво масштабувати процес створення датасету. Такий підхід відповідає концепції foundation datasets — універсальних наборів даних для навчання моделей широкого призначення [4].

У роботі [5] Linh Trinha та співавтори розглядають спеціалізовані датасети для задач комп’ютерного зору в автономних морських системах. Автори аналізують набори даних для розпізнавання об’єктів у складних умовах водного середовища, включаючи судна, перешкоди та берегову лінію. Зазначається, що такі датасети мають обмежений масштаб і вузьку спеціалізацію, однак є критично важливими для задач навігації. Особлива увага приділяється проблемам варіативності освітлення, відблисків і погодних умов, що ускладнюють навчання моделей [5].

Висновок

У результаті проведеного аналізу встановлено, що сучасні датасети комп’ютерного зору є ключовим фактором розвитку нейромережевих технологій. Вони еволюціонують у напрямку збільшення обсягів, ускладнення структури та автоматизації процесів анотації. Основними напрямками подальшого розвитку є створення більш різноманітних і репрезентативних наборів даних, зменшення впливу bias, автоматизація розмітки, розвиток універсальних foundation datasets.

Список використаних джерел

1. ImageNet. ImageNet Large Scale Visual Recognition Challenge. – Режим доступу: https://www.image-net.org/ 

2. COCO. Microsoft COCO Dataset. – Режим доступу: https://cocodataset.org/ 

3. Open Images Dataset. Open Images Dataset V7. – Режим доступу: https://storage.googleapis.com/openimages/web/index.html 

4. SA-1B. Segment Anything Dataset. – Режим доступу: https://ai.meta.com/datasets/segment-anything/ 

5. Linh Trinha, Siegfried Mercelisa, Ali Anwara. A comprehensive review of datasets and deep learning techniques for vision in Unmanned Surface Vehicles. – Режим доступу: https://arxiv.org/abs/2412.01461



Creative Commons Attribution Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

допомогаЗнайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter


 Інші наукові праці даної секції
ЗАСТОСУВАННЯ НЕЙРОННИХ МЕРЕЖ ДЛЯ ВИЯВЛЕННЯ ТА ВІДСТЕЖЕННЯ ОБ'ЄКТІВ У ВІДЕО
24.04.2026 10:11
ВИМІРЮВАННЯ КОЕФІЦІЄНТА ПОВІТРОПРОНИКНОСТІ МЕТОДОМ ЗМІННОГО РОЗРІДЖЕННЯ
23.04.2026 20:56
DISTRIBUTED MULTI-THREADED EMBEDDED CONTROL ARCHITECTURE FOR EMG-DRIVEN ORTHOTIC SYSTEMS
22.04.2026 19:29
ОБҐРУНТУВАННЯ ПАРАМЕТРІВ ЕНЕРГОЕФЕКТИВНОЇ БЕЗБАШТОВОЇ СИСТЕМИ ВОДОПОСТАЧАННЯ ДЛЯ МАЛИХ НАСЕЛЕНИХ ПУНКТІВ
19.04.2026 08:30
ДОСЛІДЖЕННЯ ЗАЛЕЖНОСТІ ПРОДУКТИВНОСТІ ЕКСКАВАТОРУ ВІД УМОВ ВИКОНАННЯ ЗАВДАНЬ ІНЖЕНЕРНОЇ ПІДТРИМКИ
19.04.2026 08:16
ЛАЗЕРНА ДИФРАКТОМЕТРІЯ ІНСТРУМЕНТА
18.04.2026 16:34




© 2010-2026 Всі права застережені При використанні матеріалів сайту посилання на www.economy-confer.com.ua обов’язкове!
Час: 0.117 сек. / Mysql: 2067 (0.088 сек.)