:: ECONOMY :: СУЧАСНІ ДАТАСЕТИ ДЛЯ НАВЧАННЯ МОДЕЛЕЙ КОМП’ЮТЕРНОГО ЗОРУ: ОГЛЯД І ХАРАКТЕРИСТИКА

:: ECONOMY :: СУЧАСНІ ДАТАСЕТИ ДЛЯ НАВЧАННЯ МОДЕЛЕЙ КОМП’ЮТЕРНОГО ЗОРУ: ОГЛЯД І ХАРАКТЕРИСТИКА

UA PL EN

Світ наукових досліджень. Випуск 54

Термін подання матеріалів

08 липня 2026

До початку конференції залишилось днів 11

Нові вимоги до публікацій результатів кандидатських та докторських дисертацій

Редакційна колегія. ГО «Наукова спільнота»

Договір про співробітництво з Wyzsza Szkola Zarzadzania i Administracji w Opolu

Календар конференцій

Наукові конференції

Конференції 2026

Світ наукових досліджень. Випуск 48 (27-28.01.2026)

Світ наукових досліджень. Випуск 49 (24-25.02.2026)

Світ наукових досліджень. Випуск 50 (19-20.03.2026)

Світ наукових досліджень. Випуск 51 (22-23.04.2026)

1. Економічні науки;

2. Інформаційні системи і технології;

3. Педагогічні науки;

4. Психологічні науки;

5. Юридичні науки;

6. Історичні науки;

7. Філософські науки;

8. Культурологія;

9. Філологічні науки;

10. Мистецтвознавство;

11. Географічні науки;

12. Національна безпека;

13. Соціологічні науки;

14. Політичні науки;

15. Фізичне виховання та спорт;

16. Державне управління;

17. Соціальні комунікації;

18. Медичні науки;

19. Фармацевтичні науки;

20. Ветеринарні науки;

21. Сільськогосподарські науки;

22. Хімічні науки;

23. Біологічні науки;

24. Геологічні науки;

25. Фізико-математичні науки;

26. Технічні науки;

27. Архітектура;

28. Військова справа

Світ наукових досліджень. Випуск 52 (20-21.05.2026)

Світ наукових досліджень. Випуск 53 (18-19.06.2026)

Світ наукових досліджень. Випуск 54 (9-10.07.2026)

Конференції 2025

Конференції 2024

Конференції 2023

Конференції 2022

Конференції 2021

Конференції 2020

Конференції 2019

Конференції 2018

Конференції 2017

Конференції 2016

Конференції 2015

Конференції 2014

Конференції 2013

Конференції 2012

Конференції 2011

Конференції 2010

Наукові конференції

Наукова спільнота - інтернет конференції

Світ наукових досліджень www.economy-confer.com.ua

Голосування

Наша кнопка

Лічильники

СУЧАСНІ ДАТАСЕТИ ДЛЯ НАВЧАННЯ МОДЕЛЕЙ КОМП’ЮТЕРНОГО ЗОРУ: ОГЛЯД І ХАРАКТЕРИСТИКА

24.04.2026 09:57

Автор: Граф Євген Сергійович, студент, Київський національний університет будівництва і архітектури; Терейковська Людмила Олексіївна, доктор технічних наук, професор, Київський національний університет будівництва і архітектури

[26. Технічні науки;]

Розвиток комп’ютерного зору тісно пов’язаний із доступністю великих і якісних наборів даних. Саме датасети визначають ефективність навчання моделей, їх здатність до узагальнення та застосування в реальних умовах. У сучасних умовах особливої актуальності набуває аналіз існуючих рішень у сфері створення датасетів, їх характеристик, переваг і обмежень.

Метою даної роботи є огляд сучасних датасетів комп’ютерного зору, аналіз їх структури, особливостей анотації та визначення тенденцій їх розвитку.

Датасет ImageNet — один із найбільш масштабних наборів даних для задач класифікації зображень. Датасет містить понад 14 мільйонів зображень, організованих у понад 20 тисяч категорій відповідно до ієрархії WordNet. Категорії формуються за принципом семантичної близькості понять: від загальних (наприклад, «транспорт», «тварини») до більш спеціалізованих («пасажирський літак», «сибірський хаскі»). Кожна категорія містить сотні й тисячі зображень, що відображають різні ракурси, масштаби та умови освітлення об’єктів. Для анотації використовувався crowdsourcing, що забезпечило високу якість розмітки. Важливим аспектом є те, що ImageNet став основою для змагання ILSVRC, яке сприяло розвитку глибоких нейронних мереж [1].

Датасет COCO був створений для розв’язання більш складних задач комп’ютерного зору. На відміну від ImageNet, COCO містить зображення з реальних сцен, де одночасно присутні кілька об’єктів, що взаємодіють між собою. Датасет включає різні типи анотацій: обмежувальні рамки, маски сегментації та ключові точки для аналізу положення людини. Крім того, кожне зображення може містити текстовий опис сцени, що робить можливим використання датасету для задач генерації описів (image captioning). Це дозволяє застосовувати COCO для детекції об’єктів, сегментації та аналізу сцен [2].

Датасет Open Images Dataset, розроблений компанією Google, містить понад 9 мільйонів зображень і близько 6000 категорій. Його особливістю є багаторівнева анотація, яка включає не лише класи об’єктів, а й відношення між ними. Це дозволяє використовувати датасет для складних задач аналізу сцен і взаємодій об’єктів. Разом із тим великий обсяг даних потребує значних обчислювальних ресурсів для обробки та навчання моделей [3].

Датасет SA-1B, створений компанією Meta, включає понад 11 мільйонів зображень і більше 1,1 мільярда масок сегментації. Особливістю є class-agnostic підхід, при якому сегментація виконується без попереднього визначення класу об’єкта. Розмітка здійснювалась із використанням напівавтоматичного підходу (data engine), що дозволило суттєво масштабувати процес створення датасету. Такий підхід відповідає концепції foundation datasets — універсальних наборів даних для навчання моделей широкого призначення [4].

У роботі [5] Linh Trinha та співавтори розглядають спеціалізовані датасети для задач комп’ютерного зору в автономних морських системах. Автори аналізують набори даних для розпізнавання об’єктів у складних умовах водного середовища, включаючи судна, перешкоди та берегову лінію. Зазначається, що такі датасети мають обмежений масштаб і вузьку спеціалізацію, однак є критично важливими для задач навігації. Особлива увага приділяється проблемам варіативності освітлення, відблисків і погодних умов, що ускладнюють навчання моделей [5].

Висновок

У результаті проведеного аналізу встановлено, що сучасні датасети комп’ютерного зору є ключовим фактором розвитку нейромережевих технологій. Вони еволюціонують у напрямку збільшення обсягів, ускладнення структури та автоматизації процесів анотації. Основними напрямками подальшого розвитку є створення більш різноманітних і репрезентативних наборів даних, зменшення впливу bias, автоматизація розмітки, розвиток універсальних foundation datasets.

Список використаних джерел

1. ImageNet. ImageNet Large Scale Visual Recognition Challenge. – Режим доступу: https://www.image-net.org/

2. COCO. Microsoft COCO Dataset. – Режим доступу: https://cocodataset.org/

3. Open Images Dataset. Open Images Dataset V7. – Режим доступу: https://storage.googleapis.com/openimages/web/index.html

4. SA-1B. Segment Anything Dataset. – Режим доступу: https://ai.meta.com/datasets/segment-anything/

5. Linh Trinha, Siegfried Mercelisa, Ali Anwara. A comprehensive review of datasets and deep learning techniques for vision in Unmanned Surface Vehicles. – Режим доступу: https://arxiv.org/abs/2412.01461

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Інші наукові праці даної секції
	ЗАСТОСУВАННЯ НЕЙРОННИХ МЕРЕЖ ДЛЯ ВИЯВЛЕННЯ ТА ВІДСТЕЖЕННЯ ОБ'ЄКТІВ У ВІДЕО 24.04.2026 10:11
	ВИМІРЮВАННЯ КОЕФІЦІЄНТА ПОВІТРОПРОНИКНОСТІ МЕТОДОМ ЗМІННОГО РОЗРІДЖЕННЯ 23.04.2026 20:56
	DISTRIBUTED MULTI-THREADED EMBEDDED CONTROL ARCHITECTURE FOR EMG-DRIVEN ORTHOTIC SYSTEMS 22.04.2026 19:29
	ОБҐРУНТУВАННЯ ПАРАМЕТРІВ ЕНЕРГОЕФЕКТИВНОЇ БЕЗБАШТОВОЇ СИСТЕМИ ВОДОПОСТАЧАННЯ ДЛЯ МАЛИХ НАСЕЛЕНИХ ПУНКТІВ 19.04.2026 08:30
	ДОСЛІДЖЕННЯ ЗАЛЕЖНОСТІ ПРОДУКТИВНОСТІ ЕКСКАВАТОРУ ВІД УМОВ ВИКОНАННЯ ЗАВДАНЬ ІНЖЕНЕРНОЇ ПІДТРИМКИ 19.04.2026 08:16
	ЛАЗЕРНА ДИФРАКТОМЕТРІЯ ІНСТРУМЕНТА 18.04.2026 16:34

© 2010-2026 Всі права застережені	При використанні матеріалів сайту посилання на www.economy-confer.com.ua обов’язкове!
Час: 0.125 сек. / Mysql: 2103 (0.095 сек.)