:: ECONOMY :: МЕТОДИ ГЕНЕРАТИВНОГО МОДЕЛЮВАННЯ ЗОБРАЖЕНЬ

:: ECONOMY :: МЕТОДИ ГЕНЕРАТИВНОГО МОДЕЛЮВАННЯ ЗОБРАЖЕНЬ

UA PL EN

Світ наукових досліджень. Випуск 54

Термін подання матеріалів

08 липня 2026

До початку конференції залишилось днів 11

Нові вимоги до публікацій результатів кандидатських та докторських дисертацій

Редакційна колегія. ГО «Наукова спільнота»

Договір про співробітництво з Wyzsza Szkola Zarzadzania i Administracji w Opolu

Календар конференцій

Наукові конференції

Конференції 2026

Світ наукових досліджень. Випуск 48 (27-28.01.2026)

Світ наукових досліджень. Випуск 49 (24-25.02.2026)

Світ наукових досліджень. Випуск 50 (19-20.03.2026)

Світ наукових досліджень. Випуск 51 (22-23.04.2026)

1. Економічні науки;

2. Інформаційні системи і технології;

3. Педагогічні науки;

4. Психологічні науки;

5. Юридичні науки;

6. Історичні науки;

7. Філософські науки;

8. Культурологія;

9. Філологічні науки;

10. Мистецтвознавство;

11. Географічні науки;

12. Національна безпека;

13. Соціологічні науки;

14. Політичні науки;

15. Фізичне виховання та спорт;

16. Державне управління;

17. Соціальні комунікації;

18. Медичні науки;

19. Фармацевтичні науки;

20. Ветеринарні науки;

21. Сільськогосподарські науки;

22. Хімічні науки;

23. Біологічні науки;

24. Геологічні науки;

25. Фізико-математичні науки;

26. Технічні науки;

27. Архітектура;

28. Військова справа

Світ наукових досліджень. Випуск 52 (20-21.05.2026)

Світ наукових досліджень. Випуск 53 (18-19.06.2026)

Світ наукових досліджень. Випуск 54 (9-10.07.2026)

Конференції 2025

Конференції 2024

Конференції 2023

Конференції 2022

Конференції 2021

Конференції 2020

Конференції 2019

Конференції 2018

Конференції 2017

Конференції 2016

Конференції 2015

Конференції 2014

Конференції 2013

Конференції 2012

Конференції 2011

Конференції 2010

Наукові конференції

Наукова спільнота - інтернет конференції

Світ наукових досліджень www.economy-confer.com.ua

Голосування

Наша кнопка

Лічильники

МЕТОДИ ГЕНЕРАТИВНОГО МОДЕЛЮВАННЯ ЗОБРАЖЕНЬ

24.04.2026 12:07

Автор: Мельник Геннадій Андрійович, студент, Київський національний університет будівництва і архітектури; Терейковська Людмила Олексіївна, доктор технічних наук, доцент, Київський національний університет будівництва і архітектури

[1. Економічні науки;]

Еволюція методів штучного інтелекту сформувала новий клас загроз для систем управління доступом - масове застосування діпфейків. Для забезпечення надійної ідентифікації розробникам необхідно створювати власні бази синтетичних артефактів для навчання захисних алгоритмів. Генеративні моделі можуть бути використані для синтезу наборів даних облич чи райдужної оболонки для тестування систем на стійкість до атак (spoofing). Сьогодні домінують два основні підходи до генерації зображень: GAN (Generative Adversarial Networks, генеративно-змагальні мережі) [1] та Diffusion Models (дифузійні моделі) [2].

GAN запропоновані Яном Гудфеллоу у 2014 році. Суть підходу полягає у змаганні двох нейромереж: генератора та дискримінатора. Генератор намагається створити зображення з випадкового шуму так, щоб воно виглядало максимально реалістично. Його мета - "обійти" дискримінатор. Дискримінатор працює як класифікатор. Він отримує на вхід як реальні зображення з навчальної вибірки, так і згенеровані. Його мета - відрізнити фальшивку від оригіналу. Переваги GAN: швидка генерація (один прохід мережі); створюють різкі, висококонтрастні зображення. Недоліки: нестабільне тренування; проблема, коли генератор знаходить одне вдале зображення і починає генерувати тільки його, ігноруючи різноманітність датасету. В основі GAN лежить мінімаксний підхід з теорії ігор двох гравців з нульовою сумою. Є розподіл реальних даних p_data (x) та апріорний розподіл шуму p_z (z) (зазвичай нормальний або рівномірний). Генератор G(z) відображає шум у простір даних, створюючи розподіл p_g. Дискримінатор D(x) видає ймовірність того, що x є реальним, взятим з p_data, а не згенерованим. Мета дискримінатора - максимізувати функцію цілі, мета генератора - мінімізувати. Ян Гудфеллоу математично довів, що глобальний оптимум цієї гри досягається тоді і тільки тоді, коли розподіл генератора ідеально збігається з розподілом реальних даних: p_g=p_data. У цій точці дискримінатор не може відрізнити реальне від підробки, і D(x)=0.5 для всіх x. Основні варіанти архітектур GAN: Conditional GAN, глибока згорткова GAN, StyleGAN. Conditional GAN розширюють стандартну архітектуру GAN шляхом введення додаткової інформації як у генератор, так і в дискримінатор. Замість генерації даних лише з випадкового шуму, генератор отримує як шум, так і умову, наприклад, класову мітку. Дискримінатор також отримує умову для оцінки, чи є зразок реалістичним. Глибока згорткова GAN (DCGAN) замінює повнозв'язні шари в оригінальних GAN на згорткові та транспоновані згорткові шари, що підвищує їхню ефективність для генерації зображень. Також впроваджуються архітектурні рекомендації, такі як видалення повнозв'язних шарів, використання пакетної нормалізації та застосування активацій ReLU/LeakyReLU. StyleGAN, розроблений компанією NVIDIA, впроваджує керування у генераторі. Замість прямої подачі вектора шуму до генератора, він проходить через мережу відображення, яка створює "стильові вектори", що впливають на кожен шар генератора. Це забезпечує тонке керування візуальними ознаками, такими як колір волосся, вираз обличчя чи освітлення.

Diffusion Models базуються на двох марковських ланцюгах та нерівноважній термодинаміці. Процес ділиться на два етапи: прямий та зворотний. При прямому процесі до реального зображення поступово додається гауссівський шум, поки воно не перетвориться на суцільний білий шум. Нехай x₀ - це реальне зображення. Визначається марковський ланцюг, який поступово додає гауссівський шум до зображення протягом T кроків (T близько 1000). Дисперсія шуму на кожному кроці контролюється графіком дисперсії (variance schedule). Ймовірність переходу від кроку t-1 до t визначається як:

. Цей процес фіксований і не потребує навчання. Зворотний процес. Генерація нового зображення вимагає обернення часу, тобто обчислення q(x_t-1│x_t ). Застосування теореми Баєса для цього неможливе через відсутність інформації про повний розподіл даних, тому цей марковський перехід апроксимують за допомогою нейронної мережі:

Зазвичай використовується архітектура типу U-Net, доповнена механізмами уваги (Attention). На вхід U-Net подається зашумлений тензор (зображення на кроці t). Додатково мережі передається текстова підказка. Прохід через мережу: зображення стискається через згорткові шари (енкодер) для виділення високорівневих ознак, а потім розгортається назад (декодер) з використанням skip-connections. На виході U-Net генерує тензор такого ж розміру, як і вхідне зображення. Але це не саме зображення, а карта шуму. Навчання моделі зводиться до максимізації логарифмічної правдоподібності даних. Оскільки точне обчислення неможливе, максимізується варіаційна нижня межа (Variational Lower Bound, ELBO), як у варіаційних автоенкодерах. У [2] показано, що метрику ELBO можна спростити до функції втрат L_simple:

де ϵ- це справжній шум, який додано при прямому процесі, ϵ_θ (x_t,t)- це шум, що виявлено нейромережею.

Це середньоквадратична помилка (MSE), що робить навчання дифузійних моделей стабільним у порівнянні з нестабільною мінімаксною грою GAN.

Висновок

В результаті проведеного дослідження здійснено порівняльний аналіз методів генеративного моделювання зображень, зокрема генеративно-змагальних та дифузійних мереж. Доведено їхню ефективність для формування репрезентативних тестових вибірок, необхідних для верифікації засобів захисту інформації та оцінки стійкості систем біометричної аутентифікації до атак пред'явлення. Перспективи розвитку методів генеративного моделювання зображень пов'язані із оптимізацією обчислювальної складності ітеративних процесів знешумлення, підвищенням точності керованої генерації для моделювання специфічних векторів атак, а також із розробкою комплексних ансамблевих нейромереж для автоматизованого виявлення високоякісних діпфейків у режимі реального часу.

Список використаних джерел

1. Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio/ Generative Adversarial Networks. https://arxiv.org/pdf/1406.2661

2. Jonathan Ho, Ajay Jain, Pieter Abbeel. Denoising Diffusion Probabilistic Models. arXiv:2006.11239. https://arxiv.org/pdf/2006.11239

3. Tero Karras, Samuli Laine, Timo Aila. A Style-Based Generator Architecture for Generative Adversarial Networks. https://arxiv.org/abs/1812.04948. https://arxiv.org/pdf/1812.04948

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Інші наукові праці даної секції
	МЕТОДИ АНАЛІЗУ ФАКТОРІВ ЗОВНІШНЬОГО СЕРЕДОВИЩА ПІДПРИЄМСТВ 25.04.2026 18:56
	ТИПОЛОГІЯ ВПЛИВУ ФАКТОРІВ ЗОВНІШНЬОГО СЕРЕДОВИЩА У ГОСПОДАРСЬКІЙ ДІЯЛЬНОСТІ ПІДПРИЄМСТВ 25.04.2026 18:45
	«УПРАВЛІННЯ ПЕРСОНАЛОМ» ЯК КЛЮЧОВИЙ ЧИННИК ЕФЕКТИВНОГО РОЗВИТКУ ПІДПРИЄМСТВА 24.04.2026 11:41
	ЗАПРОВАДЖЕННЯ МЕТОДІВ УПРАВЛІННЯ ОРГАНІЗАЦІЙНИМ РОЗВИТКОМ В ДІЯЛЬНОСТІ ПІДПРИЄМСТВ 24.04.2026 11:28
	ОСНОВНІ МЕТОДИ УПРАВЛІННЯ ОРГАНІЗАЦІЙНИМ РОЗВИТКОМ ПІДПРИЄМСТВА 24.04.2026 11:00
	МЕХАНІЗМИ ФОРМУВАННЯ КОНКУРЕНТНИХ ПЕРЕВАГ ПІДПРИЄМСТВ В СУЧАСНИХ ЕКОНОМІЧНИХ УМОВАХ 24.04.2026 09:09
	ВПЛИВ ТЕОРІЙ КОНКУРЕНТОСПРОМОЖНОСТІ НА РОЗВИТОК ПІДПРИЄМСТВ 23.04.2026 21:38
	ЗАСТОСУВАННЯ ПРИНЦИПІВ СИСТЕМИ НАССР ДЛЯ ГАРАНТУВАННЯ БЕЗПЕЧНОСТІ ХАРЧОВОЇ ПРОДУКЦІЇ ТА СЕРВІСНИХ ПОСЛУГ ЗАКЛАДІВ РЕСТОРАННОГО БІЗНЕСУ 23.04.2026 15:13
	ОЦІНКА ПОДАТКОВОГО НАВАНТАЖЕННЯ СУБ’ЄКТІВ ГОСПОДАРЮВАННЯ СПРОЩЕНОЇ СИСТЕМИ ОПОДАТКУВАННЯ ТА ШЛЯХИ ЙОГО ОПТИМІЗАЦІЇ 22.04.2026 23:01
	ІНСТИТУЦІЙНІ ТА РЕГУЛЯТОРНІ ПЕРЕШКОДИ ЕКСПОРТУ УКРАЇНСЬКОЇ ПРОДУКЦІЇ ДО США і ЄС 22.04.2026 13:10

© 2010-2026 Всі права застережені	При використанні матеріалів сайту посилання на www.economy-confer.com.ua обов’язкове!
Час: 0.124 сек. / Mysql: 2103 (0.094 сек.)