Анотація
У роботі здійснено кластеризацію країн світу за соціально-економічними та інституційними показниками, що формують рівень суб’єктивного благополуччя населення. Дослідження базується на панельних даних за 2013–2024 рр., які охоплюють 169 країн. Для виділення однорідних груп використано метод K-means. За результатами аналізу сформовано три типологічні групи: країни з високим інституційним розвитком та рівнем благополуччя, країни перехідного типу та структурно вразливі держави. У межах сформованих кластерів проведено економетричний аналіз та застосовано алгоритми машинного навчання (Random Forest, XGBoost) для оцінки стабільності та нелінійності взаємозв’язків. Результати підтверджують структурну неоднорідність детермінант благополуччя та перевагу ансамблевих моделей у прогнозуванні.
Ключові слова: суб’єктивне благополуччя, індекс щастя, кластеризація, K-means, Random Forest, XGBoost, економіко-математичне моделювання.
Постановка проблеми
В умовах глобальної соціально-економічної диференціації зростає потреба у комплексному аналізі чинників, що формують рівень благополуччя населення. Суб’єктивне благополуччя має багатовимірну природу, поєднуючи економічні, соціальні та інституційні складові. Використання уніфікованих підходів до аналізу без урахування структурної неоднорідності країн може призводити до спрощених висновків та втрати аналітичної точності.
Тому актуальним є застосування методів багатовимірної класифікації для виділення типологічно однорідних груп держав та подальшого аналізу специфіки впливу детермінант у межах кожної з них.[1]
Мета дослідження
Метою роботи є кластеризація країн світу за соціально-економічними та інституційними показниками та порівняльний аналіз впливу детермінант суб’єктивного благополуччя з використанням економетричних і ансамблевих моделей.
Виклад основного матеріалу
Емпіричною базою дослідження є панельний набір даних за 2013–2024 рр., що включає 1784 спостереження. [2] Після очищення від пропусків сформовано фінальну вибірку з 1747 спостережень для 169 країн. Для усунення впливу екстремальних значень застосовано вінзоризацію на рівнях 1% та 99% квантилів.[3]
З метою проведення кластерного аналізу використано усереднені по країнах значення таких показників: логарифм ВВП на душу населення, соціальна підтримка, свобода прийняття рішень, щедрість, сприйняття корупції, індекс демократії та індекс щастя (Ladder score). Усі змінні стандартизовано за Z-перетворенням.[4] Оптимальна кількість кластерів визначена за методом «ліктя» та коефіцієнтом силуету, що дозволило виділити три групи країн.[5]
Загалом завдяки кластеризації, було отримано таку типологію країн:
1. Країни з високим інституційним розвитком (42 держави)
Середній рівень щастя — 6,53.
2. Країни перехідного типу (72 держави)
Середній рівень щастя — 5,45.
3. Структурно вразливі країни (55 держав)
Середній рівень щастя — 4,51.
У межах кожного кластеру побудовано множинні регресійні моделі. Соціальна підтримка є статистично значущим фактором у всіх групах країн. Для держав із високим рівнем розвитку істотний вплив мають також свобода вибору та індекс демократії (R² = 0,446). У країнах перехідного типу значущими є економічний розвиток та соціальна підтримка (R² = 0,233). У структурно вразливих країнах вплив економічного фактора є статистично незначущим (R² = 0,248), що свідчить про домінування соціальних та інституційних чинників.
З метою врахування можливих нелінійних залежностей застосовано Random Forest та XGBoost із поділом даних на тренувальні та тестові вибірки.[6,7]
Порівняльний аналіз метрик показує, що обидві ансамблеві моделі демонструють високу якість апроксимації на тренувальних вибірках (R² > 0,96). На тестових даних XGBoost забезпечує дещо вищу точність прогнозування для країн з високим та перехідним рівнем розвитку, тоді як Random Forest демонструє більш стабільні результати для структурно вразливих економік. Отримані результати підтверджують ефективність нелінійних методів машинного навчання у моделюванні детермінант суб’єктивного благополуччя.
Для країн з високим інституційним розвитком найбільший внесок у формування рівня щастя має індекс демократії, що свідчить про домінування інституційної якості над суто економічними показниками.
У країнах перехідного типу структура впливів є більш збалансованою: поряд з економічними змінними вагомим чинником виступає соціальна підтримка та залишковий компонент Dystopia residual.
Для структурно вразливих країн визначальним фактором залишається рівень ВВП на душу населення, що підтверджує первинність базових економічних умов у формуванні суб’єктивного добробуту.
Отримані результати демонструють, що вплив соціально-економічних та інституційних чинників є кластерно-специфічним, що обґрунтовує необхідність типологічного підходу до моделювання глобального благополуччя.
Висновки
Проведене дослідження підтвердило структурну неоднорідність детермінант суб’єктивного благополуччя. Кластеризація дозволила виокремити три типологічні моделі розвитку країн світу. Встановлено, що соціальна підтримка є універсальним чинником у всіх групах, тоді як значущість економічних та інституційних показників варіюється залежно від рівня розвитку.
Отримані результати можуть бути використані при формуванні диференційованої соціально-економічної політики з урахуванням структурних особливостей країн.
Список літератури:
1. Everitt B. S., Landau S., Leese M., Stahl D. Cluster Analysis. 5th ed. Chichester : John Wiley & Sons, 2011. 330 p.
2. Helliwell J. F., Layard R., Sachs J. D., De Neve J.-E., Aknin L. B., Wang S. (eds.). World Happiness Report 2024. New York : Sustainable Development Solutions Network, 2024. 292 p.
3. Rousseeuw P. J., Hubert M., Van den Bossche W. Detecting deviating data cells // Journal of the American Statistical Association. 2018. Vol. 113, No. 522. P. 1270–1280.
4. Hair J. F., Black W. C., Babin B. J., Anderson R. E. Multivariate Data Analysis. 7th ed. Harlow : Pearson Education, 2014. 739 p.
5. Rousseeuw P. J. Silhouettes: A graphical aid to the interpretation and validation of cluster analysis // Journal of Computational and Applied Mathematics. 1987. Vol. 20. P. 53–65.
6. Breiman L. Random Forests // Machine Learning. 2001. Vol. 45, No. 1. P. 5–32.
7. Chen T., Guestrin C. XGBoost: A scalable tree boosting system // Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York : ACM, 2016. P. 785–794.
_____________________________
Науковий керівник: Клебан Юрій Вікторович, старший викладач Навчально-наукового інституту інформаційних технологій та бізнесу
|