Ринок житлової нерухомості належить до складних соціально-економічних систем, у яких формування вартості об’єктів визначається багатьма взаємопов’язаними факторами — фізичними характеристиками житла, локаційними особливостями, інфраструктурою та якісними параметрами [1].
Традиційні економетричні підходи часто обмежені припущеннями лінійності й не здатні повною мірою відобразити нелінійні залежності, характерні для сучасних динамічних ринків [2]. Це зумовлює необхідність використання методів машинного навчання, які дозволяють виявляти приховані закономірності та підвищувати точність аналітичних оцінок [3].
Особливої ваги набуває інтеграція структурованих і неструктурованих даних, зокрема текстових описів оголошень, що містять суттєву інформацію про стан житла та рівень комфорту. Поєднання алгоритмів машинного навчання з методами обробки природної мови створює нові можливості для комплексного аналізу факторів ціноутворення [5].
Метою роботи є виявлення та кількісна оцінка ключових детермінант вартості житлової нерухомості шляхом застосування сучасних алгоритмів машинного навчання та їх порівняння. Особливістю підходу стало роздільне моделювання загальної вартості об’єкта та ціни за квадратний метр для аналізу впливу масштабних і локаційних чинників [1].
Емпіричну основу становить вибірка оголошень вторинного ринку житлової нерухомості Києва, що містить фізичні, технічні, просторові та текстові характеристики об’єктів [6]. Підготовка даних включала інтелектуальну імпутацію пропущених значень, геопросторове збагачення шляхом визначення відстані до центру міста, інженерію ознак із використанням NLP для трансформації текстових описів у формалізовані змінні, нормалізацію показників та обробку аномалій [2,3,5].
Для моделювання застосовано множинну лінійну регресію, Random Forest, XGBoost, LightGBM та нейронні мережі. Якість моделей оцінювалася за показниками R², RMSE, MAE та MAPE. Додатково проведено аналіз важливості ознак для визначення структури факторного впливу [1,3].
Порівняльний аналіз показав, що ансамблеві алгоритми демонструють найвищу точність прогнозування. Модель LightGBM забезпечила найкращі результати як для загальної вартості житла, так і для ціни за квадратний метр, що свідчить про її здатність ефективно враховувати складні нелінійні взаємозв’язки [2,3].
Встановлено, що ключовим фактором загальної вартості житла є загальна площа об’єкта. Значущий вплив також мають відстань до центру міста, вік будинку та належність до житлового комплексу. Для ціни за квадратний метр домінуючими є локаційні характеристики та якісні параметри житла, включно з інфраструктурними перевагами, виявленими за допомогою NLP-аналізу [5].
Результати підтверджують наявність радіальної моделі ціноутворення: зі збільшенням віддаленості від центру спостерігається зниження вартості. Інфраструктурні ознаки та характеристики комфорту уточнюють оцінку, формуючи додаткову цінову премію [4].
Наукова новизна полягає у поєднанні методів машинного навчання та NLP для перетворення неструктурованих текстових описів у кількісні предиктори та у порівняльному аналізі факторних моделей для загальної вартості й питомої ціни житла. Такий підхід дозволив глибше дослідити структуру ціноутворення та виявити специфіку впливу окремих груп факторів [3,5].
Застосування сучасних алгоритмів машинного навчання демонструє високу ефективність у дослідженні ринку житлової нерухомості. Ансамблеві моделі забезпечують точне відтворення ринкових закономірностей і дозволяють кількісно оцінити роль ключових детермінант вартості. Інтеграція NLP-аналізу підвищує інформативність моделей та сприяє більш комплексному розумінню структури ціноутворення [5].
Отримані результати мають практичне значення для автоматизації оцінювання нерухомості, підтримки аналітичних рішень і подальших досліджень у сфері цифрової економіки та прикладної аналітики.
Список літератури:
1. Пашкевич О., Ващищак С., Бойчук А., Стисло Т., Демчина М. Застосування моделей машинного навчання для прогнозування цін на ринку нерухомості [Електронний ресурс] // Вісник Хмельницького національного університету. Серія: Технічні науки. — 2022. — № 5 (313). — С. 265–273. — Режим доступу: https://journals.khnu.km.ua/vestnik/wp-content/uploads/2022/12/vknu-ts-2022-n5313-265-273.pdf. — Дата звернення: 28.01.2026.
2. Hamidi S., Shala A. Comparative analysis of machine learning models in predicting housing prices: a case study of Prishtina’s real estate market [Електронний ресурс] // International Journal of Housing Markets and Analysis. — 2025. — Режим доступу: https://www.emerald.com/ijhma/article-abstract/18/3/694/1241053/Comparative-analysis-of-machine-learning-models-in. — Дата звернення: 28.01.2026.
3. Moreno-Foronda I., Sánchez-Martínez M.-T., Pareja-Eastaway M. Comparative analysis of advanced models for predicting housing prices: a review [Електронний ресурс] // Urban Science. — 2025. — Т. 9, № 2. — Ст. 32. — Режим доступу: https://www.mdpi.com/2413-8851/9/2/32. — Дата звернення: 29.01.2026.
4. Arora R., Bhatia A. Real estate price prediction using machine learning techniques [Електронний ресурс] // Soft Computing. — 2022. — Т. 27. — Режим доступу: https://link.springer.com/article/10.1007/s00500-022-07579-7. — Дата звернення: 29.01.2026.
5. Milouchi Wala. Integrating image and text features for accurate house price estimation [Електронний ресурс]. — 2025. — Режим доступу: https://ru.scribd.com/document/816880147/Integrating-Image-and-Text-Features-for-Accurate-House-Price-Estimation-2. — Дата звернення: 31.01.2026.
6. Zenodo: dataset for real estate [Електронний ресурс]. — Режим доступу: https://zenodo.org/records/18413277. — Дата звернення: 29.01.2026.
_________________________
Науковий керівник: Клебан Юрій Вікторович, старший викладач кафедри інформаційних технологій та аналітики даних
|