ПРОГНОЗУВАННЯ ФІНАНСОВИХ ПОКАЗНИКІВ ЗА ДОПОМОГОЮ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ
01.12.2024 13:51
[1. Information systems and technologies]
Author: Хрунь Христина Богданівна, магістр, Західноукраїнський національний університет, м. Тернопіль
Задача прогнозування фінансових показників за допомогою згорткових нейронних мереж (ЗНМ) вимагає комплексного підходу, який поєднує знання з фінансового аналізу, обробки великих даних [1] і глибокого навчання [2]. Концептуальні основи вирішення цієї задачі включають наступні ключові елементи:
1. Аналіз фінансових часових рядів.
Фінансові показники, зокрема ціни акцій, обсяги торгів, індекси та інші ринкові дані, часто є часовими рядами. Такі дані мають складну структуру з прихованими трендами, сезонними коливаннями і випадковими коливаннями. Основним завданням аналізу часових рядів є виявлення цих патернів і використання їх для прогнозування. Фінансові дані часто характеризуються високим рівнем шуму та нестабільністю, що вимагає особливих підходів до обробки і виділення значущих ознак.
2. Використання згорткових нейронних мереж для виділення ознак.
ЗНМ є потужними інструментами для автоматичного виділення ознак з даних, зокрема для часових рядів. Використання ЗНМ дозволяє моделі автоматично вивчати та виділяти складні локальні патерни в часових рядах, такі як короткотермінові тренди та залежності між послідовними значеннями. Застосування ЗНМ до фінансових даних забезпечує ефективне виділення особливостей, що є ключовими для точного прогнозування.
3. Попередня обробка та очищення даних.
Фінансові часові ряди часто мають аномальні значення, шуми та пропуски, що можуть негативно вплинути на точність моделі. Тому важливим етапом є попередня обробка даних, яка включає:
• очищення даних від аномальних значень і пропусків;
• нормалізацію даних, щоб звести значення до уніфікованого діапазону (наприклад, [0,1] або [−1,1], що покращує стабільність і швидкість навчання;
• згладжування для усунення шумів та виділення основних тенденцій.
4. Архітектура моделі ЗНМ для часових рядів.
Для фінансових прогнозів важливо обрати відповідну архітектуру моделі ЗНМ. Концептуальна архітектура для даної задачі може включати:
• вхідний шар для прийому нормалізованих часових рядів;
• згорткові шари для автоматичного виділення локальних ознак у фінансових рядах;
• шари дискретизації (Pooling layers), які зменшують розмірність даних та забезпечують виділення найбільш значущих ознак, що знижує обчислювальну складність;
• щільно з'єднаний шар (Fully Connected Layer), який об'єднує виділені ознаки і перетворює їх у прогноз;
• вихідний шар із сигмоїдальною або лінійною функцією активації для генерації кінцевого прогнозу.
5. Вибір та налаштування гіперпараметрів моделі.
Для досягнення високої точності моделі необхідно провести налаштування гіперпараметрів ЗНМ, зокрема:
• кількість і розмір згорткових ядер – більші ядра можуть захоплювати більш загальні тренди, тоді як малі ядра краще підходять для локальних патернів;
• кількість шарів – більше шарів дозволяє моделі вивчати складніші структури, але збільшує обчислювальну складність;
• розмір вікна (при використанні ковзного вікна) для сегментації часових рядів.
6. Використання методу ковзного вікна для прогнозування.
Оскільки фінансові показники є послідовностями, важливо забезпечити постійне навчання моделі на останніх даних. Техніка ковзного вікна дозволяє розбити послідовність даних на невеликі відрізки, кожен з яких представляє "вікно" з історичними значеннями, що використовуються для прогнозування наступного значення. Це дозволяє моделі враховувати останні тренди та забезпечує гнучкість при роботі з динамічними даними.
7. Функція втрат та оптимізація.
Для навчання моделі використовується функція втрат, що вимірює різницю між прогнозованими і фактичними значеннями. В задачах прогнозування фінансових показників найчастіше використовується середньоквадратична похибка, яка мінімізується за допомогою методу градієнтного спуску. Це дозволяє моделі з кожною ітерацією наближатися до більш точного прогнозу.
8. Оцінка ефективності моделі.
Для оцінки точності прогнозування використовуються такі показники, як:
• середньоквадратична похибка – для вимірювання середньої відстані між передбаченими і фактичними значеннями;
• коефіцієнт детермінації (R²) – показує, наскільки добре модель відображає зміну даних;
• коефіцієнт кореляції між прогнозованими і фактичними даними, який вказує на відповідність напрямку змін.
Для практичного використання розробленої ЗНМ моделі її результати інтегруються в платформу великих даних [3], яка дозволяє обробляти потоки даних, автоматизувати прогнозування та забезпечувати підтримку для прийняття рішень. Платформа має підтримувати збір і зберігання великих обсягів фінансових даних, а також забезпечувати можливості для аналітики та звітності.
Література
1. Beakta R. Big data and hadoop: a review paper. International Journal of Computer Science and Information Technology. 2015. Vol. 2 (2). Pp. 13–15.
2. LeCun Y., Bengio Y., Hinton G. Deep learning. Nature. 2015. Vol. 521, No. 7553. Pp. 436–444.
3. Lawler J., Joseph A. Big data analytics methodology in the financial industry. Information Systems Education Journal. 2017. Vol. 15 (4). Pp. 38.