РОЗРОБКА ПРОТОТИПУ ДОДАТКА ВИЯВЛЕННЯ АНОМАЛІЙ ШЛЯХОМ ВІДСТЕЖЕННЯ ПОДІЙ У РОЗПОДІЛЕНИХ КОМП’ЮТЕРНИХ СИСТЕМАХ НА ПРИКЛАДІ БАНКІВСЬКОЇ СИСТЕМИ СПОВІЩЕНЬ

Ключові слова: розподілені комп’ютерні системи, виявлення аномалій, аналіз першопричин, система відстеження подій, мікросервісна архітектура, Apache Kafka, Spring Cloud Sleuth, Apache Spark

Анотація

У статті представлено розробку прототипу додатка для виявлення й аналізу аномалій у розподілених комп’ютерних системах шляхом відстеження подій, реалізованого на прикладі банківської системи сповіщень. Розроблений прототип складається з двох основних модулів: модуля виявлення аномалій і модуля аналізу першопричин. Модуль виявлення аномалій здатен аналізувати дані, що генеруються системою під спостереженням через розподілену систему відстеження подій, та ідентифікувати аномальну поведінку, особливо таку, що впливає на досвід користувача. Модуль аналізу першопричин призначений для аналізу виявленої аномальної поведінки в контексті залежностей сервісу та встановлення сервісу-першопричини аномальної поведінки з урахуванням ефекту поширення аномалій. У роботі детально описано архітектуру та принципи функціонування обох модулів, їх взаємодію через систему асинхронної комунікації Apache Kafka, а також особливості реалізації алгоритмів виявлення різних типів аномалій. Особлива увага приділяється процесу виявлення помилок, порушень порогових значень та аналізу часу відгуку сервісів. Представлено інноваційний підхід до реконструкції структури залежностей аномалії на основі часових міток та ідентифікаторів трейсів, що дає змогу точно визначати першопричини проблем навіть за відсутності повної інформації про всі спени. Прототип розроблено з використанням сучасних технологій та фреймворків з відкритим кодом, зокрема Spring Cloud Sleuth для відстеження подій, Apache Kafka для асинхронної комунікації та Apache Spark для обробки даних. Архітектура системи спроєктована з урахуванням можливості масштабування та легкого додавання нових алгоритмів виявлення аномалій. Прототип успішно виявляє різні типи аномалій, включно з помилками, порушенням порогових значень і аномальним часом відгуку сервісів, а також точно визначає сервіси-першопричини проблем, що дає змогу значно прискорити процес діагностики й усунення несправностей у складних розподілених системах.

Посилання

1. Robert Heinrich, André van Hoorn, Holger Knoche, Fei Li, Lucy Ellen Lwakatare, Claus Pahl, Stefan Schulte, and Johannes Wettinger. Performance Engineering for Microservices: Research Challenges and Directions. In Proceedings of the 8th ACM/SPEC on International Conference on Performance Engineering Companion (ICPE ‘17 Companion). Association for Computing Machinery, New York, NY, USA, 2017. P. 223–226. https://doi.org/10.1145/3053600.3053653.
2. André de Camargo, Ivan Salvadori, Ronaldo dos Santos Mello, and Frank Siqueira. An architecture to automate performance tests on microservices. In Proceedings of the 18th International Conference on Information Integration and Web-based Applications and Services (iiWAS ‘16). Association for Computing Machinery, New York, NY, USA, 2016. P. 422–429. https://doi.org/10.1145/3011141.3011179.
3. Holger Knoche. Sustaining Runtime Performance while Incrementally Modernizing Transactional Monolithic Software towards Microservices. In Proceedings of the 7th ACM/SPEC on International Conference on Performance Engineering (ICPE ‘16). Association for Computing Machinery, New York, NY, USA, 2016. P. 121–124. https://doi.org/10.1145/2851553.2892039.
4. T. Salah, M.J. Zemerly, C.Y. Yeun, M. Al-Qutayri and Y. Al-Hammadi. Performance comparison between container-based and VM-based services. 20th Conference on Innovations in Clouds, Internet and Networks (ICIN), Paris, France, 2017. P. 185–190. DOI: 10.1109/ICIN.2017.7899408.
5. T. Salah, M. Jamal Zemerly, Chan Yeob Yeun, M. Al-Qutayri and Y. Al-Hammadi. The evolution of distributed systems towards microservices architecture. 11th International Conference for Internet Technology and Secured Transactions (ICITST), Barcelona, Spain, 2016. P. 318–325. DOI: 10.1109/ ICITST.2016.7856721.
6. T. Ueda, T. Nakaike and M. Ohara. Workload characterization for microservices. IEEE International Symposium on Workload Characterization (IISWC), Providence, RI, USA, 2016. P. 1–10. DOI: 10.1109/ IISWC.2016.7581269.
7. T. Pitakrat, D. Okanovic, A. Van Hoorn and L. Grunske. An Architecture-Aware Approach to Hierarchical Online Failure Prediction. 12th International ACM SIGSOFT Conference on Quality of Software Architectures (QoSA), Venice, Italy, 2016. P. 60–69. DOI: 10.1109/QoSA.2016.16.
8. T.M. Ahmed, C.-P. Bezemer, T.-H. Chen, A.E. Hassan and W. Shang. Studying the Effectiveness of Application Performance Management (APM) Tools for Detecting Performance Regressions for Web Applications: An Experience Report. IEEE/ACM 13th Working Conference on Mining Software Repositories (MSR), Austin, TX, USA, 2016. P. 1–12.
9. M. Mdini, A. Blanc, G. Simon, J. Barotin and J. Lecoeuvre. Monitoring the network monitoring system: Anomaly Detection using pattern recognition. IFIP/IEEE Symposium on Integrated Network and Service Management (IM), Lisbon, Portugal, 2017. P. 983–986. DOI: 10.23919/INM.2017.7987418.
10. M. Zasadzinski, V. Muntés-Mulero and M.S. Simo. Actor Based Root Cause Analysis in a Distributed Environment. IEEE/ACM 3rd International Workshop on Software Engineering for Smart Cyber-Physical Systems (SEsCPS), Buenos Aires, Argentina, 2017. P. 14–17. DOI: 10.1109/SEsCPS.2017.3.
Опубліковано
2025-04-30
Як цитувати
Вакалюк, Т. А., Талавер, О. В., Марцева, Л. А., Мінтій, І. С., & Жиляєв, Є. В. (2025). РОЗРОБКА ПРОТОТИПУ ДОДАТКА ВИЯВЛЕННЯ АНОМАЛІЙ ШЛЯХОМ ВІДСТЕЖЕННЯ ПОДІЙ У РОЗПОДІЛЕНИХ КОМП’ЮТЕРНИХ СИСТЕМАХ НА ПРИКЛАДІ БАНКІВСЬКОЇ СИСТЕМИ СПОВІЩЕНЬ. Computer Science and Applied Mathematics, (1), 68-79. https://doi.org/10.26661/2786-6254-2025-1-09
Розділ
РОЗДІЛ II. ІНЖЕНЕРІЯ ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ