АНАЛІЗ ТА КЛАСИФІКАЦІЯ ПАТЕРНІВ ШАХРАЙСТВА ІЗ КРЕДИТНИМИ КАРТКАМИ З ВИКОРИСТАННЯМ МАШИННОГО НАВЧАННЯ
Анотація
Актуальність дослідження зумовлена стрімким зростанням кіберзлочинів у фінансовому секторі, зокрема шахрайств із кредитними картками, що завдають значних фінансових втрат і підривають довіру клієнтів до банківських систем. Метою роботи є аналіз і класифікація патернів шахрайських транзакцій з використанням машинного навчання для підвищення ефективності їх виявлення та профілювання. Дослідження виконане на публічному датасеті Credit Card Fraud Detection, що містить 284 807 транзакцій із 30 ознаками (28 анонімізованих PCA-ознак, Time, Amount та Class), з дисбалансом класів (492 шахрайські операції). Висунуто гіпотези щодо переваги оптимізованого XGBoost, ефективності кластеризації K-Means та підвищення точності завдяки циклічному кодуванню часу та порівнянню методів балансування. Для досягнення мети застосовано комплексний підхід: попередню обробку даних (масштабування StandardScaler для Amount, Sine-Cosine encoding для Time), балансування класів (SMOTE, ADASYN, RandomUnderSampler), класифікацію з використанням Logistic Regression, Random Forest, XGBoost і ансамблевої моделі Stacking (з метакласифікатором Logistic Regression), реалізованих у Python з бібліотеками scikit-learn, XGBoost, imbalancedlearn та shap. Оцінювання моделей проводилося за метриками F1-score, ROC-AUC, PR-AUC, MCC, G-mean із крос-валідацією (StratifiedKFold). Кластеризація K-Means виконана на ознаках V14, V17, Amount, Time_sin, Time_cos, а SHAP-аналіз – для оцінювання внеску ознак. Результати експериментів виявили, що найвищий F1-score (0,99950) та високу стійкість продемонструвала модель Random Forest із балансуванням SMOTE, тоді як ансамбль Stacking досяг найкращого значення ROC-AUC (0,979). Модель XGBoost показала хороші результати (F1 = 0,99869), однак гіпотеза про її безумовну перевагу потребує корекції. Отже, ефективність моделей значно залежить від поєднання алгоритму та методу балансування даних. SHAP-аналіз виявив домінування V14, V4, V12; темпоральний аналіз показав піки активності о 2:00 (12%) та 11:00 (11%); кластеризація виділила 5 груп з різними профілями (від низьких сум з аномальними V14 до високих денних операцій). Наукова новизна полягає в інтеграції циклічного кодування темпоральних ознак з ансамблевими методами й оцінкою ефективності балансування, що підвищило точність на 5–10% порівняно зі стандартними підходами, а також у сегментації патернів шахрайства для реального часу моніторингу. Модель може бути запроваджена в системи фінансових установ для зменшення втрат від шахрайства, з низькою кількістю хибних спрацювань (FN = 13 для XGBoost).
Посилання
2. Кількість випадків шахрайства з картками знизилася, збитки за ними – зросли. Національний банк України. URL: https://bank.gov.ua/ua/news/all/kilkist-vipadkiv-shahraystva-z-kartkami-znizilasyazbitki-za-nimi--zrosli (дата звернення: 21.08.2025).
3. Tyshchenko S., Parkhomenko O. Analysis of the Impact of Digital Threats on Financial Markets Using Methods of Probability Theory and Python. Modern Economics. 2024. Vol. 43. № 1. P. 118–124. DOI: 10.31521/modecon.v43(2024)-16
4. Tyshchenko S., Parkhomenko O., Hilko I. Modeling the Impact Of Digital Threats on Financial Markets Using Time Series Analysis and Anomaly Detection Using Python. Modern Economics. 2024. Vol. 44. P. 205–212. DOI: 10.31521/modecon.v44(2024)-30
5. Tyshchenko S., Parkhomenko O., Darmosyuk V. Modelling and Analysis of Cyberattack Risks on Financial Institutions Using Mathematical Statistics and Python Methods. Modern Economics. 2024. Vol. 48. P. 130–136. DOI: 10.31521/modecon.V48(2024)-16
6. Dwarampudi A., Yogi M. K. A Robust Machine Learning Model for Cyber Incident Classification and Prioritization. Journal of Trends in Computer Science and Smart Technology. 2024. Vol. 6. № 1. P. 51–66. DOI: 10.36548/jtcsst.2024.1.004
7. Machine Learning-Based Anomaly Detection for Enhancing Cybersecurity in Financial Institutions / R. Madunuri et al. 2024 Asian Conference on Intelligent Technologies (ACOIT), KOLAR, India, 6–7 September 2024. 2024. P. 1–8. DOI: 10.1109/acoit62457.2024.10941117
8. Applying Machine Learning Techniques to Detect Credit Card Fraud / P. G. Anjum et al. International Journal of Innovative Research in Computer and Communication Engineering. 2023. Vol. 11. № 06. P. 8879–8883. DOI: 10.15680/ijircce.2023.1106074
9. Bawany Z., Shanbhag A. D. Using Machine Learning To Detect Credit Card Fraud. 2023 International Conference on Electrical, Computer and Energy Technologies (ICECET), Cape Town, South Africa, 16–17 November 2023. 2023. DOI: 10.1109/icecet58911.2023.10389421
10. Credit Card Fraud Detection. URL: https://www.kaggle.com/datasets/mlg-ulb/creditcardfraud (дата звернення: 20.08.2025).

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
ISSN 



