МЕТОД НЕЙРОМЕРЕЖЕВОГО ВИЯВЛЕННЯ ПРИЙОМІВ ПРОПАГАНДИ ЗА МАРКЕРАМИ З ВІЗУАЛЬНОЮ ІНТЕРПРЕТАЦІЄЮ ПРИЙНЯТИХ РІШЕНЬ
Анотація
У статті запропоновано метод нейромережевого виявлення прийомів пропаганди за маркерами з візуальною інтерпретацією прийнятих рішень, який відрізняється від існуючих тим, що враховує при навчанні нейромережевих класифікаторів додаткову множину маркерів та дозволяє здійснювати візуальну інтерпретацію отриманих результатів. Під додатковою множиною маркерів мається на увазі використання різноманітних текстових ознак, які притаманні визначеним прийомам пропаганди. Кроками методу є попередня обробка усіх навчальних і тестових текстових даних, навчання нейромережевих моделей для ідентифікації кожного маркера пропаганди, навчання нейромережевих моделей для кожного прийому пропаганди, створення моделі для поясненності та інтерпретації отриманих прогнозів для кожної моделі виявлення прийомів пропаганди, нейромережева оцінка сили прояву прийомів пропаганди у тестовому тексті та інтерпретація значень моделлю LIME. Для дослідження ефективності методу нейромережевого виявлення прийомів пропаганди було створено програмну реалізацію у вигляді набору ноутбуків, реалізованих у хмарному сервісі «Google Colab», що призначені для навчання нейромережевих моделей BERT із подальшим збереженням їх для використання у вебзастосунку для виявлення прийомів пропаганди, а також набору ноутбуків для збереження нейромережевих моделей для виявлення сили прояву маркерів пропаганди. Створений вебзастосунок не лише дозволяє визначити інтенсивність проявів прийомів пропаганди, а і дає можливість здійснювати візуальну аналітику отриманих результатів. Для навчання нейромережевих моделей виявлення прийомів пропаганди використано набір даних, що налічує 550 статей і представляє собою корпус новинних статей, анотованих вручну на рівні фрагментів за допомогою вісімнадцяти пропагандистських прийомів. Дослідження ефективності встановило, що розроблений метод дозволяє шляхом використання набору з 17 навчених BERT-моделей виявляти 17 відповідних прийомів пропаганди з точністю не нижче 81.87%.
Посилання
2. Faye G., Icard B., Casanova M., Chanson J., Maine F., Bancilhon F., Gadek G., Gravier G., Egre P. Exposing propaganda: an analysis of stylistic cues comparing human annotations and machine classification. Proceedings of the Third Workshop on Understanding Implicit and Underspecified Language, 2024. pp. 62–72. DOI: https://doi.org/10.48550/arXiv.2402.03780.
3. Vijayaraghavan P., Vosoughi, S. TWEETSPIN: Fine-grained Propaganda Detection in Social Media Using Multi-View Representations. Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies. 2022, pp. 3433–3448.
4. Martino G., Yu S., Barron-Cedeno A., Petrov R., Nakov, P. Fine-Grained Analysis of Propaganda in News Article. Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing and the 9th International Joint Conference on Natural Language Processing (EMNLP-IJCNLP), 2019. pp. 5640–5650. DOI: https://doi.org/10.18653/v1/D19-1565.
5. Martino G. D. S., Barron-Cedeno A., Wachsmuth H., Petrov R., Nakov P. SemEval-2020 Task 11: Detection of Propaganda Techniques in News Articles. Proceedings of the Fourteenth Workshop on Semantic Evaluation. 2020, pp. 1377–1414.
6. Молчанова М. Метод виявлення та класифікації прийомів пропаганди у текстовому контенті засобами штучного інтелекту. Матеріали XII Міжнародної науково-практичної конференції «Інформаційні управляючі системи та технології IУСT-OДЕСA-2024». 2024. С. 251–254.
7. Krak I., Zalutska O., Molchanova M., Mazurets O., Bahrii R., Sobko O., Barmak O. Abusive Speech Detection Method for Ukrainian Language Used Recurrent Neural Network. CEUR Workshop Proceedings. 2024, Vol. 3688, pp. 16–28.
8. Hugging Face, The AI community building the future, 2024. URL: https://huggingface.co/ (дата звернення: 06.11.2024).
9. Kaggle Competition – Disinformation Detection Challenge, 2023. URL: https://aihouse.org.ua/en/event/disinformation-detection-challenge/ (дата звернення: 06.11.2024).
10. Propaganda Analysis Project, 2023. URL: https://propaganda.math.unipd.it/index.html (дата звернення: 06.11.2024).
11. Zenodo. Propaganda. Proppy Corpus 1.0, 2019. URL: https://zenodo.org/records/3271522#.XS6qRUUzau4 (дата звернення: 06.11.2024).
12. Молчанова М. О. Застосування аугментації даних для підвищення точності виявлення пропаганди в інтернет-джерелах нейромережевими моделями глибокого навчання. Матеріали VIII Міжнародної науково-практичної конференції «Перспективи сучасної науки: теорія і практика». 2024, С. 199–205.