ТЕКСТОВА БАЗА ДАНИХ FRANTEXT: СТРУКТУРА, ПАРАМЕТРИ, ПРИНЦИПИ ВИКОРИСТАННЯ

  • І. В. Страшко Національний педагогічний університет імені М. П. Драгоманова
Ключові слова: корпус текстів, французька мова, інформаційні системи, корпусна лінгвістика, прикладна лінгвістика

Анотація

У статті розглядаються стан, детермінативні характеристики та історія розроблення французької текстової бази даних Frantext. Frantext – це унікальне зібрання французьких і франкомовних синхронно-діахронічних текстових корпусів не тільки за репрезентативністю матеріалу, а й за глибиною представлення різних його аспектів. Ця текстуальна база надає широкий спектр мовної інформації, відображаючи використання французької мови в усій своїй різноманітності. Принципи побудови та збагачення її новими текстами ґрунтуються на балансуванні різних епох та жанрів. Frantext дає можливість користуватися наявними попередньо визначеними корпусами, створювати власні користувацькі корпуси і здійснювати широке коло пошукових завдань: за словоформою, лемою, граматичними категоріями, семантикою, сполученням лексичних одиниць тощо. Вибираючи корпус, комбінуючи команди і різні типи пошуку, користувач може диверсифікувати його застосування відповідно до своїх наукових інтересів і пріоритетів. Доступні опції експлуатації корпусних ресурсів дають змогу дублювання і видалення корпусу, редагування його назви та опису, створення власного корпусу за автором, датою, літературним жанром, додавання текстів, пошук метаданих для сортування та фільтрування творів. Серед інших можливостей, запропонованих текстовою базою Frantext, є створення, редагування та перегляд списків слів, які можуть створюватися за допомогою регулярних виразів або CQL і містити окремі слова або їх послідовності. Сьогодні управління текстовою базою здійснюється за допомогою програмного забезпечення Allegro, компоненти якого – індексатор, робоче середовище і сервер – забезпечують ефективну роботу користувачів із корпусами. Обсяг, хронологічні межі, текстове наповнення цієї бази свідчать про те, що вона неухильно розвивається, нарощується її ефективність, зростає поле її застосування, збільшується коло користувачів. Існування такого текстового ресурсу з інструментами для його використання у наукових дослідженнях мови становить інтерес для всіх, хто вивчає і викладає французьку мову як рідну або іноземну.

Посилання

1. Демська-Кульчицька О. Дещо про класифікацію текстових корпусів. Наукові записки. Серія «Мовознавство». 2004. Т. 1. №. 11. С. 153–157.
2. Жуковська В.В. Вступ до корпусної лінгвістики : навчальний посібник. 2013.
3. ATILF. Base textuelle Frantext (En ligne). ATILF-CNRS & Université de Lorraine. 1998–2020. URL: https://www.frantext.fr/ (дата звернення: 17.10.2020).
4. TLFi: Trésor de la langue Française informatisé. URL: http://www.atilf.fr/tlfi, ATILF – CNRS & Université de Lorraine.
5. Montémont V., Manea L.L. Lévolution de Frantext: quelles modifications et quels usages pour Frantext 2? XXVIIe Congrès International de Linguistique et de Philologie Romanes, Nancy, 2013.
6. Bernard P., Dendien J., Lecomte J., Pierrel J.M. Les ressources de lATILF pour lanalyse lexicale et textuelle: TLFi, Frantext et le logiciel Stella. Actes des 8e Journées Internationales dAnalyse Statistique des Données Textuelles JADT. 2002. Р. 137–149.
7. Bernard P., Lecomte J., Dendien J., & Pierrel J.M. Computerized linguistic resources of the research laboratory ATILF for lexical and textual analysis: Frantext, TLFi, and the software Stella. In LREC. 2002, May.
8. Pierrel J.M. Un ensemble de ressources de référence pour létude du français: TLFi, Frantext et le logiciel Stella. Revue québécoise de linguistique. 2006. Vol. 32. №. 1. P. 155–176.
9. Martin, É. Frantext la base de données textuelles du français. Revue Roumaine de linguistique. 1992. Vol. 37. №. 5-6. P. 331–340.
10. Petitjean, É., Benzitoun, C., Husson, B., & Ollinger, S. Allegro: une plateforme «couteau suisse» pour lexploitation des ressources textuelles. 2019.
Опубліковано
2021-04-09
Як цитувати
Страшко, І. В. (2021). ТЕКСТОВА БАЗА ДАНИХ FRANTEXT: СТРУКТУРА, ПАРАМЕТРИ, ПРИНЦИПИ ВИКОРИСТАННЯ. Мова. Література. Фольклор, (2), 126-133. https://doi.org/10.26661/2414-9594-2020-2-18