Increase the DIgital VITALity and visibility of languages of France: linguistic descriptions and annotated corpora

Titre du projet : DIVITAL

Site Web

Coordinateur scientifique : Delphine Bernhard (LiLPa, Université de Strasbourg)

Responsable scientifique FoReLLIS : Marianne Vergez-Couret

Membres FoReLLIS directement impliqués : Jean-Christophe Dourdet, Estèle Dupuy, Pierre-Don Giancarli, Marie-Hélène Lay, Michaël Nauge, Raluca Nita, Jérémy Pasquereau

Partenaires :
– LiLPa, Université de Strasbourg (coordination : Delphine Bernhard)
– LISA, Université de Corse Pascal Paoli
– CLLE, Université de Toulouse Jean Jaurès

Type de projet : ANR
Période : 01/01/2022-31/12/2025
Budget : 111,936 € (budget total : 412,903 €)

Description

Ce projet a pour but d’accroître la vitalité et la visibilité de plusieurs langues de France : l’alsacien, le corse, l’occitan et le poitevin-saintongeais. Il se situe à la croisée de la linguistique descriptive et de la linguistique de corpus. La constitution de ressources, en particulier des corpus bruts et annotés, vise plusieurs objectifs :

  • Constituer des corpus monolingues dans des genres qui s’approchent ou transcrivent la langue orale, par exemple des pièces de théâtre ou des ethnotextes narratifs et des corpus parallèles (à partir de traductions) ;
  • Constituer des corpus annotés dans le cadre d’« Universal Dependencies » ;
  • Produire des descriptions complètes et actualisées et des formalisations linguistiques basées sur corpus ;
  • Sensibiliser la communauté du TAL (Traitement Automatique des Langues) aux problématiques des langues non standardisées et à la nécessite de la prise en compte de la variation dans les systèmes de TAL ;
  • Partager et transférer les expériences et outils entre langues du projet et explorer les méthodes de transfert technologique.

FoReLLIS est particulièrement impliqué dans la description linguistique et la constitution de corpus annotés pour le poitevin-saintongeais, mais aussi pour les autres langues romanes du projet : le corse et l’occitan. Le projet prévoit 18 mois d’ingénieur de recherche, 12 mois de stage et 350 heures de vacation.

  • La vie du labo continue sur les réseaux sociaux !