Description générale
Le Plan National pour la Science Ouverte prévoit de rendre accessibles les données de la recherche et leurs outils d’exploitation en rendant la recherche reproductible (notion de données/outils FAIR = Faciles à trouver, Accessibles, Interopérables et Réutilisables). Le travail sur les données dans le cadre de l’Équipe A s’inscrit dans cette démarche : mise à disposition des données et des outils, accessibilité des différents niveaux de constitution, d’enrichissement et d’exploitation afin de ré-exécuter les méthodes et de questionner les résultats.
Les travaux menés dans le cadre de cette thématique s’inscrivent dans une dynamique locale (MSHS, Service Central de Documentation de l’Université de Poitiers, Campus SHES) et nationale (Consortiums d’Huma-Num : CORLI, CAHIER, ADE).
Dans la continuité du précédent projet fédérateur (2017-2020), « Constitution de corpus et outils : notation/annotation ; variation/norme », qui mettait au centre de la réflexion le passage des données primaires aux données de la recherche concernant notamment des corpus peu dotés et la relation à la norme et à la variation, il s’agit, sur la période 2021-2025, de nous interroger sur la dynamique des corpus, de leur constitution à leur exploitation, en passant par leur enrichissement, et d’appréhender ainsi les corpus dans leur évolution, y compris en ce qui concerne les outils intervenant à chaque niveau d’exploitation.
Objectifs
- FAIRiser les corpus de l’Équipe A : Faire reconnaitre, rayonner les corpus et leurs outils d’exploitation en suivant les directions initiées par la Science Ouverte ;
- Valoriser la dimension collaborative et dynamique du travail sur corpus de l’équipe ;
- Faire évoluer les méthodes de travail vers plus de reproductibilité ;
- Expérimenter de nouvelles formes de publication (executable papers) en lien avec les Cahiers FoReLLIS.
Formations
- Atelier OCR / HTR [ 26-27 avril 2023] :
- Formateurs : Morgane Pica [ens-lyon] et Mathieu Goux [unicaen]
- Resp.: Estèle Dupuy.
- Soutenu par FoReLLIS, Projet CollEx Archivos 3.0 et Consortium CAHIER
- Atelier Transkribus [ 6-7 mai 2022] :
- Formateurs : Morgane Pica [ens-lyon] et Mathieu Goux [unicaen]
- Accéder aux supports de la formation
- Resp.: Estèle Dupuy.
- Soutenu par FoReLLIS, Projet CollEx Archivos 3.0 et Consortium CAHIER
Séminaires
- Séminaire autour des Corpus multilingues [19 janvier 2023]
- Intervenants :
- Dejan Stosic, Université Toulouse 2, Laboratoire Cognition, Langues, Langage, Ergonomie (CLLE)
- Raluca Nita, Marianne Verguez, Michael Nauge, Université de Poitiers, FoReLLIS
- Dejan Stosic, Université Toulouse 2, Laboratoire Cognition, Langues, Langage, Ergonomie (CLLE)
- Programmes :
- Intervenants :
Capsules vidéos
- Executable Paper : l’article outillé
- Résumé : Vous avez envie de lire ou d’écrire des articles scientifiques, éthiques, fiables, intelligibles et réutilisables ? Vous rêvez que soit accessible et combiné habilement : textes, données primaires et enrichies, codes et visualisations dynamiques ? Cette présentation est l’occasion de découvrir une forme éditoriale innovante pour la science ouverte et reproductible.
- Conférencier : Michael Nauge [UP]
- Accéder à la vidéo
- Accéder aux supports
- Contenu mis à jour et présenté en distanciel pour la session #SNU2022 Outiller la publication dans le cadre de la Semaine Numérique des Urfist organisée intégralement en ligne du 13 au 16 juin 2022 par le réseau des Urfist.