Applications
-
Unitex
Unitex, développé par l'université de Marne-la-Vallée, est un logiciel d'analyse de corpus linguistiques qui intègre des dictionnaires électroniques et différents composants nécessaires à l'analyse morphologique et syntaxique des textes. La version actuelle d'Unitex incorpore une version de démonstration des ressources pour le finnois composée d'un texte (Ihmisoikeuksien yleismaailmallinen julistus "Déclaration universelle des droits de l'homme"), d'un alphabet, d'un graphe de normalisation (traitement des mots amalgamés) et d'un dictionnaire dont les entrées sont limitées aux mots du texte.
Ressources pour Unitex
-
XML et Javascript
Le programme Dialex a été appliqué sur la liste des mots du texte de la déclaration universelle des droits de l'homme (Ihmisoikeuksien yleismaailmallinen julistus).
Dans ce texte, chaque mot est associé à une bulle javascript qui donne 1) le lemme du mot, 2) sa catégorie et 3) la liste des morphèmes flexionnels. Le texte d'origine est au format XML et une feuille de transformation XLS convertie le document XML en une page XHTML. Les balises de mot du document XML qui contiennent les informations du dictionnaire sous forme d'attributs ont été converties par la feuille de transformation en des liens Javascript. Les étapes du traitement ont été les suivantes :
- Extraction des mots du texte
- Application de Dialex avec les dictionnaires Delphin sur la liste de mots
- Application du dictionnaire sur le document XML pour obtenir un document XML annoté
- Conversion du document XML en une page XHTML avec info-bulles Javascript
CRISCO - Université de Caen Normandie