On trouvera ici les différents modèles de flexion utilisés pour la génération des mots fléchis des dictionnaires DELFIN.
Le lien renvoie vers les différentes classes flexionnelles de chaque catégorie.
Les dictionnaires correspondants sont téléchargeables sur la page des ressources.
Les formes fléchies ont été obtenues par application de graphes de flexion Unitex. Chaque lemme du dictionnaire d'entrée est associé à une classe de graphes qui prend en compte l'harmonie vocalique et l'alternance consonantique. L'harmonie vocalique est directement traitée par les graphes par sélection d'une sous_classe de graphes et l'alternance consonantique est traitée au moyen d'un script Perl après flexion des mots. Seule l'information sur le type d'alternance consonantique est encodée dans les graphes.
Les modèles de flexion reprennent les différents classes flexionnelles des noms et des verbes du dictionnaire de finnois Nykysuomen Sanakirja (NS) et du dictionnaire inverse de T.Tuomo, Suomen kielen käänteissanakirja (SKS), en tenant compte des variantes. Ces dictionnaires utilisent 82 classes flexionnelles pour les noms et 45 pour les verbes. Les contraintes propres au traitement automatique ont cependant nécessité l'ajout de classes pour prendre en compte la flexion particulière de certains mots et de certaines catégories de mots. Par ailleurs, les classes flexionnelles du nom ont été projetées et adaptées pour les autres catégories à flexion nominale : adjectifs, pronoms et postpositions. Quelques exemples des modifications des classes flexionnelles :
meri "mer" est de la classe 08 dans NS/SKS mais son partitif (merta) a une voyelle suffixale d'arrière alors que le lemme ne contient que des voyelles d'avant.
L'auxiliaire olla "être" est de la classe 25 dans NS/SKS mais le radical du potentiel et de l'impératif est irrégulier (respectivement liene- et äl(ä)-).
les adjectifs du type minunlaiseni "comme moi" sont de la classe 63 dans NS/SKS mais se distinguent des autres adjectifs par la présence obligatoire d'une désinence personnelle.
Les pronoms ont une flexion très différente selon leur sous-catégorie ; la différence porte sur la distribution du nombre, du cas et de la personne.
Les postpositions nécessitent plusieurs classes flexionnelles afin de prendre en compte une variation en cas réduite (différente selon les postpositions). D'autre part, les désinences de personne sont obligatoires ou facultatives selon les postpositions.
Certains adverbes ont une désinence personnelle obligatoire.
Les verbes impersonnels ont une flexion incomplète pour la personne.
De manière générale, les désinences personnelles des noms (désinences possesssives) ne sont pas incluses dans les dictionnaires DELFIN, sauf lorsque leur présence est obligatoire (postpositions, pronom réfléchi...).
Les particules clitiques sont systématiquement exclues des mots fléchis.
Les mots complexes ayant un ou plusieurs clitiques facultatifs - désinence possessive et/ou particule(s) clitique(s) - sont analysés au moyen du programme Dialex.
Les deux graphes suivants permettent de fléchir le nom katu "rue" (classe N01). Le graphe N01BS s'applique au degré fort du lemme (katu-) tandis que le graphe N01BW s'applique au degré faible (kadu-) :
N01BS : Graphe de flexion des noms de la classe N01 (degré fort) |
N01BW : Graphe de flexion des noms de la classe N01 (degré faible) |
Le graphe suivant permet de fléchir le nom talo "maison" (classe N01). Les mots sans alternance consonantique n'ont qu'un seul lemme et les formes fléchies sont obtenues par application des deux sous-graphes précédents.
N01B : Graphe de flexion des noms de la classe N01 (mot sans alternance consonantique) |
Nykysuomen sanakirja. 1951–61, 14. painos 1996. WSOY
Tuomi,Tuomo (ed.), 1972, Suomen kielen käänteissanakirja, SKS, Hämeenlinna