SHS Web of Conferences (Jul 2012)
Relations syntaxiques entre lexiques terminologique et transdisciplinaire : analyse en texte intégral
Abstract
L’extraction automatique de termes à partir de textes intégraux et l’évaluation des résultats de l’extraction sont régulièrement étudiées depuis les années 90 : la présence des termes dans les textes est une question sous-jacente à l’extraction de termes et au repérage des variantes des termes (variations formelles, variations de type homonymique, variations sémantiques). La prise en compte des variantes permet de réduire le silence mais génère du bruit, ce qui alourdit la procédure de validation des candidats-termes. Le travail que nous présentons fait l’hypothèse que des lexèmes transdisciplinaires scientifiques peuvent se trouver à proximité des termes du domaine et que, de ce fait, ils peuvent servir de marqueurs ou d’introducteurs aux termes. Dans cette perspective, nous menons une expérience sur l’existence possible de relations syntaxiques entre les lexèmes transdisciplinaires et les candidats-termes proches avec pour objectif de permettre une première évaluation originale de la qualité des sorties des extracteurs avant d'entreprendre une annotation manuelle plus précise. Nous nous focalisons sur un type particulier de lexèmes transdisciplinaires introducteurs de termes : ceux qui fonctionnent comme des prédicats et qui prennent des termes pour dépendants syntaxiques. Ces lexèmes transdisciplinaires constituent un critère de différenciation des emplois terminologiques et des emplois en langue courante des termes.