« Deconstructing Harry » : une évaluation des systèmes de repérage d'entités nommées

2001; Volume: -; Issue: 07 Linguagem: Francês

10.3845/ree.2001.078

ISSN

2270-7042

Autores

Thierry Poibeau,

Tópico(s)

Semantic Web and Ontologies

Resumo

○ On appelle traditionnellement entites nommees (de l'anglais named entity) l'ensemble des noms de personnes, d'entreprises et de lieux presents dans un texte donne. On associe souvent a ces elements d'autres syntagmes reperables par des grammaires locales comme les dates, les unites monetaires, les pourcentages, etc. ○ Cet article presente un etat de l'art des systemes permettant le reperage des entites nommees. Nous proposons un protocole pour « deconstruire » un systeme et en evaluer les differentes composantes. Nous examinerons les performances d'un tel systeme muni de capacites d'apprentissage mais disposant de connaissances initiales reduites. Nous menons ces experiences dans des conditions operationnelles: les corpus vises sont de natures diverses, de taille souvent modeste et ils ne sont pas etiquetes au prealable. ○ Enfin, nous proposons des indicateurs permettant d'estimer a priori le gain que peuvent apporter des capacites d'apprentissage et de revision liees a un systeme a base de regles.

Referência(s)