Logiciels de reconnaissance d’entités nommées

Des logiciels rendent possible l’extraction d’informations présentes dans un texte numérique. Les éléments extraits peuvent être catégorisés sur la base de leur présence dans des dictionnaires. Des listes de personnes, d’organismes, de concepts scientifiques, d’e-mails, peuvent être ainsi obtenues. Quelques applications du domaine, parties intégrantes de l’ingénierie linguistique et du TAL (Traitement automatique de la langue), sont évoquées ici.

1. Unitex/GramLab

Unitex est un ensemble de logiciels permettant de traiter des textes en langues naturelles en utilisant des ressources linguistiques. Ces ressources se présentent sous la forme de dictionnaires électroniques, de grammaires et de tables de lexique-grammaire. Elles sont issues de travaux initiés sur le français par Maurice Gross au Laboratoire d’Automatique Documentaire et Linguistique (LADL) . Ces travaux ont été étendus à d’autres langues au travers du réseau de laboratoires RELEX. Lien

2. GATE.ac.uk

Plusieurs outils open source rassemblés sous le nom de GATE sont développés par un groupe spécialisé en TAL de l’Université de Sheffield.

3. Watson, IBM

Natural Language Understanding, avec l’intelligence artificielle d’IBM. Cette interface de démo propose l’analyse automatique de textes. Après copie ou renseignement d’une URL, l’interface propose des listes de mot-clés, d’entités nommées, de catégories, de concepts :

https://natural-language-understanding-demo.ng.bluemix.net/

1 Star2 Stars3 Stars4 Stars5 Stars (Pas encore noté)
Loading...

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *