Aller au contenu principal
Il y a présentement des items dans votre panier d'achat.
Auteur et co-auteurs
Komlan Messan Sessofia
UQO - Université du Québec en Outaouais
Michal Iglewski, Valérie Levasseur
UQO - Université du Québec en Outaouais
5a. Résumé

Le résultat d’un programme d’apprentissage automatique dépend beaucoup de la qualité et de la quantité des exemples qui lui ont été présentés. L’ensemble des exemples pour lesquels le résultat attendu du programme est connu et validé par des humains est appelé un corpus de référence (Gold Standard). Sa construction peut être difficile et coûteuse en temps de travail. Dans le but de faciliter celle-ci, nous avons conçu une plateforme web à code source ouvert nommée annotator, qui est un outil d’annotation sémantique de texte. Cet outil permettra aux experts de divers domaines d’annoter des documents via une interface conviviale et de modifier des annotations produites par d’autres outils. Le fonctionnement d’annotator est basé sur l'outil brat. Ses fonctionnalités incluent la création et la suppression d'annotations, ainsi que la gestion d'annotateurs par projet. Tout projet sur la plateforme est considéré comme un corpus qui possède des propriétés (types d’entité, types de relation entre entités). Le département de pédiatrie d’un hôpital universitaire pourrait alors créer un corpus comportant les notes médicales de ses patients, les annoter avec un outil de type cTAKES et corriger d’éventuelles erreurs avec annotator. À l’avenir, notre application pourrait alors comparer les annotations de différents experts et aider le chef de projet à choisir l’annotation la plus pertinente.