Aller au contenu principal
Il y a présentement des items dans votre panier d'achat.
Anna Dysert, Université McGill

Les chercheur·euses averti·es le savent bien : ce qui, autrefois, constituait le signe distinctif de la recherche – déambuler dans les rayons d’une bibliothèque pour en parcourir les étagères – est aujourd’hui remplacé ou du moins largement complété par la recherche sur le web. Désormais, la plupart des étudiant·es, chercheur·euses et professionnel·les commencent leurs recherches sur Internet. Parmi les ressources électroniques consultées, Wikipédia, et ses projets apparentés dans l'écosystème Wikimédia, sont devenus des points de départ très prisés, car ils offrent un accès à des sources primaires et à des ensembles de données libres et ouverts. 

Wikimédia offre de formidables outils pour élargir l’accès aux fonds d’archives de McGill à l’ensemble des chercheur·euses. 

Certaines sections de cet article ont été publiées dans une version anglaise antérieure qui se trouve dans : 
Dysert, Anna. “Wikimedia as Outreach and Access at the Osler.” Osler Library Newsletter, no. 129 (Winter 2019): 19.

Fondée en 2001, la plateforme Wikipédia, qui vise à fournir « la somme de toutes les connaissances humaines », se classe aujourd’hui au quatrième rang des sites web les plus visités de la planète1. Accueillies d’abord avec scepticisme par de nombreux membres des communautés de bibliothécaires et d'archivistes, force est de constater que l'essor des projets Wikipédia et de Wikidata a peu à peu imposé une réévaluation de la manière dont les établissements peuvent rendre leurs collections accessibles. Le lancement de Wikidata en 2012 fut même perçu comme « peut-être le développement le plus convaincant pour les institutions du GLAM » (galeries, musées, bibliothèques [libraries] et archives)2.  Ainsi, quantité de projets dans le secteur non seulement de la recherche, mais aussi du patrimoine ou de l'éducation, utilisent Wikidata pour sa capacité à décloisonner l'information, à accroître la visibilité des ressources et à faciliter la recherche au moyen de méthodologies numériques. En 2018, les Bibliothèques de l’Université McGill ont adopté la plateforme Wikidata pour augmenter la découvrabilité de leurs collections historiques, pour multiplier les possibilités de recherche et de réutilisation des données des collections, et pour améliorer les métadonnées grâce à des descriptions de qualité qui mettent en valeur la contribution des créateurs d’archives. Depuis cette date, nous publions une grande partie des éléments descriptifs et administratifs de nos documents d'archives dans nos instruments de recherche, y compris des informations telles que le créateur, la provenance, les dates, l'étendue ou le contenu.

Wikidata est conçue pour prendre en charge les données liées, ce qui donne accès à des informations détaillées sur des sujets spécifiques, tout en encourageant les références croisées entre ensembles de données. Les données liées font référence à un ensemble de méthodes et d'outils techniques permettant de relier des données de manière plus contextuelle et plus précise afin que l'information soit découverte et analysée efficacement par les utilisateurs humains et les ordinateurs. La plateforme Wikidata est construite autour de ces principes. Elle comprend des points de données appelés « déclarations », et chacune de ces déclarations est composée d'une « propriété » (par exemple, « date de naissance ») et d'une « valeur » (par exemple, « 12 avril 1849 »), qui décrit un « élément » particulier (par exemple, « Sir William Osler »).

Entrée Wikidata
Représentation en français du modèle de données de Wikidata avec un groupe de déclarations et des références dépliées par Charlie Kritschmar et Envel Le Hir (10 August 2017), CC0 1.0 [ https://www.wikidata.org/wiki/Wikidata:Introduction/fr].

Grâce à cette structure de données, les éléments se trouvent liés à d'autres éléments, créant ainsi un réseau d'informations très performant tant pour la navigation que pour la consultation. Les données liées permettent de circuler entre les  éléments d'information d'une manière plus fluide, plus riche et plus significative. Les données pour décrire les collections provenant de plusieurs institutions peuvent également être facilement reliées entre elles, contrairement aux catalogues d'archives traditionnels – souvent cloisonnés et limités aux fonds d'une seule institution, et qui sont rarement balayés par les moteurs de recherche. Les métadonnées relatives aux fonds d’archives peuvent, par exemple, être liées à leur entrée dans Wikidata, ce qui permet aux utilisateurs de naviguer facilement entre les différentes ressources qui partagent un thème commun. Cette interconnexion améliore considérablement la découvrabilité des documents consultables, car les chercheur·euses savent rapidement ce qui est disponible sur un sujet donné, que ce soit sous la forme de documents numérisés, de livres rares ou d'autres sources primaires.

À partir de 2018, et pour participer à ce mouvement d’amélioration de la recherche, l’équipe des archivistes de l’Université McGill modifia peu à peu ses instruments de recherche selon un modèle de données développé sur la base des bonnes pratiques générées par la communauté de Wikidata. Au cours de la première étape de ce projet, nous avons réussi à transformer des centaines d'instruments de recherche archivistique sous la forme Wikidata. À la suite de ce projet et des projets spéciaux ultérieurs, ainsi qu'au flux de travail de maintenance de routine désormais en place, nous avons ajouté des métadonnées de nombreux fonds d’archives et avons atteint le chiffre impressionnant de 968 fonds3 C’est là une avancée considérable pour la recherche. Par exemple, le transfert des données des collections dans Wikidata améliore la possibilité de trouver des documents de recherche pertinents en reliant des personnages historiques importants à l'établissement où leurs archives sont conservées grâce à la propriété « archivé par ». Cela permet aussi aux chercheur·euses de découvrir des collections intéressantes par une autre voie : en effectuant une recherche simple sur un personnage historique, qui peut être relié à l'instrument de recherche pertinent via Wikidata. Actuellement, 630 personnages historiques sont liés par Wikidata à des fonds d'archives conservés dans les bibliothèques de l’Université McGill – c’est le cas, par exemple, de l'artiste juif polonais Arthur Szyk, dont la fiche d'identification dans Wikidata indique que les Bibliothèques de l’Université McGill sont le dépositaire des documents d'archives le concernant, tout en offrant un lien vers l'instrument de recherche archivistique4.

Outre les avantages liés à une meilleure visibilité des collections, le format de données structuré de ces informations archivistiques permet d'effectuer des recherches très fines, ce qui était quasiment impossible auparavant. Une personne pourrait, par exemple, interroger Wikidata afin de savoir combien de professionnel·les de la santé né·es aux États-Unis ont fréquenté l'Université McGill dans les années 1930 et combien sont devenus des acteurs importants dans le domaine de la médecine universitaire5. Des requêtes aussi détaillées seraient laborieuses et difficiles avec des méthodes traditionnelles ou des sources encyclopédiques narratives, tandis que Wikidata les rend simples, rapides et efficaces. Sans compter que les données sont liées entre les plateformes, ce qui signifie qu'une simple recherche de « Canada » dans Wikidata, par exemple, conduira cette personne non seulement à des informations de base sur le pays, mais aussi à des données connexes telles que des événements historiques, des personnages ou des institutions liés au Canada.

La nature « lisible par machine » de Wikidata signifie que la plateforme peut également être utilisée par des ordinateurs pour interagir avec l'information et l'organiser de manière originale. Les chercheur·euses ont alors la possibilité d’élaborer des requêtes complexes pour extraire des données spécifiques, tandis que le format ouvert de Wikidata permet une intégration aisée avec d'autres ressources et d’autres plateformes numériques. Par exemple, le laboratoire de données de Carnegie Hall interroge ses propres données sur les concerts, les compositeurs joués et d'autres éléments pour suivre et documenter visuellement ses propres tendances en matière de représentations musicales6.

Cette interconnexion entre les projets Wikimédia (Wikipédia, Wikidata, Wikisource, Wikiversité, etc.) crée un riche réseau de connaissances potentielles. Les données d'un projet sont susceptibles d’alimenter le contenu d'un autre, créant ainsi un écosystème d'information qui dépasse largement la somme de ses parties.

Ainsi, alors que nous continuons de naviguer dans les eaux du numérique, dont les rives ne cessent de reculer, le rôle des bibliothèques et des archives dans la découvrabilité de l'information n'a jamais été aussi crucial. L'intégration des métadonnées de bibliothèque dans Wikidata ouvre de nouvelles perspectives numériques pour les chercheur·euses, qui peuvent désormais accéder à la richesse des archives et améliorer leur capacité à mener des recherches précises, voire réutiliser les données selon les méthodologies de recherche numériques. En tirant parti du pouvoir des données liées et du libre accès, les bibliothèques et archives contribuent à créer un écosystème de recherche mondial qui encourage la découvrabilité, certes, mais aussi la collaboration. 

C’est désormais évident :  le rôle des métadonnées de qualité est aujourd’hui nécessaire non seulement pour faciliter la recherche, mais aussi pour entraîner l'intelligence artificielle (IA) dans le but de mieux garantir la fiabilité, la transparence et le respect des normes éthiques7

Il est fort probable que le paysage de la recherche numérique continuera d'évoluer à mesure que d'autres institutions suivront l’exemple et contribueront aux projets Wikimédia. Pour le bien de la recherche, il est dans l’intérêt des bibliothèques et des archives de s’engager à renforcer leur présence au sein de cet écosystème, en veillant à ce que les ressources restent accessibles et découvrables grâce à leur contribution à l'enrichissement continu des métadonnées.

Références

  1. Matthieu Tarpin. Wikimedia, les bibliothèques, et l'entraînement des IA. Bulletin des Bibliothèques de France, 2025. https://hal.science/hal-04904674v1
  2. Cuneen, Rachel and Mathieu O’Neil. “Students are told not to use Wikipedia for research. But it’s a trustworthy source.” The Conversation. November 4, 2021. Accessed March 6, 2025.
  3. https://theconversation.com/students-are-told-not-to-use-wikipedia-for-…
  4. Proffitt, Merrilee, editor. “Introduction: Why Wikipedia and Libraires?” in Leveraging Wikipedia: Connecting Communities of Knowledge. Chicago: ALA Editions, 2018.
  5. Andrew Lih, "Wikimedia Community?" In Leveraging Wikipedia: Connecting Communities of Knowledge ed. Merrilee Proffit. Chicago: ALA Editions, 2018).
  6. Chen, Chen, and Zhong Yuxuan. "A Comparative Study on the Approaches of Name Authority Control and Wikidata Identity Management." In Knowledge Organization for Resilience in Times of Crisis: Challenges and Opportunities, pp. 63-74. Ergon-Verlag, 2024.
  7. Theo van Theen, “Wikidata: from ‘an’ identifier to ‘the’ identifier.” Information Technology and Libraries. June 2019. 72-81, 73. 

  • Anna Dysert
    Université McGill

    Anna Dysert est bibliothécaire agrégée aux bibliothèques de l'Université McGill, où elle est responsable de la création et de la gestion des métadonnées pour les archives et les collections spéciales. Elle est titulaire d'un MLIS en archivistique de la School of Information Studies de McGill et d'une maîtrise du Centre for Medieval Studies and Book History & Print Culture Program de l'Université de Toronto. Ses recherches actuelles portent sur les questions de découvrabilité et d'accès aux métadonnées d'archives, notamment par le biais de Wikidata. Elle est présidente du conseil d'administration de la Fondation AtoM (Access to Memory).

Vous aimez cet article?

Soutenez l’importance de la recherche en devenant membre de l’Acfas.

Devenir membre Logo de l'Acfas stylisé

Commentaires