WikiArchives/Crotos-et-Palladia

Nous remercions notre intervenant Benoît Deshayes d’avoir accepté notre invitation à nous présenter Palladia, moteur de recher­che et d’explo­ra­tion d’une partie des col­lec­tions du Musée Saint-Raymond, qui s’appuie sur Wikidata et Wikimedia Commons. Au tra­vers de ce cas de réu­ti­li­sa­tion, nous remon­te­rons sur les pro­jets Wikimedia, les res­sour­ces dis­po­ni­bles et les struc­tu­ra­tions docu­men­tai­res. Nous tâche­rons d’abor­der l’apport essen­tiel que les ins­ti­tu­tions patri­mo­nia­les peu­vent appor­ter à ce bien commun.

Intervenant·e·s

edit
 
Capture lors de la présentation

Benoît Deshayes @shona_gon

Benoît Deshayes à l’état civil, né en 1977, est Shonagon sur les pro­jets Wikimédia. Il contri­bue, sur­tout depuis 2012, sur les conte­nus cultu­rels essen­tiel­le­ment, au sein des pro­jets Wikidata et Wikimedia Commons. De 2002 à 2015, il a tra­vaillé à la Réunion des musées natio­naux, notam­ment en charge de sites web et de cata­lo­gues de col­lec­tions en ligne. En 2015-2016, il a passé un peu plus d’une année à la Bibliothèque natio­nale de France. Depuis 2016, il tra­vaille au musée du Louvre, en charge de la main­te­nance des sites louvre.fr et copilote le futur site des col­lec­tions du musée. Depuis 2015, il donne un cours Wikidata et SparQL à l’École de biblio­thé­cai­res docu­men­ta­lis­tes (EBD). Il fait régu­liè­re­ment des pré­sen­ta­tions publi­ques sur le sujet des GLAM et des pro­jets Wikimedia (Wikidata en par­ti­cu­lier). Les quel­ques billets de son blog Dozo por­tent essen­tiel­le­ment sur les pro­blé­ma­ti­ques des don­nées cultu­rel­les et Wikidata : http://zone47.com/dozo/

Présentation du projet

edit
 
Les origines de Crotos

Palladia est un moteur de recherche et d’exploration d’une partie des col­lec­tions du Musée Saint-Raymond qui s’appuie sur Wikidata et Wikimedia Commons sur le modèle de Crotos.

Les origines de Crotos :

  • 2012 Une expérimentation a été réalisée en 2012 sur DBpedia [fr] sur les œuvres d'art.
  • début 2014 une première version version de Crotos est publiée dans le contexte du concours Sémanticpedia. Cette version s'appuie sur DBpedia [fr].
  • printemps 2014 Crotos bascule de DBpedia [fr] à Wikidata. La réalisation s'accompagne d'un important mouvement de contribution sur Wikidata d'identification d'éléments, de typage, d'ajout d'images, de métadonnées. Par exemple, Crotos utilise un ordre chronologique. Or sur ~9000 œuvres repérées, il y en avait ~300 avec date ; en quelques semaines, on passe à 8000 grâce aux données de DBpedia
  • été 2015. Mise à jour majeure de Crotos avec ajouts (visionneuse, autocomplétion, mise en page, enrichissements documentaires...)
  • Dwynwen, le moteur de recherche d'images de la Bibliothèque nationale du pays de Galles réalisé à la demande de Jason Ewans est sorti en mars 2019.
  • Palladia est sorti en mars 2020.

Fonctionnalités

edit
 
Interface de Palladia en japonais
 
Carte interactive des lieux dépeints sur Dwynwen
  • multilinguisme : il est possible d'effectuer des requêtes dans différentes langues dans la mesure où les items Wikidata possèdent des traductions.
  • notices riches : les métadonnées sont récupérées de Wikidata. La logique d'entités permet la mise en place de liens transverses (indexation iconographique, nature de l'objet, artiste, exposition,...)
  • visualisation sous forme de cartes : par lieux de découverte ou de création des objets pour Palladia, par lieux représentés pour Dwynwen.
  • reconstitution d'expositions via Crotos. ex : exposition Claude, un empereur singulier à Lyon
  • liens d'accès aux bases sources faisant autorité : éléments liées aux notices du catalogue de la bibliothèque nationale du Pays de galles pour Dwynwen, à la base Joconde et aux sites du Musée Saint-Raymond pour Palladia.
  • mise en place de liens vedettes. Wikidata faisant hub de ressources, sur un élément sont souvent référencés de nombreux liens externes. Un mécanisme de lien vedette a été mis en place. Sur Crotos, le lien renvoie de façon privilégiée vers la ressource en ligne de l'institution de conservation. Par exemple La Madone d'Alba de Raphaël renvoie vers la page dédiée de National Gallery of Art.
  • images Haute-Défintion. Crotos offre un filtre permettant de limiter les résultats aux œ uvres avec images en HD. Exemple : Œuvres avec image HD de Sandro Botticelli

Questions lors du live

edit

Palladia c’est un sous-projet de Crotos ? Ou c’est une instance différente ?

  • Crotos, Palladia et Dwynwen sont des instances différentes. Chaque site a par exemple son rythme de mise à jour. Une partie des scripts sont communs, d'autres sont spécifiques.

Comment ça marche ces moteurs de recherche ? Comment on extrait les données de Wikidata et Wikimédia pour les inclure dans cette base ?

  • Le moteur de recherche s'appuie sur les données récoltées de Wikidata. Il y a une compilation préalable qui permet de favoriser l'autocomplétion en s'appuyant sur les données (nombre d’œuvres, nombre d'articles wikipédia).

Les données sont récupérées de Wikidata en utilisant différentes API des projets Wikimedia (SparQL Endpoint, Wikimedia API, API Commons). Les fichiers images ne sont pas récupérés mais les dimensions et le ratio hauteur/largeur sont récoltés et nécessaires pour le mode de mise en page des résultats. Il faut bien connaître la structure des données sur Wikidata pour les réutiliser. Une granularité trop fine ne facilite pas les réutilisations.

Pour l'affichage général, l'affichage des résultats. Est-ce récupérable, paramétrable ?

  • Le site a plutôt vocation à être un moteur de recherche et d'exploration. Il existe néanmoins une interface pour récupérer des données en forme tabulaire (CSV). Celle-ci a été développée avant la sortie du point d'accès SparQL de Wikidata. Comme ce service SparQL répond très bien au besoin de récupérer des données structurées, le service dédié de Crotos n'est plus maintenu mais fonctionne encore (exemple : liste paramétrable et téléchargeable des œuvres de Botticellli)

OpenArtBrowser est un autre (rare) exemple de frontend sympathique réutilisant les données d'oeuvres d'art publiées sur les projets Wikimedia.

Propriétés utilisées pour les éléments du Musée Saint-Raymond : cette requête a permis de définir les différents critères de recherche et de créer un accès spécifique pour les objets possédant par exemple un modèle 3D, des inscriptions, un article Wikipédia, un lieu de découverte...

Pareillement, sur Dwynwen, les entrées ont été déterminées en rapport avec les richesses éditoriales d'ensemble. Ainsi le site présente une carte présente les lieux décrits, il y a notamment des entrées d'exploration sur les œuvres par publication ou par collection.

Contribution des institutions patrimoniales aux projets Wikimédia

edit
 
Des GLAMs qui contribuent - Colloque INHA Images usages

Dwynwen a été réalisé sur la judicieuse suggestion de Jason Evans. Palladia a été fait spontanément peu de temps après. C'est après coup, que s'est révélé le point commun entre ces deux institutions, pourtant déjà évoqué : il y a en leur sein des personnes qui œuvrent directement à la contribution sur les projets Wikimedia. Ces deux interfaces ne font que révéler et utiliser une documentation riche produite par les personnels des institutions en collaboration avec les wikimédiens et les wikimédiennes. L'important travail documentaire sur les métadonnées s'est accompagné de versements massifs d'images sous licence libre sur Wikimedia Commons.

Ces contributions institutionnelles sont le signe d'une nouvelle pratique professionnelle, évoquée notamment par Marie D Martel dans son billet Le modèle d’une pratique professionnelle alternative à bâtir avec les GLAMs et Jason Evans dans Becoming a National Wikimedian: Jason Evans and the National Library of Wales. En complément, on peut remarquer que l'open data et l'open content ne suffisent pas. Certes il manque encore des contenus –on ne peut traiter correctement l'art pariétal faute d'images libres disponibles par exemple– mais les fonds libres disponibles sont déjà très importants, trop pour espérer que des bénévoles puissent tout bien documenter et ingérer. Si une institution a une volonté stratégique, en phase avec ses missions, de diffuser et documenter les ressources qu'elle produit au sein des projets Wikimédia, elle a tout intérêt à s'en donner les moyens et à le faire elle-même en collaboration avec les communautés des projets Wikimédia.

Pour Palladia et Dwynwen, la grande qualité éditoriale des contributions documentaires a favorisé la création d'interfaces spécifiques. La documentation fine des expositions, des inscriptions, les versements de modèles 3D du musée Saint-Raymond, l'indexation iconographique des œuvres de la bibliothèque nationale du Pays de Galles, les regroupements par publication... Tout le matériau était déjà présent et ces deux sites spécifiques, Palladia et Dwywen, ne sont qu'un aboutissement possible de ces ressources disponibles dans un bien commun informationnel accessible à tous.

Compléments

edit