Wikimédia France/Groupes de travail/Groupes thématiques/Wiki Loves Monuments/28 avril 2021


Réunion tenue le mercredi 28 avril 2021 de 18h à 20h en virtuel sur https://meet.jit.si/WML avec édition sur Pad de Wikimédia France - WLM_Organisation_Notes

Wiki Loves Monuments
Courrielwlm(_AT_)lists.wikimedia.fr
Référent·esSarah Krichen WMFr
Pages wikiPage d'accueil du groupe

Réunions
Projets
Notes
Compte Facebook

Compte Twitter
Site webwikilovesmonuments.fr


Présents edit

Excusé : VIGNERON * discut. - NV
Absent : Lyokoï - L / Amélie Charles - AC

Ordre du jour edit

  1. Relation entre notre projet et le MOOC Wikidata
  2. Évaluer les intersections et la possibilité d'un alignement (semi-)automatisé des données
  3. lister category (Commons), propriété (Wikidata) et clef (OSM) intéressant pour WLM
  4. Établir la documentation de la clef Heritage
  5. Déterminer le tableur à utiliser
  6. Divers

Synthèse des échanges edit

Relation entre notre projet et le MOOC Wikidata edit

Contexte edit

JOGD ayant eu connaissance qu'Amélie préparait un MOOC sur Wikidata, ils se sont rencontrés le 12 mars 2021 afin d'établir la relation entre les deux projets. Amélie comptant recourir à WikiShootMe pour la mise en évidence de résultats concrets obtenus par Wikidata, JOGD lui a conseillé d'en discuter avec l'équipe d'extension des cibles de WLM afin d'éviter que la formation ne tienne pas compte de cette évolution du rapport Wikidata/OSM.

Positionnement edit

Pas d'échange sur le sujet durant la réunion du fait de l'absence de AC, mais retour de Mathieu Denel par courriel à JOGD :

« En fait, je pense qu'on est tous d'accord pour dire que OSM et Wikidata font sens l'un avec l'autre dans un sens d'interopérabilité. J'ai l'impression que le consensus des échanges porte sur les fortes contraintes techniques d'intégration et le fait que ces compétences techniques semblent difficilement résolvables que ce soit dans le cadre du déploiement du MOOC Wikidata en cours ou non. Je n'ai pas d'avis sur le sujet mais par le passé il est déjà arrivé de buter sur des sujets technique et avec l'organisation d'hackathons ou autre évènements à distance d'avancer, idem pour Lingua Libre (qui n'est pas un projet Wikimedia) mais qui a fédéré des bénévoles sur le déploiement de l'outil et l'implication de profil tech pour développer des modules ou autre. Qu'en pensent les équipes d'OSM ? Elles pourront sûrement évaluer le temps nécessaire et les moyens à mettre en œuvre (une idée en l'air). »

En l'état, le contenu du MOOC Wikidata ne prendra pas en compte le travail de l'équipe WLM pour exercer les participants à la relation entre une modification Wikidata et un affichage sur une carte ; l'outil privilégié pour cet exercice étant WikiShootMe à toute autre plateforme.

Évaluer les intersections et la possibilité d'un alignement (semi-)automatisé des données edit

La décision ayant été prise d'une phase de test de Wikidata vers OSM ciblée sur les MHs. P devait :

  1. Évaluer l'intersection [MH dans Wikidata w. Mérimée] / [MH sur OSM avec id Wikidata]
  2. Trouver les MH sur OSM sans Wikidata
  3. Évaluer la possibilité (avec résultats chiffrés: fiabilité (sont-ce les mêmes MH?, etc.) d'un alignement (semi-)automatisé des données avec
    1. des données chiffrées
    2. des éléments compliqués, difficiles à comparer
    3. des données manquantes sur WD et/ou OSM
    4. la vérification de la possibilité d'un import (semi-)automatique

Pas manque de temps, P n'a pu faire une évaluation chiffrée à l'échelle de la France. De nombreuses difficultés pour la création de requêtes avec Overpass + data analysis qu'il n'a pu résoudre en parallèle de ses autres activités se sont fait jour.

En revanche, il a pu réaliser une analyse très partielle des données (c'était plus un "proof of concept") en partant sur des données extraites d'Overpass dans une zone couvrant la Lorraine et l'Alsace. Seul les "archeological_site" ont été requêtés, l'utilisation d'Overpass pour requêtes croisées étant encore difficile pour P. Les résultats sont les suivants :

  1. Sur 174 éléments obtenus par la requête, 38 (21,8%) ont la propriété "wikidata", 30 (17,2%) ont la propriété "ref:mhs".
  2. Wikidata ne renvoie absolument rien avec Q839954 (site archéologique), ses dérivés, dans la Lorraine et en Alsace (https://w.wiki/3FZZ)
  3. Pas de tests de corrélation de coordonnées, en revanche une question avec les résultats qui sont des polygones ou des lignes (51, soit 30%)

Durant la réunion P et JOGD ont tenté différentes requêtes. Devant les différentes difficultés pour obtenir un résultat cohérent, une requête de vérification a été faite. Elle porte sur les MHs en France à partir des propriétés wdt:P31* et wdt:P17 pour la valeur wd:Q916475 et wd:Q142 ce qui donne la requête SPARQL - https://w.wiki/3Fa4. La présence de plusieurs fiches sans label comme wdt:Q93991471 qui a été corrigée par NV suite à la réunion met en évidence la présence d'erreurs. La requête devant renvoyer 0 résultats comme attendu.

De fait, il est apparu aux présents que les données Wikidata n'avaient pas été mises à jour. NV a confirmé, par courriel, qu'une mise à jour a bien été faite, mais de façon *incomplète*. Non seulement les données ne sont pas *complètement* à jour, mais elles ne l'ont jamais vraiment été. Il n'y a qu'une petite dizaine de contributeurs qui s'occupent de mettre à jour, maintenir et corriger les données Wikidata sur les monuments historiques. C'est trop peu par rapport à l'ampleur de la tâche. Il convient de lancer un appel à participation. En effet, après quelques recherches, il s'avère que des ID autres sont à utiliser ainsi que les propriété et valeur pour les MHs classés comme le montre cette nouvelle requête SPARQL https://w.wiki/3Fau, issue de la propriété et valeur obtenues à partir de Category:Monuments_historiques_class%C3%A9s, révèle une meilleure corrélation entre ce que l'équipe souhaite obtenir et les informations Wikidata => le travail sur l'identification des propriétés et valeurs est à poursuivre.

lister category (Commons), propriété (Wikidata) et clef (OSM) intéressant pour WLM edit

Dans les paramètres du fichier WLM_ExtensionDesCibles, JOGD a listé les propriétés Wikidata, les clefs sur OSM et les category sur Commons intéressant pour WLM.

Durant la réunion, il est apparu que les propriétés était également à établir ainsi que des zones géographiques. C'est ainsi qu'il a été décidé de travailler sur les nouvelles régions telles qu'elles sont définies dans Wikipédia ce qui a entraîné la création d'une nouvelle colonne. Le travail d'identification et d'amélioration du tableau doit se poursuivre afin de faciliter les travaux d'évaluations d'intersection.

Établir la documentation de la clef Heritage edit

NV a fait savoir par courriel sur la liste que la clef Heritage > 6 sur OSM ne correspond à rien. Cette valeur est quasiment inutilisée en France comme ailleurs. L'idée est plutôt de proposer d'ajouter dans les règles OSM d'utiliser cette clef avec des valeurs supérieures à 3 (par exemple 4 pour l'inventaire, 5 pour les autres protections, "petit patrimoine" et protections municipales par exemple mais il faudrait d'abord des sources pour cela).

Déterminer le tableur à utiliser edit

Après un test rapide de JOGD sur le classeur Ethercalc pour mettre en place listing des cibles photographiques, il apparaît que :

  1. Ethercalc ne gère pas les feuilles multiples ce qui ne permet pas de bénéficier d'une feuille dédiée au paramétrage pour les listes pas plus que pour l'archivage des données déjà travaillées
  2. Ethercalc ne gère pas les listes tout court
  3. Ethercalc ne permet pas un tri automatisé

Framacalc qui utilise le même éditeur n'est pas plus utilisable.

De fait, l'équipe utilisera le fichier WLM_ExtensionDesCibles tournant sur Google Sheet.

Divers edit

Suite au retour de P et aux différents tests effectués durant la réunion, il apparaît qu'il est nécessaire de faire appel à d'autres personnes pour aider à l'amélioration de Wikidata pour un certain nombre de propriétés. Un appel sera lancé sur Projet:Arch%C3%A9ologie, la liste tech@wikimedia.fr et les équipes OSM pouvant être intéressées par les aspects cartographiques.

ToDo des tâches edit

  • Tous : Réfléchir à la pertinence des colonnes du tableau WLM_ExtensionDesCibles afin de disposer d'un outil pleinement efficaces
  • Tous : identifier des contributeurs.trices intéressés par le projet
  • P : Suggérer des tâches à réaliser dans le tableau WLM_ExtensionDesCibles pour chacun des membres
  • P : Poursuite de l'évaluation des intersections
  • P : Poursuite de l'évaluation des possibilité d'un alignement (semi-)automatisé des données
  • JOGD : Poursuivre le travail sur l'identification des clefs, propriétés, refs, category
  • NV : Établir à quoi correspond le niveau 6 de la clef Heritage sur OSM