Grants:IdeaLab/Index vocabulaire - Wikiversité Wiktionnaire interwiki/fr

Index vocabulaire - Wikiversité Wiktionnaire interwiki

Outil Wmflabs visant à indexer le vocabulaire étudié au sein d'un département de langue étrangère ; pour publier des listes sous forme de "fiche memo" proposant des liens vers les occurrences correspondantes du Wiktionnaire.

créateur d'idées• Youni Verciti

ce projet a besoin de...

bénévole

gestionnaire de la communauté

donner votre avis

rejoindre

approuver

créé le15:05, 17 August 2016 (UTC)

Projet d'idée

Quel problème souhaitez-vous résoudre ?

Je souhaite formaliser le travail réalisé sur l'outil vocabulary-index. A ce jour l'outil est une première expérience de programmation dont l'objectif initial est de collecter le vocabulaire étudié dans les leçons de langues du département Portugais de la Wikiversité pour publier des fiches récapitulatives.

La première étape de développement abouti au résultat suivant : fr:v:Portugais/Index_vocabulaire/vcb_Nom.

Voici un schéma représentant le fonctionnement du logiciel dans sa version 0.3.1

Diagram for vocabulary-index on tool.wmflabs.org

Le programme Python s’exécute en ligne de commande et attend le titre de la(es) page(s) à scanner.

$> vcb.py <titre de la page>

Le script cherche les modèles "Traduction(s)" et "Prononciation(s)" collecte le contenu dans des listes puis restitue la liste du vocabulaire sous forme de page formatée.

Le problème initial consiste à indexer des items contenus dans un grand document ou une large collection de pages. L'expérience vocabulary-index dévoile certaines solutions mais aussi certaines difficultés.

vcb.py (0.3.1) utilise des modèles locaux, propres à la Wikiversité ; si le document se déplace vers un autre wiki la solution risque de ne pas fonctionner ; surtout le script ne peut pas fonctionner sur les sites ne disposant pas de ces modèles.

La traduction et l'implémentation, l'actualisation est une tâche des plus difficile ; pour qu'une solution d'indexation homogène sur chaque projet Wiki il faudrait un modèle universel ; difficile à envisager où bien une multitude de modèles spécifiques répondant à un même schéma de fonctionnement difficile à maintenir.

Un tableau associatif, suffit pourtant à collecter des items de contenu.

Quelque soit le le modèle, le marqueur, la syntaxe employée pour identifier les items ; une solution d'indexation implique fortement le contributeur au moment de l'édition des pages de contenu.

Le processus implique l'utilisation de "modèles ou marqueurs" définis, en aval lors de l'édition des pages et en amont, lors de la collection des occurrences par l'outil.

Quelle est votre solution?

L'outil vocabulary-index montre que l'on peut indexer des occurrences contenues dans des modèles sous forme de table et produire des listes récapitulatives.

Nous avons découvert des possibilités interwiki en établissant les liens pour un mot étudié vers ses occurrences sur les wiktionnaires local et natif.

La solution reste locale et inexploitable pour d'autres contenus, cette limitation est principalement due au modèle utilisé.

Nous avons simplement besoin de placer les items à indexer dans un tableau associatif reconnaissable par le script qui collectera les items.

La syntaxe Wiki propose une classe de tableau particulière qui pourrait répondre à ce besoin ; {| class="wikitable sortable".

L'utilisation peut représenter une solution pour élargir le champs d'action d'un logiciel d'indexation de contenu.

Objectifs

Tester l'utilisation des tables de la classe "sortable" comme conteneur d'items, définir les avantages inconvénients et limites.
Communiquer autour de l'outil vocabulary-index, pour planifier son évolution et rencontrer des ressources, expériences, utilisateurs qui puissent partager des idées et m'aider dans cette voie.
Nettoyer le code de l'outil vocabulary-index.

L'objectif consiste à dessiner un modèle de processus capable d'indexer des items éparpillés dans une vaste collection de pages capable de fonctionner sur n'importe quel projet Wikimedia.

Il existe de nombreuses perspectives de développement pour ce type d'outil et probablement de nombreux projets semblables. En élargissant le champs d'action on peut imaginer un outil d'indexage capable de recueillir toute sorte d'occurrences organisées dans un tableau associatif ; avec de nombreux débouchés sur les projets Wikiversité ou Wikibook en particulier et globalement pur tous les documents wiki de grande taille. L'outil ouvre également des perspectives de synergies, de collaboration interwiki entre les projets.

Impliquez-vous

À propos du créateur de l'idée

Je contribue à l'univers Wiki depuis longtemps, ponctuel au départ mon investissement est devenu plus intense. Je suis issu du domaine de la formation professionnelle en informatique, à ce titre participe activement au projet Wikiversité et aux projets liés à l'informatique en général. J'ai migré vers le plus vaste des pays lusophones cela à motivé le développement du département de Portugais sur la Wikiversité.

Je découvre avec optimisme les nouvelles possibilités qu'offrent notamment Lua & Python ; en développant des outils sur WmfLabs via le compte "Youni Verciti Bot".

Voici mon profile local : Grants:IdeaLab/Youni Verciti

Participants

Approuvez

Développez votre idée

Would a grant from the Wikimedia Foundation help make your idea happen? You can expand this idea into a grant proposal.

Expand into a Rapid Grant

Expand into a Project Grant