WikiConvention francophone/2016/Programme/WIKIOCR
RECONNAISSANCE OPTIQUE DES CARACTÈRES D'OUVRAGES PHOTONUMÉRISÉS
editZELECTRON
editType de session (sélectionnez un type de format)
edit- Discussion / Débat
Résumez votre proposition d'intervention en quelques mots (max. 200 mots)
editIl y a désormais des centaines de millions d'ouvrages qui sont "numérisés" sur la planète mais voilà, il s'agit plutôt de "photonumérisation" (ou photodigitalisation) pour être précis, un progrès certes par rapports aux microfilms mais pas si sûr.
En fait la tâche est loin d'être achevée, car il s'agirait de continuer ce gigantesque travail en passant tous ces documents par un système OCR (reconnaissance optique de caractères, en français) afin de pouvoir traduire automatiquement les ouvrages dans toutes les langues, de consulter les livres avec une lisibilité parfaite avec un choix de caractères personnels (en police, en couleur et en taille), d'ajouter des commentaires, des dessins, des photos ... peut-être.
Cette immense tâche ne peut être accomplie que bénévolement avec, sur un même écran, d'un coté le texte original et de l'autre un texte débarrassé de ses imperfections, tout en respectant à la lettre (c'est le cas de le dire) cet original !
Un aspect non négligeable consiste à mettre ces textes à portée des non-voyants sans passer par le braille et d'autre part à un grand nombre de populations analphabètes en les vocalisant.
Les textes multilingues aussi en découleront.
Il me semble que Wikipédia serait le mieux placé en mobilisant ses contributeurs dont personne ne conteste le sérieux pour corriger les fautes qui immanquablement émailleront les pages successivement alphadigitalisées. Chaque ouvrage passant dans plusieurs mains (3?, 4?, 5?) pour assurer l'extrême rigueur de la correction et éviter ainsi les fautes d’inattention, les dérives sectaires ou fantaisistes.
Résultats attendus (max 100 mots)
editPrise de relais en ce qui concerne ce projet du fait de l'âge que j'ai.
Durée
editindeterminée
Matériel / Aide nécessaire (précisez)
editscanner et logiciel d'OCR (ROC en français)
Participants intéressés (inscrivez-vous ci-dessous et posez dès à présent vos questions à l'organisateur de la session)
editvous pouvez me contacter au 06 41 69 31 68
ou m'adresser un mail : yves.spale gmail.com
très cordialement.
Statut
editProposition refusée