Wikipédia abstraite/Mises à jour/2021-06-24
◀ | Actualités de la Wikipédia abstraite | ▶ |
Résumé : La communauté Grammatical Framework invite les wikimédiens à participer gratuitement à l'école d'été Grammatical Framework 2021. La participation des wikimédiens sera sponsorisée par Digital Grammars.
"Grammatical Framework" (GF) est un langage de programmation fonctionnel Open Source et une suite d'outils destinés à la génération de langage naturel multilingue et à l'analyse syntaxique des entrées en langage naturel. GF a été créé en 1998 chez Xerox Research afin de prendre en charge la rédaction de documents multilingues. GF est capable d'analyser et de générer des textes dans plusieurs langues simultanément tout en travaillant à partir d'une représentation du sens indépendante de la langue. GF rassemble une communauté active et vivante, et offre plus de 40 langues.
Voici un exemple du fonctionnement de GF (notez que la syntaxe a été modifiée, passant d'une syntaxe de type Haskell à une syntaxe fonctionnelle). Étant donné une représentation abstraite telle que :
mkUtt(mkS(mkCl(mkNP(aPl_Det, horse_N), mkNP(aPl_Det, animal_N))))
Afin d'en faciliter la compréhension, voici la terminologie non abrégée :
make Utterance (make Sentence (make Clause (make Noun Phrase (a Plural Determiner, horse Noun), make Noun Phrase (a Plural Determiner, animal Noun))))
Il convient de noter que cette structure peut également être supprimée par un appel de fonction avec une structure plus simple :
subsumes(horse_N, animal_N)
On peut linéariser cette représentation abstraite dans plusieurs langages. Voici les résultats tels que créés par la mise en œuvre de la GF basée sur le cloud computing (qui date de 2012 - entre-temps, GF a ajouté le support de dizaines de langues supplémentaires) :
- bulgare: коне са животни
- chinois: 些 马 是 些 动 物
- néerlandais: paarden zijn dieren
- anglais: horses are animals
- espagnol: caballos son animales
- suédois: hästar är djur
Apportons deux petites modifications à la représentation abstraite : add a negative polarity to the sentence (negativePol
) and switch horse_N
with tree_N
, and we get the following representation:
mkUtt(mkS(negativePol, mkCl(mkNP(aPl_Det, tree_N), mkNP(aPl_Det, animal_N))))
Comme ci-dessus, cela pourrait être caché derrière un appel de fonction :
subsumesNot(tree_N, animal_N)
Cela conduit aux linéarisations suivantes :
- bulgare: дърва не са животни
- chinois: 些 树 不 是 些 动 物
- néerlandais: bomen zijn niet dieren
- anglais: trees aren't animals
- espagnol: árboles no son animales
- suédois: träd är inte djur
Pendant que l'idée de la Wikipédia abstraite était développée, GF a servi d'inspiration importante. Elle faisait partie de AceWiki, une extension de MediaWiki qui s'intégrait étroitement avec GF et Attempto Controlled English (ACE) afin de créer des textes en plusieurs langues et également de capturer la sémantique formelle du texte. Alors que dans AceWiki l'un des principaux objectifs était d'exprimer toutes les phrases également dans un langage logique formel (dans ce cas Web Ontology Language), nous sommes moins intéressés par la sémantique formelle du contenu abstrait (en fait, c'est une différence majeure entre Abstract Wikipedia et les nombreux projets précédents). En dehors de cela, vous pouvez voir comment GF et AceWiki ont influencé le développement de la Wikipédia abstraite.
Depuis l'annonce de la Wikipédia abstraite, les développeurs et les communautés de GF ont contacté les développeurs de la Wikipédia abstraite, et nous avons discuté de nos plans et de nos idées. Afin d'approfondir les relations entre les communautés et de transférer des expériences et des idées entre elles, nous sommes très heureux de lancer une invitation à la communauté d'Abstract Wikipedia : l'école d'été de la Grammatical Framework de cette année sera ouverte et gratuite pour tous les Wikimédiens.
À ce stade, il est trop tôt pour s'engager à utiliser le GF comme seule approche pour la génération de langage naturel dans la Wikipedia abstraite. Il existe des alternatives, et les Wikifonctions seront suffisamment malléables pour supporter différentes approches. Un exemple d'une telle alternative est HPSG (Head-driven phrase structure grammar), qui sera présenté lors de la deuxième semaine de l'école d'été. Mais nous prévoyons de tirer les leçons des décennies de travail et de recherche sur GF et des centaines d'années-personnes qui ont été consacrées à son développement, et nous prévoyons également d'examiner si nous pouvons réutiliser certains des logiciels ou des parties des bibliothèques de grammaires complètes qui font partie de GF. Afin de faciliter cette réutilisation, il sera crucial de mieux se connaître et de mieux se comprendre.
L'L'Université d'Été Grammatical Framework 2021 se tiendra du 26 juillet au 6 août à Singapour, et il sera possible d'y participer en ligne. Une inscription sera nécessaire. 'Pour vous inscrire en tant que wikimédien, veuillez envoyer un courriel à inaridigitalgrammars.com
, en indiquant votre compte Wikimedia et votre nom, votre pays de résidence, les langues que vous lisez et écrivez, et si vous souhaitez participer pendant une ou deux semaines. Cette étape est nécessaire pour que vous puissiez éviter les frais de participation — si vous vous inscrivez vous-même, vous devrez payer ces frais. Nous sommes très reconnaissants à Digital Grammars de couvrir les frais pour les Wikimédiens.
Nous sommes très enthousiastes à l'idée de cette collaboration et nous nous réjouissons de voir les deux communautés travailler ensemble et bénéficier mutuellement de leurs objectifs, expériences et compétences.
Cette semaine a également vu notre première heure de bureau. Nous avons répondu à de nombreuses questions, et vous pouvez consulter les journaux d'activité. Nous prévoyons la prochaine heure de bureau dans quatre à six semaines, et nous annoncerons les dates également dans ce bulletin.