Codes de langue spéciaux

This page is a translated version of the page Special language codes and the translation is 82% complete.
Outdated translations are marked like this.

La langue d’un wiki de Wikimédia peut être déterminée par les attributs lang="..." et xml:lang="..." de l’élément <html> de chaque page (ou d’autres éléments pour des sous-contenus spécifiques dans les pages multilingues) ; ils sont également utilisés pour la mise en forme dans les sélecteurs de langue CSS. Ces codes de langue devraient être normalement des étiquettes de langue approuvées tels que définies par BCP 47.

Dans la plupart des cas, les noms de sous-domaines que nous utilisons pour les projets correspondent à des codes de langue standard, mais il reste certaines exceptions. C’est le plus fréquemment le cas pour des raisons historiques, alors qu’un code ISO 639 standard n’était pas encore disponible lors de la création du projet, mais aussi parce que d'anciens codes ISO 639 ont été rendus désuets ou supprimés quand il incluaient un groupe de langues maintenant considérées comme distinctes.

Les codes ISO 639 désuets ou supprimés sont encore considérés comme valides dans BCP 47 (dont les étiquettes de langues ne sont normalement pas supprimées), le plus souvent en tant que codes de repli pour des traductions manquantes ou pour permettre la compatibilité ascendante, même s’ils ne sont plus recommandés pour l'utilisation moderne (l’utilisation de ces codes peut potentiellement conduire à des disputes insolubles dans Wikimédia, à moins que les langues soient clairement distinguées en utilisant de nouveaux codes). Dans certains cas, certaines anciennes distinctions dans ISO 639 ont été supprimées parce qu’elles avaient été introduites artificiellement pendant un temps limité (parfois pour des raisons politiques non neutres) mais pas activement soutenues par les utilisateurs, et quand elles compliquaient inutilement la tâche des traducteurs ou quand cela nécessitait un recours trop fréquent aux langues de repli et à un translittérateur automatique (lorsqu’une norme fiable et des conventions orthographiques ont été reconnues et adoptées par la plupart des utilisateurs de variantes d'écritures différentes), ou parce que le développement de l’éducation a permis une meilleure intercompréhension et une meilleure acceptation des multiples variantes dans l'usage courant.

Sous-domaines qui ne correspondent pas à l’attribut lang

Sous-domaine Langue Projet(s) Notes
als Autonyme : Alemannisch
Nom en anglais : Alemannic
Famille linguistique : Germanic
Wikipedia, Wiktionary, Wikibooks, Wikiquote Utilise le code de langue ISO 639-3 gsw.
bh Autonyme : भोजपुरी
Nom en anglais : Bihari
Famille linguistique : Indo-Aryan
Wikipedia
Tracked in Phabricator:
Task T41968 stalled

Ancien code de langue ambigu (historique dans ISO 639-2). Utilise bho correspondant au code de langue ISO 639-3 pour la langue majoritaire composant cette sous-famille (dont le statut de macrolangue est disputé, ses langues membres étant souvent peu intelligibles entre elles).

roa-rup Autonyme : armãneashti
Nom en anglais : Aromanian
Famille linguistique : Italic
Wikipedia, Wiktionary Utilise rup qui correspond au code de langue ISO 639-3.
simple Autonyme : Simple English
Nom en anglais : Simple English
Famille linguistique : Germanic
Wikipedia, Wiktionary Utilise le code en de l’anglais ordinaire.
zh-classical Autonyme : 文言
Nom en anglais : Classical Chinese
Famille linguistique : Sinitic
Wikipedia Le chinois classique (littéraire) a pour code ISO 639-3 lzh.
zh-min-nan Autonyme : Bân-lâm-gú
Nom en anglais : Minnan
Famille linguistique : Sinitic
Wikipedia, Wiktionary, Wikibooks, Wikiquote, Wikisource Le min nan a pour code ISO 639-3 nan.
zh-yue Autonyme : 粵語
Nom en anglais : Cantonese
Famille linguistique : Sinitic
Wikipedia Le cantonais a pour code de langue ISO 639-3 yue.

Divers :

  • Tous les sous-domaines de wikimedia.org

Sous-domaines qui ne se conforment pas à un code de langue ISO 639 valide

Sous-domaine Langue Projet(s) Notes
als Autonyme : Alemannisch
Nom en anglais : Alemannic
Famille linguistique : Germanic
Wikipedia, Wiktionary, Wikibooks, Wikiquote
Tracked in Phabricator:
Task T6793 stalled

L’alémanique a pour code de langue ISO 639-3 gsw. Le code ISO 639-3 als est en fait attribué à l’albanais tosk.

bat-smg Autonyme : žemaitėška
Nom en anglais : Samogitian
Famille linguistique : Baltic
Wikipedia
Tracked in Phabricator:
Task T27522 stalled

Le samogitien a pour code de langue ISO 639 sgs.

cbk-zam Autonyme : Chavacano de Zamboanga
Nom en anglais : Chavacano de Zamboanga
Famille linguistique : Pidgin and Creole
Wikipedia
Tracked in Phabricator:
Task T124657 stalled

Le chacovano de Zamboanga n’a pas de code de langue ISO 639 en tant que langue individuelle. Le code ISO 639-3 cbk est attribué au Chavacano, un sur-ensemble comprenant la variante locale de Zamboanga.

eml Autonyme : emiliàn e rumagnòl
Nom en anglais : Emilian-Romagnol
Famille linguistique : Italic
Wikipedia
Tracked in Phabricator:
Task T36217 stalled

Le code ISO 639-3 eml anciennement attribué à l’émilien-romagnol est maintenant désuet et scindé en egl (émilien) et rgn (romagnol).

fiu-vro Autonyme : võro
Nom en anglais : Võro
Famille linguistique : Finno-Permic
Wikipedia
Tracked in Phabricator:
Task T31186 stalled

Le võro a pour code ISO 639-3 vro.

iu Autonyme : ᐃᓄᒃᑎᑐᑦ / inuktitut
Nom en anglais : Inuktitut
Famille linguistique : Eskimo-Aleut
Wikipedia L’ISO 639 considère iu/iku non pas comme une langue simple, mais comme une macrolangue comprenant ike et ikt. MediaWiki est d’accord (voir phabricator), mais : utilise ike comme langue de repli, codée ike-cans ; ajoute ike-latn ; ne supporte pas encore ikt. CLDR considère Cans comme une écriture aspirationnelle (souhaitée mais insuffisamment soutenue et utilisée).
ksh Autonyme : Ripoarisch
Nom en anglais : Ripuarian
Famille linguistique : Germanic
Wikipedia Le code ISO 639-3 ksh est attribué au colonais, une des branches du ripuaire.
map-bms Autonyme : Basa Banyumasan
Nom en anglais : Banyumasan
Famille linguistique : Sunda-Sulawesi
Wikipedia Le banyumasan n’a pas de code ISO 639 attribué en tant que langue individuelle. Le code ISO 639-1 jv/jav est assigné au javanais, un sur-ensemble du banyumasan.
nds-nl Autonyme : Nedersaksies
Nom en anglais : Dutch Low Saxon
Famille linguistique : Germanic
Wikipedia Dupliqué avec le code nds du bas allemand (différences régionales mineures entre les variétés d'Allemagne et des Pays-Bas, conventions orthographiques légèrement différentes mais pas toujours localement pertinentes).
nrm Autonyme : Nouormand
Nom en anglais : Norman
Famille linguistique : Italic
Wikipedia
Tracked in Phabricator:
Task T25216 stalled

Le normand n’a pas de code ISO 639 en tant que langue individuelle ni comme macrolangue (cependant deux dialectes normands, le guernésiais et le jerriais, se partagent l’usage du code ISO 639-3 nrf). L’ISO 639-3 a en fait attribué le code nrm à la langue narom. L’ISO 639-3 inclut le normand en tant que variété du français, comme la plupart des autres variétés du nord de la France.

roa-rup Autonyme : armãneashti
Nom en anglais : Aromanian
Famille linguistique : Italic
Wikipedia, Wiktionary
Tracked in Phabricator:
Task T17988 stalled

L’aroumain a pour code de langue ISO 639-3 rup.

roa-tara Autonyme : tarandíne
Nom en anglais : Tarantino
Famille linguistique : Italic
Wikipedia Le tarantino n’a pas de code ISO 639 en tant que langue individuelle. L’ISO 639 l’inclut dans l'italien, comme la plupart des autres variétés du nord de l’Italie.
sh Autonyme : srpskohrvatski / српскохрватски
Nom en anglais : Serbo-Croatian
Famille linguistique : Slavic
Wikipedia, Wiktionary
Tracked in Phabricator:
Task T127680 stalled

sh était à l’origine le code ISO 639-1 pour le serbo-croate mais il n’est plus actif (car il était utilisé pour diverses langues qui ont été depuis distinguées dans ISO 639-3). Cependant il demeure une étiquette de langue valide pour BCP 47. Il existe cependant encore le code ISO 639-3 hbs pour l’ancien serbo-croate partiellement unifié comme langue chapeau officielle dans l’ancienne Yougoslavie. Parmi les alias de CLDR, sh correspong à $sr-Latin.

simple Autonyme : Simple English
Nom en anglais : Simple English
Famille linguistique : Germanic
Wikipedia, Wiktionary
Tracked in Phabricator:
Task T110190 stalled

L’anglais simple n’a pas de code ISO 639, mais l’IETF a défini une sous-étiquette simple.
However, even if the simple code is valid as a standard subtag for BCP 47, because it is only registered as a generic subtag for language variants for various base languages like en-simple or fr-simple (using the now standard variant subtag is preferable to using multiple subtags including an unregistered private extension, like "en-x-simple"). As a plain tag, "simple" means nothing in BCP 47 or ISO 639 (as it is not a plain language).
Note that under ISO 639 rules, Simple English is a variant or dialect or special orthography of English (so it can be registered as a variant subtag of English, like "formal" or informal" used in German or Dutch), defined as a subset for some limited usage. The IANA database for IETF's BCP 47 already indicates this and BCP 47-aware applications should have no problem to identify the language as being part of normal English, as long as it is properly tagged as "en-simple" and not just "simple". Also the content of the Simple English Wikipedia is hard to assess if it is really in "Simple" English or just normal English, as there's NO standard for such "simplication" but only an editorial community decision which is not really enforceable, except for some presentation rules. For example, there does not exist any "Simple English" dictionary, and all "Simple English" users refer to normal English dictionaries. Simple English is only a stylistic decision made by different authors with different preferences or perception of what is "simple" enough for them individually; in fact, even the "Simple English" Wikipedia could be fully integrated within normal English Wikipedia by better classification of its content or by using decicated portals for some public with limited understanding of English, and by making sure the English Wikipedia does not enter into too much complex details without separating them into subpages or detailed sections: it should be possible to describe any topic in simpler terms before using more complex terms that would first be defined, using didactic/pedagogical rules for sorting this content. And there are different view about how to simplify English, depending on the audience (for youth? for non-native speakers? for disabled people? for some specific country? Are simplifications the same in US, Canada, UK, Australia, South Africa or India?).

zh-classical Autonyme : 文言
Nom en anglais : Classical Chinese
Famille linguistique : Sinitic
Wikipedia
Tracked in Phabricator:
Task T10217 stalled
Tracked in Phabricator:
Task T30443 stalled

Le chinois classique (littéraire) a pour code de langue ISO 639-3 lzh.

zh-min-nan Autonyme : Bân-lâm-gú
Nom en anglais : Minnan
Famille linguistique : Sinitic
Wikipedia, Wiktionary, Wikibooks, Wikiquote, Wikisource
Tracked in Phabricator:
Task T10217 stalled
Tracked in Phabricator:
Task T30442 stalled

Le min nan a pour code de langue ISO 639-3 nan.

zh-yue Autonyme : 粵語
Nom en anglais : Cantonese
Famille linguistique : Sinitic
Wikipedia
Tracked in Phabricator:
Task T10217 stalled
Tracked in Phabricator:
Task T30441 stalled

Le cantonais a pour code de langue ISO 639-3 yue.

Divers :

  • tokipona – sous-domaine défunt de Wikipédia
  • ru-sib – sous-domaine défunt de Wikipédia, falsification d'une langue « sibérienne » de fiction
  • be-x-old – corrigé et redirigé vers un sous-domaine be-tarask pour Wikipédia (voir phab:T11823)

Autres distinctions

Sous-domaine Langue Projet(s) Notes
ms Autonyme : Bahasa Melayu
Nom en anglais : Malay
Famille linguistique : Sunda-Sulawesi
Wikipedia, Wikibooks, Wiktionary Malay language used to be "ms", just like Indonesian language is "id", but since the Malay Wikipedia inception, the code "ms" has become the code for macro language (not individual language).

There are many individual languages under "ms"/"msa", including Indonesian ("id"/"ind"), Banjar ("bjn"), Minang ("min"), three living languages with their own Wikimedia projects, as well as Malay (individual language) ("mly"-Deprecated 2008 or "zlm"-Malay or "zsm"-Standard Malay / Malaysian Malay / Malaysian language)

It should be noted that the creation of Malay Wikipedia, Wikibooks, and Wiktionary all predates the change in the language code in 18 February 2008, with the latest one, Malay Wikibooks, created on 24 August 2004.

See also:

ak Autonyme : ak
Nom en anglais : Akan
Famille linguistique : Niger-Congo
Wikipedia;
Fermés : Wikibooks, Wiktionary
Ces deux ensembles de wikis sont-ils dans la même langue ? Consultez l’article Wikipédia.
Note that this situation is quite similar to the artificial distinction between Luxembourgish and Moselle Franconian, or between Serbian, Croatian and Bosnian: they are also clusters of dialects of the same mutually intelligible base language with just minor differences (for terminology choice or their preferred orthography, but multiple orthographies exist for all these dialects). It's hard (and in fact impossible) to make a real distinction at linguistic level, this is purely an ethnopolitical distinction and native speakers in one region going to the other region where the other dialect cluster is referred by a different name will be known there to use the other cluster name and will speak/write without more problems than in their origin ethopolitical community. This adaptation also occurs within each cluster, based on social interaction or level of formality (e.g. in religion, or for prestige, or for vernacular speech and jargons in the street or used by younger or less educated people).
tw Autonyme : Twi
Nom en anglais : Twi
Famille linguistique : Niger-Congo
Wikipedia;
Fermé : Wiktionary
de-formal Autonyme : Deutsch
Nom en anglais : German
Famille linguistique : Germanic
Non utilisés comme noms d’hôtes mais inclus comme des pseudo sous-étiquettes (non enregistrées) pour certaines traductions sur translatewiki.net (utilisées dans des pages de Méta-Wiki telles que celles sur les politiques lorsque certains messages s’adressent directement à l'utilisateur du wiki selon ses préférences) : nous aurions dû utiliser une extension d’utilisation privée.
nl-informal Autonyme : Nederlands
Nom en anglais : Dutch
Famille linguistique : Germanic

Technical language code

The special language code qqx can be used to display the ids of all system messages used on a page.

Voir aussi