Abstraktní Wikipedie/Aktualizace/2022-07-15
◀ | Aktualizace Abstraktní Wikipedie | ▶ |
Nedávno jsme byli dotázáni na potenciál Abstraktní Wikipedie. Proto jsme provedli Fermiho odhad, nebo chcete-li výpočet "z obálky". Považujte prosím tyto odhady za první návrh. Uvítáme vaši zpětnou vazbu a příspěvky, abychom je mohli vylepšit.
Zde uvádíme odhady pro dvě otázky: kolik dalších "čtenářů" a kolik dalších "přispěvatelů" můžeme pomocí Abstraktní Wikipedie oslovit?
Všimněte si, že odpovědi, které zde uvádíme, nepředstavují cíle, které musíme splnit, ani očekávání od projektu, abychom se mohli označit za úspěšné, ale spíše se snaží modelovat představu o tom, jaký růst by mohla abstraktní Wikipedie poskytnout.
Kolik dalších čtenářů bychom mohli oslovit pomocí Abstraktní Wikipedie?
- V současné době má internet 4,6 miliardy uživatelů, což je více než polovina ze 7,9 miliardy světové populace.
- Anglickou Wikipedii čte 800 milionů čtenářů [1]
- Na všech Wikipediích máme přibližně 1,8 miliardy čtenářů [2]
- 1,2 miliardy uživatelů internetu mluví anglicky [3]
- Anglická Wikipedie tedy zasahuje 67 % anglicky mluvících uživatelů internetu (vydělte (2) číslem (4))
- Kdybychom to mohli udělat nezávisle na jazyce, měli bychom 3,1 miliardy čtenářů (vynásobte (1) číslem (5))
- Potenciál růstu je tedy až 1,3 miliardy nových čtenářů Wikipedie (odečtěte (3) od (6))
- Ale: v Číně je 850 milionů uživatelů internetu [4]
- V Číně je Wikipedie blokována.[5] Blokování Wikipedie značně brzdí růst.[6] Po zohlednění cenzury v Číně je potenciál růstu až 700 milionů nových čtenářů Wikipedie (to je ((1)-(8))x(5)-(3))
Chceme zopakovat výzvu Nadace čínským úřadům, aby zrušily blokování Wikipedie v Čínské lidové republice.[7] Jsme odhodláni umožnit všem a všude svobodný přístup ke znalostem na Wikipedii, jejich sdílení a podílení se na nich.
Toto modelování nezohledňuje další růst přístupu k internetu po celém světě, který by byl ještě více nakloněn uživatelům jiných jazyků než angličtiny. Tento model předpokládá, že lidé mají obecně stejný zájem o encyklopedický obsah, pokud by jim byl k dispozici v jejich jazyce.
Kolik nových editorů bychom mohli oslovit pomocí abstraktní Wikipedie?
- Anglická Wikipedie má 130 000 aktivních editorů [8]
- Všechny Wikipedie dohromady mají přibližně 315 000 aktivních editorů
- Poměr počtu editorů anglické Wikipedie a anglicky mluvících uživatelů internetu je přibližně 1 : 9 200 (tj. jeden z 9 200 anglicky mluvících uživatelů internetu je aktivním wikipedistou) (vydělte (4) číslem (10))
- Pokud předpokládáme stejný poměr u všech uživatelů internetu ve všech jazycích, měli bychom mít 500 000 editorů (vynásobte (1) a (12))
- To znamená, že za předpokladu, že dosáhneme spravedlivějšího rozdělení mezi jazykové přispěvatele, bychom měli potenciál 185 000 nových editorů mimo anglickou Wikipedii (Odečtěte (11) od (13))
- To by zdvojnásobilo současný počet editorů Wikipedie mimo anglickou Wikipedii (odečtením (10) od (11) získáme současný počet editorů)
- Po započtení cenzury v Číně to znamená potenciál 92 500 nových přispěvatelů (To je ((1)-(8))x(12)-(11))
Předpokládá se, že poměr přispěvatelů do Wikipedie bude v každém jazyce stejný. Právě teď se například cíl dosáhnout aktuální Wikipedie v mnoha jazycích může zdát nereálný nebo ohromující, takže se potenciální editoři rozhodnou nezapojit. Díky Abstraktní Wikipedii by se tento cíl mohl zdát reálněji dosažitelný, což by mohlo vést k podobnějšímu poměru, než jaký vidíme v angličtině. Tento a další podobné argumenty jsou podrobněji rozebrány v článku Wikipedia@20. Další úvahy, jako je snadnější přístup ke znalostem nebo více volného času [9], náš model nebere v úvahu.
Nechybí těmto modelům něco?
Ano, chybí. Model čtenářství předpokládá, že můžeme použít zájem anglicky mluvících uživatelů internetu o Wikipedii k odhadu, kolik čtenářů nám chybí v ostatních jazycích. Tento předpoklad zde však dělá hodně práce: je velmi pravděpodobné, že témata, která zajímají anglicky čtoucí uživatele Wikipedie, jsou mnohem lépe pokryta než témata pro jiné jazykové komunity.
A právě zde se objevuje odhad nových editorů: doufáme, že více editorů z nedostatečně zastoupených jazyků se bude věnovat tématům, která jsou pro tyto jazyky zvláště zajímavá (ať už v Abstraktní Wikipedii, nebo ve vlastním jazykovém vydání). Zejména proto, že tito přispěvatelé by nemuseli trávit tolik času pokrýváním mezer v základně společných znalostí.
Neuvažujeme také o tom, že pokrytím těchto dalších témat a poskytnutím nových modelů příspěvků bychom mohli potenciálně oslovit více čtenářů a editorů i v angličtině. Takový nárůst by v případě rozšíření do dalších jazyků vedl k ještě většímu počtu čtenářů a editorů po celém světě.
Kromě toho existuje mnoho dalších faktorů, o nichž se v literatuře hovoří, jako jsou internetové dovednosti, povědomí o Wikipedii atd. (viz např. [10], [11], [12], [13]).
Kéž bych si mohl hrát s těmito výpočty!
Opravdu? A to je jeden z možných případů použití Wikifunkcí: modely, které jsme popsali výše, budeme moci ve Wikifunkcích přeměnit na funkce. Pak můžeme o těchto modelech na Wikifunkcích přímo diskutovat a vylepšovat je, aktualizovat je o nová čísla a zobrazovat odlišné modely. Výše uvedený model nepřekračuje rámec vyhledávání a kombinování několika čísel. Na Wikifunkcích bychom pak mohli společně pracovat na vylepšení těchto modelů a přidat zajímavější vztahy mezi pokrytím témat, počtem čtenářů a počtem editorů.
Vaše připomínky k dalšímu vylepšení modelu jsou velmi vítány! Velmi děkujeme Isaacu Johnsonovi a Josephu Allemandouovi za jejich cennou zpětnou vazbu.
Aktualizace práce (k 1. červenci 2022)
Výkon:
- Prozkoumány možnosti přidání sledování provozu v clusteru Beta
- Pokračování v testování end-to-end pomocí beta clusteru a migrace pipeline testerů z orchestrátoru do MediaWiki
Generování přirozeného jazyka (NLG):
- Soulad s cíli NLG
Meta-data:
- Rozšířen dialog metadat o podporu objektů jako hodnot, odkazů, i18n klíčů
Zkušenosti:
- Opraveny testy funkce-orchestrátor a funkce-vyhodnocovač a příklady WikiLambda ApiFunctionCall
- Sloučené komponenty interaktivity pro testovací a prováděcí tabulky
- Dokončení změn stránkování API pro wikilambdafn_search
- Nahrazení vlastní komponenty zprávou Codex a úprava tlačítka editace pro responzivní obrazovky
Poznámky:
- ↑ Poznámka: metriku unikátních zařízení používáme jako zástupný počet pro čtenáře https://stats.wikimedia.org/#/en.wikipedia.org/reading/unique-devices/normal%7Cline%7C1-year%7C(access-site)~mobile-site*desktop-site%7Cmonthly
- ↑ Poznámka: metriku unikátních zařízení používáme jako zástupný počet pro čtenáře https://stats.wikimedia.org/#/all-wikipedia-projects/reading/unique-devices/normal%7Cline%7C1-year%7C(access-site)~mobile-site*desktop-site%7Cmonthly
- ↑ https://www.internetworldstats.com/stats7.htm
- ↑ https://www.statista.com/statistics/262966/number-of-internet-users-in-selected-countries/
- ↑ https://en.wikipedia.org/wiki/Censorship_of_Wikipedia#China
- ↑ https://wikimania2012.wikimedia.org/wiki/Submissions/Have_you_heard_about_the_Uzbek_Wikipedia%3F_Neither_have_the_Uzbeks.
- ↑ https://diff.wikimedia.org/2019/05/17/wikimedia-foundation-urges-chinese-authorities-to-lift-block-of-wikipedia-in-china/
- ↑ https://stats.wikimedia.org/#/en.wikipedia.org/contributing/editors/normal%7Cline%7C1-year%7Ceditor_type~group-bot*name-bot*user%7Cmonthly
- ↑ https://ourworldindata.org/time-use#do-workers-in-richer-countries-work-longer-hours
- ↑ https://academic.oup.com/joc/article-abstract/68/1/143/4915319
- ↑ https://www.nulearningforlife.org/wp-content/uploads/2016/08/Hargittai_Shaw-2015-Mind_the_skills_gap-ICS.pdf
- ↑ https://arxiv.org/pdf/2008.12314.pdf#subsection.3.3
- ↑ https://arxiv.org/pdf/2008.12314.pdf#subsection.4.3