Template:Model card ORES article topic/hu
Model card | |
---|---|
This page is an on-wiki machine learning model card. | |
Model Information Hub | |
Model creator(s) | Aaron Halfaker (User:EpochFail) and Amir Sarabadani |
Model owner(s) | WMF Machine Learning Team (ml@wikimediafoundation.org) |
Model interface | Ores homepage |
Code | ORES Github, ORES training data és ORES model binaries |
Uses PII | No |
In production? | Yes |
Which projects? | {{{language}}} {{{project}}} |
Ez a modell a cikk szövegét használja a cikk egy sor témához való valószínûségének előrejelzéséhez . | |
Motiváció
editHogyan tudjuk megjósolni, hogy melyik általános témában van egy cikk? A kérdésre való válasz hasznos a Wikipédia dinamikájának különböző elemzéseihez. Azonban nehéz a Wikipédia cikkek nagyon különböző sorát koherens, következetes témákba csoportosítani kézzel.
Ez a modell, amely az ORES modellcsomag része, elemzi egy cikket, hogy megjósolja a témák egy csoportjához való tartozásának valószínűségét. Hasonló modelleket (még nem feltétlenül ugyanazzal a teljesítményszintgel vagy témákkal, de több tucat más projektben is alkalmaznak.
Ez a modell hasznos lehet a Wikipédia dinamikai magas szintű elemzéseihez (oldaltérnézés, cikkminőség, szerkesztési trendek) és a cikkek szűrésehez.
Használók és felhasználások
edit- a Wikipédia dinamika magas szintű elemzése, mint például a oldalnézet, a cikk minőség, vagy a szerkesztési trendek - pl. Hogyan különböznek a oldalnézetek dinamika a fizika és a biológia kategóriák között?
- a releváns cikkekre való szűrés - pl. a zene kategóriába tartozó cikkekre való csak szűrő cikkek.
- véglegesen megállapítja, hogy a cikk milyen témára vonatkozik
- a cikkek vagy témák automatikus szerkesztése emberi beépítés nélkül
Ez a modell az ORES része, és általában API-n keresztül elérhető. A Wikipédia, a platform kutatása és más wiki-felügyelő feladatok magas szintű elemzéséhez használják.
Example API call:{{{model_input}}}
Étikai megfontolások, figyelmeztetések és ajánlások
edit- Ez a modell több évre (2020 közepétől) idősebb adatokon alapul.
- Ez a modell a Word2vec-t használja oktatási funkcióként. A Word2vec, mint más természetes nyelvbehelyezések, kódolja az alapvetõ adatkészletek nyelvi előítéleteit - a nem, faji, etnikai, vallási stb.
- Ez a modell nagyon változó teljesítményű különböző témák között - lásd a következő vizsgálati statisztikákat, hogy megértsük a témák közötti teljesítményét.
Módellátás
editA teljesítmény
editTest data confusion matrix: {{{confusion_matrix}}}
Test data sample rates: {{{sample_rates}}}
Test data performance: {{{performance}}}
A végrehajtás
edit{{{model_input}}}
Output:
{{{model_output}}}Adatok
editA jogosítványok
edit- Code: MIT license
- Model: MIT license
Címelt
editCite this model card as:
@misc{
Triedman_Bazira_2023_{{{language}}}_{{{project}}}_article_topic,
title={ {{{language}}} {{{project}}} article topic model card },
author={ Triedman, Harold and Bazira, Kevin },
year={ 2023 },
url={ https://meta.wikimedia.org/wiki/Model_card_ORES_article_topic/hu }
}