Research:Recommending links to increase visibility of articles/Link-translation

This page explores the idea of recommending new links to orphan articles from existing links in other Wikipedias.

Exploratory analysis

We explore the network of links between Wikipedia articles considering all languages and mapping articles to their Wikidata-item.

How many orphan articles are there

For each Wikipedia project, the table reports the following numbers (click to unfold):

N, the number of articles (main namespace, no redirects)
No, the number of orphan-articles (i.e. no incoming links from other main namespace articles in the same project)
Po, the percentage of orphan-articles in each project

Some observations:

in total, there are roughly 8.4M orphan articles in Wikipedia projects. this corresponds to 14.6% of all articles (57M)
large Wikipedias (in terms of articles) have a relatively small percentage of orphan articles (<10%), however, the absolute number often still exceeds 100,000 articles. For example, in enwiki the 4.7% imply close to 300k orphan articles.
among the 20 largest Wikipedias with the highest fraction of orphans are: arzwiki (81.9%), viwiki (51.5%), fawiki (22.3%), arwiki (20.9%), svwiki (17.2%)
for many of the smaller Wikipedias, the fraction of orphan articles is consistently higher (consistently above 30%)

Click [show] to see all results in the table:

wiki_db	N	No	Po
enwiki	6,385,659	298,908	4.7
cebwiki	5,953,757	637,114	10.7
svwiki	2,910,832	501,736	17.2
dewiki	2,619,091	197,354	7.5
frwiki	2,363,875	39,960	1.7
nlwiki	2,067,850	275,892	13.3
ruwiki	1,757,948	46,643	2.7
itwiki	1,719,115	78,371	4.6
eswiki	1,662,659	130,652	7.9
plwiki	1,491,302	105,247	7.1
arzwiki	1,341,002	1,098,234	81.9
jawiki	1,292,796	42,658	3.3
viwiki	1,268,943	653,299	51.5
warwiki	1,265,580	74,435	5.9
zhwiki	1,232,696	152,473	12.4
arwiki	1,138,549	238,368	20.9
ukwiki	1,116,468	50,491	4.5
ptwiki	1,074,776	86,796	8.1
fawiki	835,820	186,297	22.3
cawiki	688,534	32,881	4.8
srwiki	649,939	50,933	7.8
idwiki	597,995	54,060	9
nowiki	565,713	30,005	5.3
kowiki	553,722	46,753	8.4
fiwiki	517,193	26,256	5.1
huwiki	492,581	18,713	3.8
cswiki	489,152	27,509	5.6
shwiki	455,880	52,721	11.6
zh_min_nanwiki	430,975	310,343	72
trwiki	428,977	30,500	7.1
rowiki	423,411	20,939	4.9
cewiki	418,886	203,585	48.6
euwiki	377,072	90,333	24
mswiki	354,176	56,784	16
ttwiki	319,996	134,430	42
eowiki	304,129	11,098	3.6
hewiki	303,687	14,427	4.8
hywiki	288,215	72,793	25.3
bgwiki	275,312	37,602	13.7
dawiki	269,853	25,698	9.5
azbwiki	240,896	191,103	79.3
skwiki	237,697	12,908	5.4
kkwiki	233,024	92,666	39.8
minwiki	225,051	164,370	73
etwiki	222,348	9,146	4.1
bewiki	209,176	5,882	2.8
elwiki	197,852	22,360	11.3
ltwiki	197,736	14,713	7.4
simplewiki	196,964	20,916	10.6
hrwiki	195,488	12,767	6.5
azwiki	178,664	32,343	18.1
glwiki	176,642	10,166	5.8
slwiki	173,719	10,849	6.2
urwiki	167,917	46,137	27.5
nnwiki	159,735	23,483	14.7
kawiki	156,853	23,351	14.9
hiwiki	153,074	48,810	31.9
tawiki	145,393	45,623	31.4
thwiki	141,383	12,458	8.8
uzwiki	139,780	64,098	45.9
lawiki	136,062	1,610	1.2
cywiki	133,709	40,994	30.7
astwiki	128,111	30,580	23.9
vowiki	127,044	94,635	74.5
zh_yuewiki	119,772	17,863	14.9
mkwiki	117,404	17,593	15
bnwiki	113,740	20,509	18
lvwiki	109,028	8,538	7.8
mywiki	104,501	32,183	30.8
tgwiki	104,406	52,951	50.7
afwiki	100,366	29,788	29.7
mgwiki	94,260	48,943	51.9
sqwiki	92,887	24,817	26.7
bswiki	87,547	3,763	4.3
ocwiki	87,091	6,667	7.7
ndswiki	82,715	40,349	48.8
mrwiki	81,420	8,567	10.5
kywiki	80,945	57,565	71.1
mlwiki	76,635	9,063	11.8
be_x_oldwiki	76,076	4,226	5.6
tewiki	73,087	5,634	7.7
newwiki	73,058	31,007	42.4
brwiki	70,150	5,347	7.6
vecwiki	68,647	1,655	2.4
swwiki	67,320	8,671	12.9
pmswiki	65,866	37,016	56.2
jvwiki	64,918	13,011	20
pnbwiki	64,623	19,759	30.6
htwiki	64,561	43,176	66.9
suwiki	61,144	36,538	59.8
lbwiki	60,243	3,094	5.1
bawiki	58,575	26,835	45.8
gawiki	55,894	8,790	15.7
szlwiki	54,350	49,088	90.3
iswiki	53,251	4,501	8.5
kuwiki	50,555	7,275	14.4
lmowiki	49,175	7,091	14.4
cvwiki	47,007	17,083	36.3
fywiki	46,512	6,351	13.7
tlwiki	43,556	8,879	20.4
wuuwiki	42,692	20,579	48.2
anwiki	40,540	2,173	5.4
scowiki	40,512	5,028	12.4
diqwiki	40,136	2,535	6.3
pawiki	38,344	16,755	43.7
ckbwiki	34,925	6,082	17.4
yowiki	33,781	17,488	51.8
newiki	32,567	8,010	24.6
barwiki	31,761	8,857	27.9
iowiki	30,873	3,830	12.4
guwiki	29,832	2,508	8.4
knwiki	28,053	9,863	35.2
alswiki	27,989	1,423	5.1
nostalgiawiki	27,375	1,522	5.6
scnwiki	26,453	3,959	15
bpywiki	25,162	10,635	42.3
iawiki	23,321	6,137	26.3
quwiki	23,171	2,431	10.5
mnwiki	22,648	5,255	23.2
siwiki	21,435	7,169	33.4
nvwiki	17,027	200	1.2
bat_smgwiki	16,943	2,430	14.3
xmfwiki	16,675	2,515	15.1
sdwiki	16,437	6,644	40.4
avkwiki	16,356	963	5.9
orwiki	15,886	2,845	17.9
gdwiki	15,632	1,054	6.7
amwiki	15,598	4,107	26.3
cdowiki	15,520	3,677	23.7
yiwiki	15,382	1,996	13
ilowiki	15,349	493	3.2
sahwiki	14,939	4,175	27.9
napwiki	14,759	1,031	7
maiwiki	14,559	3,666	25.2
pswiki	14,204	5,595	39.4
bugwiki	14,194	149	1
oswiki	14,159	2,267	16
frrwiki	14,057	180	1.3
map_bmswiki	13,971	5,755	41.2
hsbwiki	13,793	2,090	15.2
mznwiki	13,680	4,963	36.3
fowiki	13,653	1,369	10
liwiki	13,490	462	3.4
hawiki	13,210	6,324	47.9
emlwiki	12,920	1,746	13.5
gorwiki	12,842	2,156	16.8
acewiki	12,620	10,079	79.9
crhwiki	11,942	1,902	15.9
bowiki	11,780	9,241	78.4
sawiki	11,673	1,729	14.8
bclwiki	11,621	3,197	27.5
wawiki	11,384	1,028	9
zh_classicalwiki	11,069	2,735	24.7
lijwiki	10,774	361	3.4
mrjwiki	10,533	3,161	30
shnwiki	10,387	990	9.5
mhrwiki	10,331	898	8.7
zuwiki	10,327	2,717	26.3
kmwiki	10,221	2,559	25
hifwiki	10,202	6,049	59.3
aswiki	9,715	2,086	21.5
testwiki	9,592	6,294	65.6
banwiki	9,586	1,127	11.8
hakwiki	9,523	1,765	18.5
roa_tarawiki	9,317	202	2.2
hywwiki	9,218	3,308	35.9
pamwiki	8,922	1,613	18.1
nsowiki	8,505	282	3.3
iewiki	8,464	1,559	18.4
sowiki	8,306	2,980	35.9
ruewiki	8,227	824	10
sewiki	7,977	1,530	19.2
ugwiki	7,755	3,370	43.5
snwiki	7,707	3,000	38.9
bhwiki	7,570	1,364	18
tkwiki	7,540	2,223	29.5
vlswiki	7,520	346	4.6
nds_nlwiki	7,350	786	10.7
miwiki	7,268	3,684	50.7
scwiki	7,249	2,194	30.3
nahwiki	7,187	1,340	18.6
myvwiki	6,697	674	10.1
vepwiki	6,669	1,038	15.6
satwiki	6,632	3,044	45.9
glkwiki	6,597	729	11.1
ganwiki	6,525	821	12.6
kabwiki	6,251	801	12.8
cowiki	6,069	766	12.6
fiu_vrowiki	5,944	901	15.2
abwiki	5,844	657	11.2
kvwiki	5,539	621	11.2
csbwiki	5,419	2,397	44.2
pcdwiki	5,346	1,528	28.6
frpwiki	5,178	554	10.7
aywiki	5,156	1,172	22.7
udmwiki	5,130	971	18.9
gvwiki	5,046	621	12.3
pagwiki	4,966	284	5.7
lowiki	4,857	1,798	37
kwwiki	4,794	1,069	22.3
zeawiki	4,793	475	9.9
lfnwiki	4,744	1,152	24.3
arywiki	4,657	1,218	26.2
nrmwiki	4,620	767	16.6
bjnwiki	4,524	1,039	23
szywiki	4,459	2,609	58.5
gnwiki	4,416	772	17.5
dvwiki	4,320	1,207	27.9
mtwiki	4,291	909	21.2
lezwiki	4,225	534	12.6
gomwiki	4,197	2,545	60.6
mwlwiki	4,132	2,405	58.2
stqwiki	4,118	288	7
olowiki	4,027	1,077	26.7
rmwiki	3,774	494	13.1
awawiki	3,718	1,523	41
ladwiki	3,620	839	23.2
dtywiki	3,611	951	26.3
furwiki	3,575	511	14.3
koiwiki	3,491	237	6.8
extwiki	3,459	1,095	31.7
angwiki	3,442	1,256	36.5
lnwiki	3,351	893	26.6
cbk_zamwiki	3,337	820	24.6
dsbwiki	3,323	688	20.7
tyvwiki	3,289	2,029	61.7
piwiki	3,230	2,629	81.4
gagwiki	2,957	713	24.1
kshwiki	2,917	691	23.7
bxrwiki	2,756	588	21.3
pflwiki	2,746	291	10.6
avwiki	2,628	658	25
lgwiki	2,558	1,958	76.5
igwiki	2,540	1,442	56.8
rwwiki	2,500	1,249	50
hawwiki	2,452	604	24.6
gcrwiki	2,380	1,887	79.3
xalwiki	2,317	624	26.9
papwiki	2,317	635	27.4
zawiki	2,122	748	35.2
pdcwiki	2,109	1,029	48.8
krcwiki	2,069	230	11.1
kaawiki	2,064	982	47.6
test2wiki	2,046	1,118	54.6
kbpwiki	1,958	1,059	54.1
inhwiki	1,881	358	19
tcywiki	1,825	780	42.7
arcwiki	1,819	460	25.3
towiki	1,778	190	10.7
jamwiki	1,734	764	44.1
akwiki	1,713	1,382	80.7
wowiki	1,693	565	33.4
tpiwiki	1,665	212	12.7
nawiki	1,661	536	32.3
kiwiki	1,632	1,049	64.3
kbdwiki	1,631	685	42
novwiki	1,610	292	18.1
mdfwiki	1,595	342	21.4
tetwiki	1,592	287	18
atjwiki	1,588	940	59.2
biwiki	1,542	1,043	67.6
lldwiki	1,498	109	7.3
xhwiki	1,463	652	44.6
mnwwiki	1,459	795	54.5
tywiki	1,339	880	65.7
jbowiki	1,335	306	22.9
roa_rupwiki	1,331	405	30.4
kgwiki	1,277	413	32.3
lbewiki	1,262	457	36.2
omwiki	1,226	346	28.2
fjwiki	1,218	616	50.6
srnwiki	1,197	765	63.9
bmwiki	1,178	412	35
nqowiki	1,137	360	31.7
smwiki	1,077	246	22.8
chrwiki	1,034	467	45.2
twwiki	1,030	734	71.3
ltgwiki	1,017	202	19.9
stwiki	977	392	40.1
gotwiki	975	446	45.7
pihwiki	919	232	25.2
nywiki	909	445	49
klwiki	869	137	15.8
kswiki	865	252	29.1
tnwiki	856	547	63.9
cuwiki	817	186	22.8
rmywiki	796	461	57.9
chywiki	787	397	50.4
tswiki	734	153	20.8
tumwiki	726	428	59
rnwiki	725	511	70.5
ikwiki	720	402	55.8
vewiki	713	167	23.4
iuwiki	689	346	50.2
eewiki	650	114	17.5
ffwiki	648	345	53.2
adywiki	581	202	34.8
sswiki	576	181	31.4
chwiki	557	390	70
sgwiki	540	347	64.3
pntwiki	530	178	33.6
dinwiki	507	404	79.7
tiwiki	378	144	38.1
dzwiki	303	100	33
crwiki	174	126	72.4

Characterizing orphan articles

We characterize orphan articles by checking whether they have a certain property x:

disambiguation: page is a disambiguation page
bot-created: page was created by a bot
gender (woman): article is about a woman (considering only biography-articles)
quality (higher): article's quality score belongs to the top-50 percentile of all articles
age (newer): article age (time since creation date) belongs to the bottom 50-percentile of all articles

The first column summarizes the total number of orphan articles in the project:

N, the total number of articles
No, the number of articles that are orphan

The other columns show how common articles with property x are among orphan articles:

Nxo, the number of articles that are orphan and belong to the class x
logExo, the enrichment of property x among orphan articles. This is useful to see whether a given property x is very common (or uncommon) among orphan artilces. if this is positive (>0), it means that x occurs more frequently among orphan articles than in the population of all articles. if this is negative (<0), then x occurs less frequently than in the overall population of articles.

As an example, lets consider disambiguation pages in enwiki:

from the 299k orphan articles (No), roughly 147k are disambiguation pages (Nxo) which means that the conditional probability of being a disambiguation page given that is is an orphan is P(x|o)=0.49. is this a high or low probability?
for this, we have to compare with the overall number of disambiguation pages in Wikipedia: from the 6.4M articles in enwiki (N), there are in total 289k disambiguation pages (not shown in this table); which translates into a probability of P(x)=0.045. This means that, overall, disambiguation pages are much less common.
now we simply compare the two probabilities, P(x|o) and P(x), by taking the logarithm of the ratio via logExo=log P(x|o)/P(x). The nice property is that if P(x|o)>P(x) then logExo>0 (property x is more common among orphans) and if P(x|o)<P(x) then logExo<0 (property x is less common among orphans).
in this case we get that P(x|o) is much larger than P(x). in fact P(x|o)/P(x)=11 such that logExo=log(11)=2.39

Some observations:

disambiguation pages are very common among orphan articles. For enwiki, roughly half of all orphans are disambiguation pages, though there are still more than 150k orphans which are not disambiguation pages.
bot created pages: for some languages we see a substantial number of orphan articles that were created by bots, such as cebwiki (632k), svwiki (435k), viwiki (495k), etc. Some of these are known to contain many bot-created articles. Thus, while the absolute number of orphan articles created by bots is large, this is not more common than for the rest of the articles in these projects (logExo~0)
gender: articles on women are over-represented among orphan-articles. We know that overall, between 15-20% of biography articles are on women. However, when considering orphan articles the fraction of biography-articles on women is much higher (and thus logExo>0).
quality: higher-quality pages are under-represented among orphan articles (logExo<0). this means that orphan articles tend to have lower quality
age: newer pages are over-represented among orphan articles (logExo>0). this means that orphan articles tend to be younger.

Click [show] to see all results in the table:

	summary		disambiguation		bot-created		gender (woman)		quality (higher)		age (newer)
wiki_db	N	No	Nxo	logExo	Nxo	logExo	Nxo	logExo	Nxo	logExo	Nxo	logExo
enwiki	6,385,659	298,908	147,609	2.39	3,718	-0.75	9,728	0.41	39,361	-1.33	185,137	0.21
cebwiki	5,953,757	637,114	42,067	0.26	632,714	0	287	-0.03	412,372	0.26	303,954	-0.05
svwiki	2,910,832	501,736	40,762	0.58	435,543	0.17	5,237	0.11	332,377	0.28	433,601	0.55
dewiki	2,619,091	197,354	165,910	2.01	172	0.34	6	0.88	6,050	-2.79	100,154	0.02
frwiki	2,363,875	39,960	10,650	1.54	185	-1.98	2,079	0.21	10,924	-0.6	27,550	0.32
nlwiki	2,067,850	275,892	77,766	1.91	150,267	0.28	1,528	0.34	67,238	-0.72	152,790	0.1
ruwiki	1,757,948	46,643	15,890	1.31	710	-1.73	2,666	0.42	15,276	-0.42	37,639	0.48
itwiki	1,719,115	78,371	67,072	2.54	17,220	1.2	56	0.34	2,926	-2.59	41,844	0.07
eswiki	1,662,659	130,652	15,212	1.25	109	-0.32	12,516	0.46	55,548	-0.16	90,917	0.33
plwiki	1,491,302	105,247	33,748	1.78	13,318	0.02	3,426	-0.03	23,790	-0.79	74,064	0.34
arzwiki	1,341,002	1,098,234	22	-1.47	1	-2.37	87,784	-0.09	538,152	-0.02	549,865	0
jawiki	1,292,796	42,658	18,641	2.02	10	0.03	1,962	0.19	7,583	-1.03	33,301	0.45
viwiki	1,268,943	653,299	1,256	-1.45	495,713	0.25	6,569	0.46	280,765	-0.15	426,813	0.27
warwiki	1,265,580	74,435	1,637	1.97	65,593	-0.02	375	0.15	32,537	-0.13	65,577	0.57
zhwiki	1,232,696	152,473	6,334	0.2	46,701	0.86	1,938	-0.02	24,791	-1.12	92,989	0.2
arwiki	1,138,549	238,368	4,031	-0.45	146,363	0.38	33,623	0.1	97,455	-0.2	213,207	0.58
ukwiki	1,116,468	50,491	6,060	0.71	14,719	0.3	2,337	0.52	27,045	0.07	43,215	0.54
ptwiki	1,074,776	86,796	5,238	0.75	18,058	0.52	6,091	0.43	30,375	-0.35	65,053	0.4
fawiki	835,820	186,297	12,220	0.89	72,827	0.1	8,798	0.1	82,247	-0.13	127,790	0.32
cawiki	688,534	32,881	3,297	1.42	1,166	-1.1	4,105	0.8	11,372	-0.37	24,036	0.38
srwiki	649,939	50,933	29,336	2.19	22,494	-0.13	1,062	0.27	9,738	-0.96	29,142	0.13
idwiki	597,995	54,060	1,255	0.83	21,741	0.41	2,127	0.04	19,636	-0.31	40,546	0.41
nowiki	565,713	30,005	3,853	1.67	10	-3.8	2,674	0.12	10,614	-0.35	20,067	0.29
kowiki	553,722	46,753	14,846	1.29	4,348	0.87	2,769	0.52	9,287	-0.92	35,231	0.41
fiwiki	517,193	26,256	7,062	1.98	85	-1.27	1,081	0.09	5,814	-0.81	17,977	0.31
huwiki	492,581	18,713	3,895	1.54	431	-1.95	916	0	6,009	-0.44	11,440	0.2
cswiki	489,152	27,509	8,682	1.79	93	-0.61	1,179	0.43	7,027	-0.67	19,682	0.36
shwiki	455,880	52,721	22,919	1.88	43,813	0.4	377	-0.03	20,450	-0.25	33,749	0.25
zh_min_nanwiki	430,975	310,343	2,426	0.19	304,816	0.05	252	0.12	189,868	0.2	196,181	0.23
trwiki	428,977	30,500	3,384	1.36	2,113	0.51	2,866	0.56	13,820	-0.11	22,012	0.37
rowiki	423,411	20,939	4,648	1.9	8,870	-0.03	525	0.18	8,825	-0.17	16,104	0.43
cewiki	418,886	203,585	212	0.15	193,084	0.03	136	0.6	136,270	0.24	103,901	0.02
euwiki	377,072	90,333	1,362	0.06	72,139	0.41	358	-1.25	45,222	0	57,593	0.24
mswiki	354,176	56,784	1,098	0.68	20,773	0.79	720	-0.62	34,564	0.2	38,269	0.3
ttwiki	319,996	134,430	434	-1.07	124,031	0.07	980	0.37	82,316	0.2	91,895	0.31
eowiki	304,129	11,098	1,851	1.56	1,007	-0.24	699	0.51	3,900	-0.35	6,667	0.18
hewiki	303,687	14,427	7,251	2.32	7	-2.57	936	0.48	3,083	-0.85	9,454	0.27
hywiki	288,215	72,793	9,410	1.12	15,860	-0.09	4,960	0.27	27,646	-0.27	46,507	0.25
bgwiki	275,312	37,602	1,844	0.4	19,534	1.39	1,891	0.71	16,658	-0.12	32,302	0.54
dawiki	269,853	25,698	2,040	0.67	6,175	1.4	1,442	-0.16	10,427	-0.21	20,566	0.47
azbwiki	240,896	191,103	115	-0.48	166,777	0.1	11,049	0.01	88,285	-0.08	111,491	0.15
skwiki	237,697	12,908	7,391	1.81	3,078	-0.4	183	0.24	2,542	-0.93	7,346	0.13
kkwiki	233,024	92,666	481	-0.85	40,205	-0.18	1,879	0.17	42,937	-0.08	22,761	-0.71
minwiki	225,051	164,370	28	-0.38	1	-6.7	82	0.18	84,301	0.03	98,110	0.18
etwiki	222,348	9,146	2,449	2.18	8	-1.45	174	-0.08	3,150	-0.37	7,181	0.45
bewiki	209,176	5,882	730	0.99	284	-1.61	528	0.65	2,413	-0.2	3,971	0.3
elwiki	197,852	22,360	1,979	1.13	2	-3.64	1,711	0.32	8,368	-0.29	15,983	0.36
ltwiki	197,736	14,713	1,796	1.14	13	-2.98	347	-0.08	3,521	-0.74	9,176	0.22
simplewiki	196,964	20,916	1,254	1.09	13	-3.73	2,021	0.43	9,999	-0.04	13,986	0.29
hrwiki	195,488	12,767	1,419	1.1	349	-1	525	0.19	4,717	-0.3	9,528	0.4
azwiki	178,664	32,343	440	-0.57	11	-3.62	1,751	0.24	16,041	0	25,967	0.47
glwiki	176,642	10,166	1,442	1.08	1	2.16	1,581	0.69	4,931	-0.03	7,505	0.39
slwiki	173,719	10,849	1,375	0.83	4	-2.65	316	-0.03	3,936	-0.32	8,646	0.47
urwiki	167,917	46,137	865	0.47	36,018	0.41	1,565	0.61	23,094	0	22,217	-0.04
nnwiki	159,735	23,483	508	0.19	0	nan	708	-0.55	6,426	-0.6	17,593	0.4
kawiki	156,853	23,351	1,131	0.7	2,100	0.96	1,381	0.58	10,301	-0.12	17,835	0.42
hiwiki	153,074	48,810	293	-0.39	5,767	0.23	1,606	0.24	17,516	-0.33	23,850	-0.02
tawiki	145,393	45,623	174	-0.6	12,031	0.48	2,195	0.11	22,070	-0.03	33,116	0.37
thwiki	141,383	12,458	1,015	1.11	0	nan	522	0.14	3,880	-0.48	9,079	0.38
uzwiki	139,780	64,098	220	-1.27	60,172	0.1	223	-0.29	38,242	0.17	40,008	0.22
lawiki	136,062	1,610	207	1.66	0	nan	69	0.01	629	-0.25	1,109	0.32
cywiki	133,709	40,994	1,235	0.42	17,938	0.33	7,596	0.47	24,767	0.19	28,328	0.32
astwiki	128,111	30,580	263	-0.27	21,986	-0.01	7,987	0.19	15,339	0	16,199	0.06
vowiki	127,044	94,635	5,067	0.13	85,435	0.05	1,252	-0.02	0	nan	55,026	0.15
zh_yuewiki	119,772	17,863	3,346	1.13	0	nan	1,728	0.46	6,846	-0.27	10,040	0.12
mkwiki	117,404	17,593	204	-0.03	5,773	0.75	1,299	0.76	9,544	0.09	12,521	0.35
bnwiki	113,740	20,509	210	-0.13	1,069	0.27	2,851	0.47	8,608	-0.17	14,677	0.36
lvwiki	109,028	8,538	2,862	1.66	3	1.45	394	0.62	2,100	-0.71	5,323	0.22
mywiki	104,501	32,183	216	0.53	19,600	-0.07	222	0.13	6,257	-0.94	1,301	-2.52
tgwiki	104,406	52,951	121	-0.37	1,693	-2.13	367	-0.78	24,044	-0.1	27,723	0.05
afwiki	100,366	29,788	172	-0.28	23,533	0.83	10,809	0.22	18,299	0.2	26,175	0.56
mgwiki	94,260	48,943	853	0.49	47,332	0.06	173	0.03	31,458	0.25	15,617	-0.45
sqwiki	92,887	24,817	316	0.35	843	-1.06	1,659	0.36	9,439	-0.27	18,640	0.41
bswiki	87,547	3,763	2,176	2.39	267	-0.83	107	0.71	509	-1.3	2,842	0.41
ocwiki	87,091	6,667	169	0.04	845	-1.22	514	0.65	573	-1.76	5,590	0.52
ndswiki	82,715	40,349	32,750	0.42	4	-4.9	24	-0.22	7,842	-0.94	28,506	0.35
mrwiki	81,420	8,567	33	0.44	18	-1.7	346	0.16	3,364	-0.23	5,443	0.24
kywiki	80,945	57,565	223	-0.27	42,371	0.17	365	-0.12	29,279	0.02	32,840	0.13
mlwiki	76,635	9,063	71	-0.18	0	nan	1,033	0.35	3,678	-0.21	7,454	0.5
be_x_oldwiki	76,076	4,226	502	0.55	0	nan	240	0.54	1,700	-0.22	3,199	0.41
tewiki	73,087	5,634	1,475	1.53	920	-0.88	176	0.32	1,235	-0.82	4,408	0.45
newwiki	73,058	31,007	65	-0.26	29,703	0.1	49	0.69	15,477	0.01	17,234	0.11
brwiki	70,150	5,347	530	0.39	1	2.57	398	0.26	1,824	-0.38	3,971	0.4
vecwiki	68,647	1,655	54	2.89	290	-1.12	55	0.27	537	-0.43	498	-0.51
swwiki	67,320	8,671	749	1.25	90	1.98	785	0.27	5,286	0.2	5,997	0.32
pmswiki	65,866	37,016	1,272	0.4	29,493	0.11	215	0.33	10,612	-0.55	26,802	0.37
jvwiki	64,918	13,011	94	0.26	13	-3.62	332	0.15	7,472	0.14	11,369	0.56
pnbwiki	64,623	19,759	35	-0.72	0	nan	1,621	0.6	10,947	0.1	11,943	0.19
htwiki	64,561	43,176	127	-2.52	0	nan	736	-0.71	23,806	0.1	19,911	-0.08
suwiki	61,144	36,538	32	-1.3	13,858	0.16	181	0.36	18,329	0.01	27,025	0.39
lbwiki	60,243	3,094	632	2.01	3	-3.33	111	0.31	1,072	-0.37	1,910	0.21
bawiki	58,575	26,835	38	-2.07	17,881	0.33	1,307	0.53	13,065	-0.02	9,258	-0.37
gawiki	55,894	8,790	72	0.35	2,793	0.97	435	0.25	2,854	-0.43	4,529	0.03
szlwiki	54,350	49,088	95	-0.2	42,504	0.09	79	0.31	26,203	0.07	26,398	0.07
iswiki	53,251	4,501	297	1.1	0	nan	92	-0.15	1,621	-0.33	3,021	0.29
kuwiki	50,555	7,275	81	-0.3	2	-4.04	363	0.62	3,522	-0.03	3,868	0.06
lmowiki	49,175	7,091	363	1.03	3,456	-0.03	263	0.24	2,103	-0.52	5,905	0.51
cvwiki	47,007	17,083	255	-0.3	13,408	0.48	236	1.22	11,299	0.28	9,518	0.11
fywiki	46,512	6,351	1,560	1.78	1	1.99	316	-0.26	1,378	-0.83	4,486	0.35
tlwiki	43,556	8,879	566	0.23	0	nan	957	0.2	2,996	-0.37	6,594	0.4
wuuwiki	42,692	20,579	57	-0.22	279	-1.46	1,064	0.28	0	nan	13,586	0.28
anwiki	40,540	2,173	219	1.23	40	-1.74	163	0.39	831	-0.27	1,798	0.5
scowiki	40,512	5,028	1,134	1.56	1	-1.76	363	0.19	1,725	-0.38	2,861	0.13
diqwiki	40,136	2,535	99	1.63	0	nan	180	0.4	857	-0.36	534	-0.86
pawiki	38,344	16,755	24	-0.45	0	nan	2,798	0.28	8,321	-0.01	10,928	0.27
ckbwiki	34,925	6,082	80	0.65	644	-0.57	558	0.32	2,509	-0.19	3,759	0.21
yowiki	33,781	17,488	6	-0.49	2	0.66	512	0.8	3,549	-0.84	14,453	0.5
newiki	32,567	8,010	27	-0.31	389	0.65	751	0.26	2,881	-0.32	4,442	0.1
barwiki	31,761	8,857	2,170	1.02	1,265	1.14	64	0.35	3,132	-0.35	7,505	0.53
iowiki	30,873	3,830	265	1.24	0	nan	34	0.52	731	-0.96	3,041	0.46
guwiki	29,832	2,508	32	1.62	0	nan	145	0.39	2,056	0.5	2,181	0.55
knwiki	28,053	9,863	110	0.35	0	nan	531	0.24	5,040	0.02	7,358	0.4
alswiki	27,989	1,423	512	1.8	0	nan	54	0.78	347	-0.72	770	0.08
nostalgiawiki	27,375	1,522	0	nan	0	nan			0	nan	635	-0.18
scnwiki	26,453	3,959	954	1.36	0	nan	99	0.65	0	nan	1,445	-0.31
bpywiki	25,162	10,635	353	0.54	10,157	0.05	2	-0.3	5,319	0	1,151	-1.53
iawiki	23,321	6,137	146	0.54	1	-4.36	174	0.3	1,487	-0.72	5,276	0.54
quwiki	23,171	2,431	131	0.91	1	-5.71	177	0.13	1,171	-0.04	2,082	0.54
mnwiki	22,648	5,255	50	0	69	0.1	403	0.6	1,765	-0.4	2,732	0.04
siwiki	21,435	7,169	23	0.19	0	nan	181	0.23	2,939	-0.2	2,964	-0.19
nvwiki	17,027	200	0	nan	0	nan	0	nan	0	nan	6	-2.81
bat_smgwiki	16,943	2,430	35	0.91	0	nan	139	0.24	0	nan	1,553	0.25
xmfwiki	16,675	2,515	8	0.1	1	-4.11	211	0.23	1,101	-0.13	1,456	0.15
sdwiki	16,437	6,644	186	0.56	30	0.28	196	0.33	1,949	-0.53	3,448	0.04
avkwiki	16,356	963	1	0.64	0	nan	7	0.19	16	-3.39	872	0.59
orwiki	15,886	2,845	24	0.29	613	-0.06	331	0.65	1,398	-0.01	2,354	0.5
gdwiki	15,632	1,054	69	1.39	0	nan	17	0.41	263	-0.7	699	0.28
amwiki	15,598	4,107	39	0.63	1,805	1.24	77	0.69	1,008	-0.71	1,657	-0.21
cdowiki	15,520	3,677	22	0.2	3,010	0.36	21	0.88	0	nan	3,146	0.54
yiwiki	15,382	1,996	40	0.65	0	nan	110	1	613	-0.49	1,333	0.29
ilowiki	15,349	493	212	3.09	0	nan	10	0.03	150	-0.5	217	-0.13
sahwiki	14,939	4,175	49	0.2	0	nan	114	0.01	2,068	-0.01	3,258	0.45
napwiki	14,759	1,031	9	1.77	1	-6.33	52	0.36	0	nan	920	0.58
maiwiki	14,559	3,666	3	-0.41	2	1.38	826	0.11	1,369	-0.29	2,322	0.24
pswiki	14,204	5,595	145	0.51	521	0.27	141	0.28	2,243	-0.21	3,129	0.11
bugwiki	14,194	149	1	3.17	0	nan	3	0.29	0	nan	100	0.29
oswiki	14,159	2,267	153	0.77	5	-4.37	29	0.38	880	-0.26	1,768	0.44
frrwiki	14,057	180	53	2.65	1	3.66	4	0.82	25	-1.28	60	-0.41
map_bmswiki	13,971	5,755	6	-0.79	3,274	0.13	29	0.2	2,521	-0.13	3,729	0.26
hsbwiki	13,793	2,090	339	1.58	0	nan	13	0.44	332	-1.15	1,675	0.47
mznwiki	13,680	4,963	38	-0.16	3,222	0.14	94	0.38	3,798	0.43	2,019	-0.21
fowiki	13,653	1,369	32	1	0	nan	141	0.44	455	-0.41	732	0.07
liwiki	13,490	462	153	2.09	0	nan	4	0.15	133	-0.55	225	-0.03
hawiki	13,210	6,324	33	-0.32	0	nan	1,391	0.12	3,466	0.1	3,807	0.19
emlwiki	12,920	1,746	7	1	0	nan	66	-0.48	818	-0.07	1,118	0.25
gorwiki	12,842	2,156	1	1.09	0	nan	4	-0.17	124	-2.15	78	-2.63
acewiki	12,620	10,079	1	-0.47	0	nan	64	0.03	5,569	0.1	6,072	0.19
crhwiki	11,942	1,902	7	1.08	1,225	1.33	36	0.22	0	nan	449	-0.75
bowiki	11,780	9,241	3	-0.45	0	nan	38	0.25	0	nan	5,298	0.14
sawiki	11,673	1,729	16	0.75	0	nan	73	0.34	545	-0.46	1,185	0.32
bclwiki	11,621	3,197	15	0.6	0	nan	434	0.05	1,842	0.14	2,390	0.4
wawiki	11,384	1,028	49	-0.21	0	nan	37	0.54	225	-0.83	640	0.22
zh_classicalwiki	11,069	2,735	112	0.35	0	nan	42	0.41	869	-0.45	1,822	0.29
lijwiki	10,774	361	11	2.66	0	nan	20	1.07	99	-0.6	24	-2.02
mrjwiki	10,533	3,161	4	0.64	1,745	1.06	44	0.15	589	-0.99	1,891	0.18
shnwiki	10,387	990	26	1.1	0	nan	4	0.48	628	0.27	517	0.04
mhrwiki	10,331	898	22	0.03	25	-1.84	25	0.65	209	-0.77	282	-0.47
zuwiki	10,327	2,717	16	1.06	0	nan	149	0.18	935	-0.37	799	-0.53
kmwiki	10,221	2,559	12	-0.32	2	0.29	39	0.13	1,206	-0.05	1,070	-0.18
hifwiki	10,202	6,049	14	-0.36	1,972	0.52	43	0.49	2,405	-0.23	4,325	0.36
aswiki	9,715	2,086	6	-0.54	0	nan	317	0.41	1,033	-0.01	1,504	0.37
testwiki	9,592	6,294	0	nan	553	-0.05			2,750	-0.09	3,142	0
banwiki	9,586	1,127	5	0.61	0	nan	59	0.28	155	-1.28	356	-0.46
hakwiki	9,523	1,765	104	1.21	0	nan	37	0.55	0	nan	1,144	0.26
roa_tarawiki	9,317	202	2	0.21	2	-4.4	9	0.37	154	0.43	194	0.65
hywwiki	9,218	3,308	36	0.76	0	nan	190	0.14	1,450	-0.13	1,842	0.11
pamwiki	8,922	1,613	5	0.23	0	nan	105	0.3	656	-0.21	1,312	0.49
nsowiki	8,505	282	0	nan	0	nan	6	0.44	112	-0.23	75	-0.63
iewiki	8,464	1,559	1	-0.71	0	nan	308	0.28	0	nan	464	-0.52
sowiki	8,306	2,980	8	-0.7	1	1.03	87	-0.02	1,118	-0.29	1,983	0.29
ruewiki	8,227	824	16	0.46	0	nan	8	0.03	116	-1.27	274	-0.41
sewiki	7,977	1,530	8	0.79	73	-1.34	63	-0.02	640	-0.14	1,061	0.33
ugwiki	7,755	3,370	5	-0.5	1	0.14	27	-0.12	1,299	-0.26	1,609	-0.05
snwiki	7,707	3,000	12	-1.24	0	nan	14	0.4	0	nan	2,105	0.34
bhwiki	7,570	1,364	14	0.08	165	-0.45	81	-0.27	677	-0.01	839	0.21
tkwiki	7,540	2,223	11	1.05	0	nan	127	0.37	677	-0.48	1,900	0.54
vlswiki	7,520	346	68	2.12	0	nan	12	1.14	104	-0.51	260	0.41
nds_nlwiki	7,350	786	240	1.67	0	nan	22	0.35	273	-0.33	470	0.18
miwiki	7,268	3,684	10	-0.15	3,246	0.25	29	0.06	1,774	-0.04	2,813	0.42
scwiki	7,249	2,194	4	0.1	0	nan	183	0.23	914	-0.18	1,042	-0.05
nahwiki	7,187	1,340	24	0.65	0	nan	81	0.15	221	-1.11	1,214	0.59
myvwiki	6,697	674	12	-0.49	0	nan	32	-0.21	315	-0.07	530	0.45
vepwiki	6,669	1,038	20	-0.62	0	nan	94	0.04	244	-0.76	511	-0.02
satwiki	6,632	3,044	14	0.05	0	nan	567	0.24	1,288	-0.17	1,785	0.16
glkwiki	6,597	729	2	0.5	0	nan	14	0.79	523	0.37	569	0.45
ganwiki	6,525	821	7	0.21	1	-4.44	42	0.48	0	nan	602	0.38
kabwiki	6,251	801	18	1.09	0	nan	36	0.39	422	0.05	284	-0.34
cowiki	6,069	766	3	-0.62	0	nan	61	0.36	187	-0.72	522	0.31
fiu_vrowiki	5,944	901	307	1.59	0	nan	16	0.31	0	nan	659	0.38
abwiki	5,844	657	10	1.27	0	nan	10	0.13	275	-0.09	368	0.11
kvwiki	5,539	621	6	1.21	0	nan	12	0.56	202	-0.43	318	0.02
csbwiki	5,419	2,397	10	0.82	0	nan	107	0.4	663	-0.59	1,834	0.43
pcdwiki	5,346	1,528	17	0.35	0	nan	30	0.24	900	0.16	746	-0.02
frpwiki	5,178	554	9	0.77	0	nan	25	-0.1	141	-0.68	254	-0.09
aywiki	5,156	1,172	4	1.26	0	nan	83	0.3	224	-0.94	599	0.02
udmwiki	5,130	971	14	-0.19	33	0.14	14	-0.15	375	-0.26	311	-0.45
gvwiki	5,046	621	17	0.55	0	nan	30	-0.16	257	-0.19	487	0.45
pagwiki	4,966	284	4	2.3	0	nan	19	-0.05	0	nan	209	0.39
lowiki	4,857	1,798	298	0.98	0	nan	91	-0.15	611	-0.38	1,020	0.13
kwwiki	4,794	1,069	62	1.27	0	nan	80	0.03	574	0.05	865	0.48
zeawiki	4,793	475	11	0.9	196	0.13	20	0.42	0	nan	242	0.02
lfnwiki	4,744	1,152	4	-0.14	0	nan	25	0.4	0	nan	711	0.21
arywiki	4,657	1,218	5	0.06	26	-0.61	11	0.24	900	0.4	238	-0.94
nrmwiki	4,620	767	12	-0.22	0	nan	16	0.37	0	nan	736	0.65
bjnwiki	4,524	1,039	4	0.37	0	nan	40	0.27	576	0.09	538	0.03
szywiki	4,459	2,609	22	0.13	0	nan	27	0.03	0	nan	1,227	-0.06
gnwiki	4,416	772	6	0.83	1	1.74	25	0.28	296	-0.26	457	0.17
dvwiki	4,320	1,207	1	-1.12	0	nan	11	0.2	502	-0.18	976	0.48
mtwiki	4,291	909	11	0.29	0	nan	136	0.63	497	0.09	690	0.42
lezwiki	4,225	534	11	0.71	0	nan	32	0.36	256	-0.03	291	0.09
gomwiki	4,197	2,545	5	0.32	0	nan	63	0.1	1,117	-0.13	1,426	0.11
mwlwiki	4,132	2,405	4	-0.38	0	nan	156	0.2	957	-0.23	1,629	0.3
stqwiki	4,118	288	19	1.4	1	2.66	14	1.06	128	-0.12	226	0.45
olowiki	4,027	1,077	4	1.1	0	nan	22	0.42	414	-0.27	756	0.34
rmwiki	3,774	494	23	1.09	0	nan	29	0.66	286	0.15	422	0.54
awawiki	3,718	1,523	1	0.89	0	nan	5	-0.18	523	-0.37	582	-0.27
ladwiki	3,620	839	1	-1.58	0	nan	134	0.24	379	-0.1	495	0.17
dtywiki	3,611	951	1	0.64	0	nan	142	0.03	431	-0.1	608	0.25
furwiki	3,575	511	9	1.05	0	nan	14	0.54	0	nan	418	0.49
koiwiki	3,491	237	6	2.18	0	nan	4	-0.46	39	-1.11	104	-0.13
extwiki	3,459	1,095	9	0.02	0	nan	98	0.29	509	-0.07	696	0.24
angwiki	3,442	1,256	23	0.56	0	nan	70	0.53	549	-0.14	686	0.09
lnwiki	3,351	893	23	-0.13	0	nan	39	0.58	593	0.28	725	0.49
cbk_zamwiki	3,337	820	0	nan	0	nan	88	0.01	115	-1.27	364	-0.12
dsbwiki	3,323	688	9	0.28	0	nan	35	0.05	159	-0.77	500	0.37
tyvwiki	3,289	2,029	58	0.34	0	nan	619	0.15	1,065	0.05	1,134	0.11
piwiki	3,230	2,629	1	-0.49	2,530	0.21	1	0	0	nan	1,170	-0.12
gagwiki	2,957	713	1	0.73	4	-3.54	16	0.14	152	-0.85	514	0.37
kshwiki	2,917	691	5	0.48	4	1.03	32	0.07	0	nan	265	-0.26
bxrwiki	2,756	588	13	0.61	0	nan	27	0.49	147	-0.69	382	0.26
pflwiki	2,746	291	0	nan	0	nan	10	0.35	109	-0.28	210	0.37
avwiki	2,628	658	7	0.62	3	-2.56	8	-0.01	354	0.08	372	0.12
lgwiki	2,558	1,958	19	0.17	0	nan	77	0.05	1,042	0.07	1,143	0.15
igwiki	2,540	1,442	7	-0.48	0	nan	522	0.03	827	0.18	937	0.26
rwwiki	2,500	1,249	2	0.69	0	nan	36	0.09	481	-0.24	725	0.15
hawwiki	2,452	604	3	0.71	0	nan	32	-0.17	452	0.41	564	0.63
gcrwiki	2,380	1,887	3	0.23	0	nan	4	0.05	0	nan	953	0.01
xalwiki	2,317	624	2	0.91	0	nan	8	0.13	396	0.24	300	-0.06
papwiki	2,317	635	1	-0.9	0	nan	24	0.4	225	-0.34	430	0.32
zawiki	2,122	748	19	0.9	0	nan	17	0.19	0	nan	255	-0.38
pdcwiki	2,109	1,029	1	-0.38	0	nan	55	0.01	0	nan	624	0.19
krcwiki	2,069	230	3	-1.09	0	nan	11	0.24	134	0.3	200	0.55
kaawiki	2,064	982	12	0.66	0	nan	31	0.24	514	0.05	568	0.15
test2wiki	2,046	1,118	0	nan	130	-0.42			408	-0.31	678	0.19
kbpwiki	1,958	1,059	4	0.61	0	nan	23	-0.08	0	nan	598	0.12
inhwiki	1,881	358	2	-0.91	0	nan	1	0.17	147	-0.2	155	-0.14
tcywiki	1,825	780	0	nan	0	nan	37	0.24	401	0.03	440	0.12
arcwiki	1,819	460	77	0.74	0	nan	11	0.48	0	nan	346	0.41
towiki	1,778	190	15	1.69	0	nan	0	nan	0	nan	80	-0.17
jamwiki	1,734	764	3	0.53	0	nan	9	0.18	251	-0.42	450	0.16
akwiki	1,713	1,382	26	0.01	0	nan	129	0.07	671	-0.01	751	0.08
wowiki	1,693	565	5	0.4	0	nan	29	0.38	244	-0.15	425	0.41
tpiwiki	1,665	212	1	0.27	0	nan	18	0.42	163	0.46	175	0.5
nawiki	1,661	536	1	-1.07	0	nan	39	0.44	0	nan	225	-0.17
kiwiki	1,632	1,049	0	nan	0	nan	2	0.77	0	nan	650	0.21
kbdwiki	1,631	685	6	0.58	0	nan	9	0.01	256	-0.29	470	0.32
novwiki	1,610	292	5	0.92	0	nan	45	0.18	0	nan	283	0.66
mdfwiki	1,595	342	4	1.13	0	nan	3	-0.1	115	-0.39	162	-0.05
tetwiki	1,592	287	7	0.83	1	-4.35	5	-0.22	56	-0.93	177	0.21
atjwiki	1,588	940	0	nan	0	nan	37	0.13	559	0.11	564	0.18
biwiki	1,542	1,043	0	nan	0	nan	220	-0.01	0	nan	604	0.15
lldwiki	1,498	109	0	nan	0	nan	1	1.12	35	-0.49	71	0.26
xhwiki	1,463	652	11	0.43	2	0.4	50	0.22	375	0.14	309	-0.05
mnwwiki	1,459	795	2	0.61	0	nan	5	0.34	401	-0.04	384	-0.03
tywiki	1,339	880	0	nan	0	nan	17	0.28	0	nan	319	-0.32
jbowiki	1,335	306	0	nan	0	nan	20	0.43	0	nan	191	0.22
roa_rupwiki	1,331	405	1	0.5	0	nan	15	0.2	0	nan	219	0.08
kgwiki	1,277	413	8	0.21	0	nan	4	0.77	0	nan	161	-0.25
lbewiki	1,262	457	3	1.02	0	nan	5	0.33	164	-0.32	251	0.09
omwiki	1,226	346	0	nan	0	nan	8	-0.02	170	-0.01	250	0.37
fjwiki	1,218	616	0	nan	21	0.68	7	0.45	238	-0.26	317	0.03
srnwiki	1,197	765	9	-0.06	0	nan	29	0.23	0	nan	424	0.1
bmwiki	1,178	412	1	0.36	0	nan	10	0.36	145	-0.35	162	-0.24
nqowiki	1,137	360	3	-0.15	0	nan	6	0.2	202	0.12	255	0.35
smwiki	1,077	246	1	0.78	0	nan	11	0.07	113	-0.08	135	0.09
chrwiki	1,034	467	1	0.79	0	nan	10	0.77	239	0.05	278	0.17
twwiki	1,030	734	1	-0.76	0	nan	68	0.05	339	-0.07	391	0.06
ltgwiki	1,017	202	5	0.52	0	nan	14	0.03	62	-0.49	96	-0.05
stwiki	977	392	0	nan	0	nan	42	0.09	200	0.03	169	-0.15
gotwiki	975	446	0	nan	0	nan	15	0.25	0	nan	209	-0.06
pihwiki	919	232	3	1.09	0	nan	25	0.11	118	0.02	150	0.26
nywiki	909	445	2	-0.2	0	nan	34	0.19	215	0.02	219	-0.01
klwiki	869	137	1	0.75	0	nan	8	0.04	0	nan	73	0.06
kswiki	865	252	0	nan	18	1.23	8	0.16	95	-0.2	90	-0.34
tnwiki	856	547	2	0.45	0	nan	27	0.06	302	0.1	236	-0.15
cuwiki	817	186	3	-0.42	1	1.48	0	nan	67	-0.35	120	0.26
rmywiki	796	461	1	0.55	0	nan	13	0.12	0	nan	263	0.13
chywiki	787	397	4	0.28	0	nan	17	0.21	0	nan	198	0
tswiki	734	153	0	nan	0	nan	8	0.45	63	-0.19	96	0.23
tumwiki	726	428	0	nan	0	nan	3	0.34	0	nan	313	0.38
rnwiki	725	511	9	0.24	0	nan	8	0.14	0	nan	282	0.1
ikwiki	720	402	1	0.58	0	nan	9	0	0	nan	274	0.31
vewiki	713	167	0	nan	0	nan	2	0.29	0	nan	19	-1.48
iuwiki	689	346	1	0	0	nan	10	-0.15	0	nan	299	0.55
eewiki	650	114	2	1.34	0	nan	1	0.77	29	-0.68	47	-0.19
ffwiki	648	345	0	nan	0	nan	8	0.31	250	0.38	234	0.3
adywiki	581	202	1	1.06	0	nan	1	0.46	0	nan	86	-0.16
sswiki	576	181	0	nan	0	nan	16	0.06	94	0.03	140	0.44
chwiki	557	390	0	nan	0	nan	8	0.01	0	nan	205	0.05
sgwiki	540	347	2	0.04	0	nan	18	0.03	252	0.38	256	0.39
pntwiki	530	178	0	nan	0	nan	8	0.26	30	-1.09	142	0.47
dinwiki	507	404	0	nan	0	nan	9	0.08	219	0.07	214	0.06
tiwiki	378	144	0	nan	0	nan	1	0.1	85	0.19	83	0.14
dzwiki	303	100	0	nan	0	nan	1	-0.18	0	nan	86	0.55
crwiki	174	126	0	nan	0	nan	1	0	0	nan	80	0.24

De-orphanizing via link translation

How many of the orphan-articles could be de-orphanized by link translation? That is, for an orphan article in a specific language, are there already existing incoming links in other languages which we could add to the orphan article (such that the source-article of the link in the other language also exists in the language of the orphan article)?

Besides reporting the number of articles (N), the number of orphan articles (No), and the fraction of orphan articles (Po), we calculate for how many orphan articles we could recommend new incoming links via link translation:

No_k[1,2,5,10], the number of orphan articles for which there is at least k different incoming link which already exists in another language
Po_k[1,2,5,10], the percentage of orphan articles for which there is at least k incoming link which already exists in another language

Observations:

from the 8.4M orphan articles, for 4.9M articles we find at least one potential incoming link which already exists in another language. This means that 59% of the orphan articles can be de-orphanized via link translation. This number is a bit lower if we set a higher threshold of the number of new incoming links higher -- however, this number is still in the millions: there are 2.8M orphan articles for which we find 10 or more potential incoming links which already exist in another language.
for enwiki, we could only de-orphanize roughly 22% of orphans, however, this still amounts to more than 67k articles
for most of the other Wikipedias, we could de-orphanize more than half of the orphan articles; even for those wikis on the lower end (dewiki, frwiki, nlwiki, ruwiki, jawiki, etc) we can de-orphanize 30% or more. the one exception seems cebwiki with 17% (roughly 108k articles).
Link translation can generate recommendations for new incoming links for millions of orphan articles across all wikipedias.
For a single orphan article, we can often find several (10 or more) potential incoming links which already exist in other languages; one option for prioritization is the number of different language versions in which the link already exists.

Click [show] to see all results in the table:

wiki_db	N	No	Po	No_k1	Po_k1	No_k2	Po_k2	No_k5	Po_k5	No_k10	Po_k10
enwiki	6,385,659	298,908	4.7	67,894	22.7	48,714	16.3	23,128	7.7	12,630	4.2
cebwiki	5,953,757	637,114	10.7	108,730	17.1	90,565	14.2	76,592	12	66,883	10.5
svwiki	2,910,832	501,736	17.2	357,317	71.2	119,953	23.9	88,139	17.6	72,753	14.5
dewiki	2,619,091	197,354	7.5	59,406	30.1	41,610	21.1	18,237	9.2	9,277	4.7
frwiki	2,363,875	39,960	1.7	17,965	45	14,295	35.8	9,247	23.1	6,344	15.9
nlwiki	2,067,850	275,892	13.3	106,514	38.6	80,429	29.2	50,553	18.3	34,192	12.4
ruwiki	1,757,948	46,643	2.7	17,938	38.5	14,587	31.3	9,388	20.1	6,326	13.6
itwiki	1,719,115	78,371	4.6	39,208	50	32,533	41.5	18,932	24.2	11,475	14.6
eswiki	1,662,659	130,652	7.9	76,641	58.7	59,705	45.7	42,734	32.7	32,608	25
plwiki	1,491,302	105,247	7.1	53,626	51	46,746	44.4	33,763	32.1	24,510	23.3
arzwiki	1,341,002	1,098,234	81.9	681,039	62	587,909	53.5	466,478	42.5	389,688	35.5
jawiki	1,292,796	42,658	3.3	13,390	31.4	11,025	25.8	6,982	16.4	4,469	10.5
viwiki	1,268,943	653,299	51.5	332,492	50.9	129,618	19.8	100,399	15.4	91,839	14.1
warwiki	1,265,580	74,435	5.9	48,535	65.2	14,309	19.2	11,019	14.8	9,877	13.3
zhwiki	1,232,696	152,473	12.4	104,225	68.4	88,061	57.8	74,231	48.7	65,660	43.1
arwiki	1,138,549	238,368	20.9	174,242	73.1	140,975	59.1	93,436	39.2	64,848	27.2
ukwiki	1,116,468	50,491	4.5	27,115	53.7	22,804	45.2	16,846	33.4	13,190	26.1
ptwiki	1,074,776	86,796	8.1	51,614	59.5	40,122	46.2	28,176	32.5	20,716	23.9
fawiki	835,820	186,297	22.3	146,419	78.6	136,086	73	115,212	61.8	96,469	51.8
cawiki	688,534	32,881	4.8	17,058	51.9	14,886	45.3	11,286	34.3	8,514	25.9
srwiki	649,939	50,933	7.8	22,295	43.8	20,064	39.4	14,911	29.3	11,777	23.1
idwiki	597,995	54,060	9	41,011	75.9	21,343	39.5	14,674	27.1	11,367	21
nowiki	565,713	30,005	5.3	16,665	55.5	14,460	48.2	10,708	35.7	7,805	26
kowiki	553,722	46,753	8.4	21,694	46.4	19,546	41.8	15,086	32.3	11,319	24.2
fiwiki	517,193	26,256	5.1	16,582	63.2	14,846	56.5	11,336	43.2	8,468	32.3
huwiki	492,581	18,713	3.8	10,473	56	9,100	48.6	6,397	34.2	4,427	23.7
cswiki	489,152	27,509	5.6	16,581	60.3	14,402	52.4	10,255	37.3	7,434	27
shwiki	455,880	52,721	11.6	32,414	61.5	28,955	54.9	21,585	40.9	18,491	35.1
zh_min_nanwiki	430,975	310,343	72	300,735	96.9	282,978	91.2	272,375	87.8	261,728	84.3
trwiki	428,977	30,500	7.1	18,529	60.8	16,668	54.6	13,080	42.9	10,049	32.9
rowiki	423,411	20,939	4.9	13,335	63.7	12,086	57.7	8,085	38.6	6,082	29
cewiki	418,886	203,585	48.6	177,069	87	172,982	85	171,057	84	166,113	81.6
euwiki	377,072	90,333	24	80,432	89	62,665	69.4	52,680	58.3	47,625	52.7
mswiki	354,176	56,784	16	36,044	63.5	34,376	60.5	31,437	55.4	28,587	50.3
ttwiki	319,996	134,430	42	115,800	86.1	112,962	84	110,074	81.9	105,412	78.4
eowiki	304,129	11,098	3.6	8,382	75.5	7,489	67.5	5,730	51.6	4,481	40.4
hewiki	303,687	14,427	4.8	8,204	56.9	7,272	50.4	5,400	37.4	3,846	26.7
hywiki	288,215	72,793	25.3	51,843	71.2	48,477	66.6	40,182	55.2	33,415	45.9
bgwiki	275,312	37,602	13.7	24,644	65.5	20,928	55.7	16,537	44	13,946	37.1
dawiki	269,853	25,698	9.5	13,802	53.7	12,516	48.7	9,477	36.9	6,804	26.5
azbwiki	240,896	191,103	79.3	177,995	93.1	171,421	89.7	157,941	82.6	143,322	75
skwiki	237,697	12,908	5.4	6,307	48.9	5,441	42.2	3,662	28.4	2,507	19.4
kkwiki	233,024	92,666	39.8	44,909	48.5	42,931	46.3	40,976	44.2	38,794	41.9
minwiki	225,051	164,370	73	100,391	61.1	24,787	15.1	20,708	12.6	19,320	11.8
etwiki	222,348	9,146	4.1	4,861	53.1	4,280	46.8	3,223	35.2	2,440	26.7
bewiki	209,176	5,882	2.8	4,164	70.8	3,728	63.4	2,940	50	2,325	39.5
elwiki	197,852	22,360	11.3	15,127	67.7	13,776	61.6	11,328	50.7	8,983	40.2
ltwiki	197,736	14,713	7.4	7,939	54	7,283	49.5	6,007	40.8	4,884	33.2
simplewiki	196,964	20,916	10.6	16,800	80.3	15,284	73.1	12,192	58.3	9,255	44.2
hrwiki	195,488	12,767	6.5	7,036	55.1	6,281	49.2	5,044	39.5	4,103	32.1
azwiki	178,664	32,343	18.1	21,430	66.3	19,656	60.8	17,106	52.9	14,915	46.1
glwiki	176,642	10,166	5.8	6,566	64.6	5,741	56.5	4,167	41	2,980	29.3
slwiki	173,719	10,849	6.2	6,218	57.3	5,459	50.3	4,268	39.3	3,315	30.6
urwiki	167,917	46,137	27.5	38,277	83	34,835	75.5	29,574	64.1	24,475	53
nnwiki	159,735	23,483	14.7	18,141	77.3	14,418	61.4	10,233	43.6	8,348	35.5
kawiki	156,853	23,351	14.9	13,949	59.7	12,988	55.6	11,077	47.4	9,343	40
hiwiki	153,074	48,810	31.9	25,134	51.5	19,594	40.1	17,502	35.9	14,737	30.2
tawiki	145,393	45,623	31.4	17,785	39	15,070	33	11,415	25	9,211	20.2
thwiki	141,383	12,458	8.8	8,624	69.2	7,717	61.9	6,270	50.3	5,027	40.4
uzwiki	139,780	64,098	45.9	51,970	81.1	51,589	80.5	50,712	79.1	49,203	76.8
lawiki	136,062	1,610	1.2	1,346	83.6	1,255	78	1,004	62.4	797	49.5
cywiki	133,709	40,994	30.7	29,753	72.6	26,779	65.3	22,498	54.9	19,438	47.4
astwiki	128,111	30,580	23.9	22,520	73.6	19,391	63.4	14,336	46.9	11,203	36.6
vowiki	127,044	94,635	74.5	92,298	97.5	91,481	96.7	87,407	92.4	84,362	89.1
zh_yuewiki	119,772	17,863	14.9	12,161	68.1	11,478	64.3	10,327	57.8	9,293	52
mkwiki	117,404	17,593	15	13,964	79.4	13,227	75.2	11,795	67	10,443	59.4
bnwiki	113,740	20,509	18	13,705	66.8	11,534	56.2	8,635	42.1	6,714	32.7
lvwiki	109,028	8,538	7.8	5,063	59.3	4,627	54.2	3,669	43	2,910	34.1
mywiki	104,501	32,183	30.8	7,443	23.1	7,121	22.1	6,431	20	5,244	16.3
tgwiki	104,406	52,951	50.7	37,351	70.5	34,233	64.7	30,109	56.9	27,037	51.1
afwiki	100,366	29,788	29.7	22,026	73.9	17,923	60.2	12,059	40.5	8,225	27.6
mgwiki	94,260	48,943	51.9	44,943	91.8	43,925	89.7	42,545	86.9	40,766	83.3
sqwiki	92,887	24,817	26.7	12,102	48.8	11,374	45.8	10,029	40.4	8,761	35.3
bswiki	87,547	3,763	4.3	2,760	73.3	2,399	63.8	1,344	35.7	930	24.7
ocwiki	87,091	6,667	7.7	5,854	87.8	5,538	83.1	4,792	71.9	4,117	61.8
ndswiki	82,715	40,349	48.8	8,960	22.2	4,169	10.3	1,475	3.7	811	2
mrwiki	81,420	8,567	10.5	3,266	38.1	3,023	35.3	2,578	30.1	2,168	25.3
kywiki	80,945	57,565	71.1	31,254	54.3	30,523	53	29,464	51.2	28,169	48.9
mlwiki	76,635	9,063	11.8	4,858	53.6	4,522	49.9	3,872	42.7	3,211	35.4
be_x_oldwiki	76,076	4,226	5.6	3,404	80.5	3,023	71.5	2,440	57.7	1,926	45.6
tewiki	73,087	5,634	7.7	1,842	32.7	1,702	30.2	1,444	25.6	1,213	21.5
newwiki	73,058	31,007	42.4	11,773	38	11,288	36.4	10,745	34.7	9,615	31
brwiki	70,150	5,347	7.6	4,270	79.9	3,885	72.7	3,123	58.4	2,404	45
vecwiki	68,647	1,655	2.4	1,412	85.3	1,328	80.2	1,154	69.7	991	59.9
swwiki	67,320	8,671	12.9	6,576	75.8	5,989	69.1	5,112	59	4,448	51.3
pmswiki	65,866	37,016	56.2	34,386	92.9	33,855	91.5	32,612	88.1	31,794	85.9
jvwiki	64,918	13,011	20	9,459	72.7	8,947	68.8	7,952	61.1	6,920	53.2
pnbwiki	64,623	19,759	30.6	12,225	61.9	11,433	57.9	10,169	51.5	9,186	46.5
htwiki	64,561	43,176	66.9	27,816	64.4	27,324	63.3	26,371	61.1	24,676	57.2
suwiki	61,144	36,538	59.8	20,878	57.1	15,639	42.8	14,936	40.9	12,861	35.2
lbwiki	60,243	3,094	5.1	2,005	64.8	1,671	54	1,193	38.6	885	28.6
bawiki	58,575	26,835	45.8	21,167	78.9	19,016	70.9	17,272	64.4	16,139	60.1
gawiki	55,894	8,790	15.7	8,025	91.3	7,779	88.5	7,220	82.1	6,511	74.1
szlwiki	54,350	49,088	90.3	11,612	23.7	6,099	12.4	4,566	9.3	3,532	7.2
iswiki	53,251	4,501	8.5	3,152	70	2,987	66.4	2,582	57.4	2,173	48.3
kuwiki	50,555	7,275	14.4	2,460	33.8	2,308	31.7	1,967	27	1,639	22.5
lmowiki	49,175	7,091	14.4	6,200	87.4	5,950	83.9	5,305	74.8	4,803	67.7
cvwiki	47,007	17,083	36.3	14,529	85	13,370	78.3	11,912	69.7	11,187	65.5
fywiki	46,512	6,351	13.7	4,378	68.9	3,917	61.7	2,656	41.8	2,175	34.2
tlwiki	43,556	8,879	20.4	7,043	79.3	6,456	72.7	5,361	60.4	4,479	50.4
wuuwiki	42,692	20,579	48.2	20,286	98.6	20,132	97.8	19,711	95.8	19,029	92.5
anwiki	40,540	2,173	5.4	1,683	77.5	1,543	71	1,209	55.6	920	42.3
scowiki	40,512	5,028	12.4	4,429	88.1	3,913	77.8	2,979	59.2	2,278	45.3
diqwiki	40,136	2,535	6.3	2,134	84.2	2,017	79.6	1,700	67.1	1,439	56.8
pawiki	38,344	16,755	43.7	9,250	55.2	8,327	49.7	6,936	41.4	5,887	35.1
ckbwiki	34,925	6,082	17.4	5,026	82.6	4,799	78.9	4,317	71	3,843	63.2
yowiki	33,781	17,488	51.8	15,936	91.1	14,965	85.6	12,500	71.5	12,140	69.4
newiki	32,567	8,010	24.6	4,185	52.2	3,952	49.3	3,442	43	2,954	36.9
barwiki	31,761	8,857	27.9	4,296	48.5	3,528	39.8	2,428	27.4	1,579	17.8
iowiki	30,873	3,830	12.4	3,666	95.7	3,559	92.9	3,315	86.6	3,048	79.6
guwiki	29,832	2,508	8.4	1,700	67.8	1,545	61.6	1,270	50.6	1,046	41.7
knwiki	28,053	9,863	35.2	5,234	53.1	4,939	50.1	4,387	44.5	3,809	38.6
alswiki	27,989	1,423	5.1	976	68.6	767	53.9	504	35.4	383	26.9
nostalgiawiki	27,375	1,522	5.6	0	0	0	0	0	0	0	0
scnwiki	26,453	3,959	15	2,435	61.5	2,219	56	1,884	47.6	1,632	41.2
bpywiki	25,162	10,635	42.3	9,906	93.1	9,710	91.3	9,251	87	8,472	79.7
iawiki	23,321	6,137	26.3	3,815	62.2	3,675	59.9	3,327	54.2	2,829	46.1
quwiki	23,171	2,431	10.5	1,750	72	1,674	68.9	1,472	60.6	1,229	50.6
mnwiki	22,648	5,255	23.2	3,407	64.8	3,263	62.1	2,909	55.4	2,441	46.5
siwiki	21,435	7,169	33.4	2,607	36.4	2,406	33.6	2,026	28.3	1,737	24.2
nvwiki	17,027	200	1.2	134	67	99	49.5	56	28	40	20
bat_smgwiki	16,943	2,430	14.3	2,121	87.3	1,973	81.2	1,656	68.1	1,382	56.9
xmfwiki	16,675	2,515	15.1	2,184	86.8	2,099	83.5	1,863	74.1	1,635	65
sdwiki	16,437	6,644	40.4	2,394	36	2,227	33.5	1,877	28.3	1,633	24.6
avkwiki	16,356	963	5.9	51	5.3	48	5	45	4.7	37	3.8
orwiki	15,886	2,845	17.9	2,155	75.7	2,018	70.9	1,651	58	1,273	44.7
gdwiki	15,632	1,054	6.7	795	75.4	746	70.8	630	59.8	524	49.7
amwiki	15,598	4,107	26.3	3,103	75.6	3,059	74.5	2,956	72	2,854	69.5
cdowiki	15,520	3,677	23.7	3,618	98.4	3,610	98.2	3,583	97.4	3,548	96.5
yiwiki	15,382	1,996	13	1,147	57.5	1,075	53.9	921	46.1	758	38
ilowiki	15,349	493	3.2	463	93.9	411	83.4	318	64.5	269	54.6
sahwiki	14,939	4,175	27.9	1,660	39.8	1,560	37.4	1,380	33.1	1,243	29.8
napwiki	14,759	1,031	7	813	78.9	771	74.8	637	61.8	531	51.5
maiwiki	14,559	3,666	25.2	2,388	65.1	2,250	61.4	1,974	53.8	1,731	47.2
pswiki	14,204	5,595	39.4	2,764	49.4	2,633	47.1	2,422	43.3	2,173	38.8
bugwiki	14,194	149	1	101	67.8	94	63.1	73	49	63	42.3
oswiki	14,159	2,267	16	1,166	51.4	1,090	48.1	904	39.9	738	32.6
frrwiki	14,057	180	1.3	120	66.7	105	58.3	85	47.2	64	35.6
map_bmswiki	13,971	5,755	41.2	5,352	93	5,308	92.2	4,959	86.2	3,901	67.8
hsbwiki	13,793	2,090	15.2	1,784	85.4	1,688	80.8	1,524	72.9	1,420	67.9
mznwiki	13,680	4,963	36.3	3,943	79.4	3,807	76.7	3,582	72.2	3,374	68
fowiki	13,653	1,369	10	1,140	83.3	1,086	79.3	888	64.9	711	51.9
liwiki	13,490	462	3.4	341	73.8	310	67.1	217	47	147	31.8
hawiki	13,210	6,324	47.9	2,722	43	1,938	30.6	1,249	19.8	916	14.5
emlwiki	12,920	1,746	13.5	1,365	78.2	1,195	68.4	890	51	651	37.3
gorwiki	12,842	2,156	16.8	1,506	69.9	1,486	68.9	1,429	66.3	1,003	46.5
acewiki	12,620	10,079	79.9	5,277	52.4	3,400	33.7	2,919	29	2,625	26
crhwiki	11,942	1,902	15.9	1,799	94.6	1,760	92.5	1,679	88.3	1,626	85.5
bowiki	11,780	9,241	78.4	1,565	16.9	1,530	16.6	1,450	15.7	1,358	14.7
sawiki	11,673	1,729	14.8	1,121	64.8	1,079	62.4	992	57.4	877	50.7
bclwiki	11,621	3,197	27.5	2,235	69.9	2,079	65	1,754	54.9	1,501	47
wawiki	11,384	1,028	9	699	68	671	65.3	577	56.1	486	47.3
zh_classicalwiki	11,069	2,735	24.7	2,137	78.1	1,854	67.8	1,433	52.4	1,063	38.9
lijwiki	10,774	361	3.4	309	85.6	298	82.5	263	72.9	217	60.1
mrjwiki	10,533	3,161	30	2,766	87.5	2,710	85.7	2,564	81.1	2,435	77
shnwiki	10,387	990	9.5	299	30.2	295	29.8	259	26.2	248	25.1
mhrwiki	10,331	898	8.7	696	77.5	672	74.8	598	66.6	551	61.4
zuwiki	10,327	2,717	26.3	2,113	77.8	1,925	70.9	1,554	57.2	1,297	47.7
kmwiki	10,221	2,559	25	811	31.7	736	28.8	621	24.3	513	20
hifwiki	10,202	6,049	59.3	2,338	38.7	2,036	33.7	1,620	26.8	1,350	22.3
aswiki	9,715	2,086	21.5	1,126	54	987	47.3	746	35.8	603	28.9
testwiki	9,592	6,294	65.6	0	0	0	0	0	0	0	0
banwiki	9,586	1,127	11.8	758	67.3	681	60.4	575	51	492	43.7
hakwiki	9,523	1,765	18.5	1,539	87.2	1,483	84	1,356	76.8	1,207	68.4
roa_tarawiki	9,317	202	2.2	152	75.2	139	68.8	101	50	79	39.1
hywwiki	9,218	3,308	35.9	1,644	49.7	1,445	43.7	1,124	34	852	25.8
pamwiki	8,922	1,613	18.1	1,395	86.5	1,307	81	1,122	69.6	955	59.2
nsowiki	8,505	282	3.3	173	61.3	150	53.2	130	46.1	111	39.4
iewiki	8,464	1,559	18.4	1,404	90.1	1,301	83.5	1,122	72	897	57.5
sowiki	8,306	2,980	35.9	1,370	46	1,291	43.3	1,122	37.7	974	32.7
ruewiki	8,227	824	10	629	76.3	604	73.3	522	63.3	449	54.5
sewiki	7,977	1,530	19.2	1,145	74.8	1,071	70	922	60.3	805	52.6
ugwiki	7,755	3,370	43.5	1,242	36.9	1,215	36.1	1,154	34.2	1,081	32.1
snwiki	7,707	3,000	38.9	358	11.9	328	10.9	286	9.5	240	8
bhwiki	7,570	1,364	18	1,267	92.9	1,200	88	1,052	77.1	909	66.6
tkwiki	7,540	2,223	29.5	1,280	57.6	1,204	54.2	1,018	45.8	879	39.5
vlswiki	7,520	346	4.6	266	76.9	230	66.5	152	43.9	102	29.5
nds_nlwiki	7,350	786	10.7	521	66.3	449	57.1	319	40.6	242	30.8
miwiki	7,268	3,684	50.7	1,391	37.8	956	26	757	20.5	565	15.3
scwiki	7,249	2,194	30.3	1,876	85.5	1,763	80.4	1,460	66.5	1,152	52.5
nahwiki	7,187	1,340	18.6	1,014	75.7	939	70.1	788	58.8	605	45.1
myvwiki	6,697	674	10.1	403	59.8	372	55.2	309	45.8	257	38.1
vepwiki	6,669	1,038	15.6	820	79	711	68.5	542	52.2	383	36.9
satwiki	6,632	3,044	45.9	1,873	61.5	1,665	54.7	1,398	45.9	1,147	37.7
glkwiki	6,597	729	11.1	378	51.9	360	49.4	314	43.1	270	37
ganwiki	6,525	821	12.6	705	85.9	686	83.6	619	75.4	542	66
kabwiki	6,251	801	12.8	638	79.7	608	75.9	503	62.8	429	53.6
cowiki	6,069	766	12.6	679	88.6	630	82.2	534	69.7	467	61
fiu_vrowiki	5,944	901	15.2	539	59.8	511	56.7	454	50.4	388	43.1
abwiki	5,844	657	11.2	486	74	449	68.3	394	60	346	52.7
kvwiki	5,539	621	11.2	552	88.9	536	86.3	477	76.8	409	65.9
csbwiki	5,419	2,397	44.2	2,197	91.7	2,108	87.9	1,889	78.8	1,616	67.4
pcdwiki	5,346	1,528	28.6	1,244	81.4	1,182	77.4	1,080	70.7	1,012	66.2
frpwiki	5,178	554	10.7	479	86.5	451	81.4	383	69.1	316	57
aywiki	5,156	1,172	22.7	971	82.8	927	79.1	800	68.3	731	62.4
udmwiki	5,130	971	18.9	770	79.3	702	72.3	587	60.5	488	50.3
gvwiki	5,046	621	12.3	557	89.7	527	84.9	437	70.4	359	57.8
pagwiki	4,966	284	5.7	170	59.9	148	52.1	121	42.6	93	32.7
lowiki	4,857	1,798	37	959	53.3	836	46.5	711	39.5	596	33.1
kwwiki	4,794	1,069	22.3	940	87.9	883	82.6	777	72.7	666	62.3
zeawiki	4,793	475	9.9	427	89.9	408	85.9	354	74.5	310	65.3
lfnwiki	4,744	1,152	24.3	1,018	88.4	978	84.9	852	74	736	63.9
arywiki	4,657	1,218	26.2	781	64.1	757	62.2	706	58	664	54.5
nrmwiki	4,620	767	16.6	626	81.6	599	78.1	541	70.5	483	63
bjnwiki	4,524	1,039	23	776	74.7	733	70.5	640	61.6	506	48.7
szywiki	4,459	2,609	58.5	763	29.2	711	27.3	549	21	375	14.4
gnwiki	4,416	772	17.5	672	87	638	82.6	567	73.4	475	61.5
dvwiki	4,320	1,207	27.9	380	31.5	363	30.1	324	26.8	294	24.4
mtwiki	4,291	909	21.2	665	73.2	556	61.2	398	43.8	301	33.1
lezwiki	4,225	534	12.6	415	77.7	392	73.4	346	64.8	310	58.1
gomwiki	4,197	2,545	60.6	738	29	680	26.7	589	23.1	501	19.7
mwlwiki	4,132	2,405	58.2	1,779	74	1,478	61.5	1,158	48.1	984	40.9
stqwiki	4,118	288	7	257	89.2	242	84	202	70.1	164	56.9
olowiki	4,027	1,077	26.7	885	82.2	777	72.1	652	60.5	508	47.2
rmwiki	3,774	494	13.1	361	73.1	329	66.6	245	49.6	191	38.7
awawiki	3,718	1,523	41	175	11.5	166	10.9	152	10	121	7.9
ladwiki	3,620	839	23.2	711	84.7	639	76.2	501	59.7	379	45.2
dtywiki	3,611	951	26.3	612	64.4	566	59.5	471	49.5	388	40.8
furwiki	3,575	511	14.3	384	75.1	370	72.4	324	63.4	270	52.8
koiwiki	3,491	237	6.8	208	87.8	203	85.7	151	63.7	121	51.1
extwiki	3,459	1,095	31.7	954	87.1	886	80.9	712	65	559	51.1
angwiki	3,442	1,256	36.5	1,111	88.5	1,047	83.4	895	71.3	739	58.8
lnwiki	3,351	893	26.6	588	65.8	532	59.6	450	50.4	366	41
cbk_zamwiki	3,337	820	24.6	726	88.5	687	83.8	604	73.7	529	64.5
dsbwiki	3,323	688	20.7	619	90	581	84.4	485	70.5	397	57.7
tyvwiki	3,289	2,029	61.7	930	45.8	787	38.8	620	30.6	484	23.9
piwiki	3,230	2,629	81.4	2,585	98.3	2,580	98.1	2,572	97.8	2,561	97.4
gagwiki	2,957	713	24.1	273	38.3	256	35.9	205	28.8	146	20.5
kshwiki	2,917	691	23.7	476	68.9	417	60.3	292	42.3	203	29.4
bxrwiki	2,756	588	21.3	527	89.6	504	85.7	463	78.7	423	71.9
pflwiki	2,746	291	10.6	206	70.8	163	56	111	38.1	86	29.6
avwiki	2,628	658	25	598	90.9	586	89.1	566	86	534	81.2
lgwiki	2,558	1,958	76.5	428	21.9	371	18.9	267	13.6	216	11
igwiki	2,540	1,442	56.8	870	60.3	717	49.7	545	37.8	446	30.9
rwwiki	2,500	1,249	50	804	64.4	738	59.1	591	47.3	486	38.9
hawwiki	2,452	604	24.6	496	82.1	438	72.5	373	61.8	305	50.5
gcrwiki	2,380	1,887	79.3	1,177	62.4	1,175	62.3	1,170	62	1,163	61.6
xalwiki	2,317	624	26.9	598	95.8	590	94.6	562	90.1	524	84
papwiki	2,317	635	27.4	558	87.9	530	83.5	477	75.1	432	68
zawiki	2,122	748	35.2	711	95.1	698	93.3	657	87.8	615	82.2
pdcwiki	2,109	1,029	48.8	739	71.8	693	67.3	590	57.3	535	52
krcwiki	2,069	230	11.1	194	84.3	182	79.1	150	65.2	114	49.6
kaawiki	2,064	982	47.6	769	78.3	750	76.4	678	69	613	62.4
test2wiki	2,046	1,118	54.6	0	0	0	0	0	0	0	0
kbpwiki	1,958	1,059	54.1	844	79.7	836	78.9	810	76.5	785	74.1
inhwiki	1,881	358	19	228	63.7	220	61.5	200	55.9	170	47.5
tcywiki	1,825	780	42.7	347	44.5	301	38.6	251	32.2	201	25.8
arcwiki	1,819	460	25.3	346	75.2	335	72.8	306	66.5	273	59.3
towiki	1,778	190	10.7	112	58.9	93	48.9	45	23.7	31	16.3
jamwiki	1,734	764	44.1	741	97	729	95.4	704	92.1	692	90.6
akwiki	1,713	1,382	80.7	970	70.2	875	63.3	761	55.1	642	46.5
wowiki	1,693	565	33.4	410	72.6	384	68	322	57	282	49.9
tpiwiki	1,665	212	12.7	183	86.3	166	78.3	122	57.5	99	46.7
nawiki	1,661	536	32.3	478	89.2	448	83.6	365	68.1	273	50.9
kiwiki	1,632	1,049	64.3	997	95	978	93.2	958	91.3	924	88.1
kbdwiki	1,631	685	42	564	82.3	508	74.2	446	65.1	394	57.5
novwiki	1,610	292	18.1	237	81.2	211	72.3	161	55.1	123	42.1
mdfwiki	1,595	342	21.4	235	68.7	213	62.3	183	53.5	143	41.8
tetwiki	1,592	287	18	206	71.8	187	65.2	154	53.7	122	42.5
atjwiki	1,588	940	59.2	382	40.6	339	36.1	311	33.1	289	30.7
biwiki	1,542	1,043	67.6	892	85.5	838	80.3	742	71.1	648	62.1
lldwiki	1,498	109	7.3	39	35.8	38	34.9	30	27.5	26	23.9
xhwiki	1,463	652	44.6	460	70.6	401	61.5	320	49.1	268	41.1
mnwwiki	1,459	795	54.5	261	32.8	230	28.9	175	22	133	16.7
tywiki	1,339	880	65.7	816	92.7	781	88.8	726	82.5	702	79.8
jbowiki	1,335	306	22.9	275	89.9	257	84	221	72.2	194	63.4
roa_rupwiki	1,331	405	30.4	331	81.7	316	78	279	68.9	256	63.2
kgwiki	1,277	413	32.3	381	92.3	362	87.7	333	80.6	307	74.3
lbewiki	1,262	457	36.2	371	81.2	346	75.7	316	69.1	283	61.9
omwiki	1,226	346	28.2	144	41.6	132	38.2	111	32.1	94	27.2
fjwiki	1,218	616	50.6	537	87.2	506	82.1	465	75.5	410	66.6
srnwiki	1,197	765	63.9	590	77.1	553	72.3	492	64.3	443	57.9
bmwiki	1,178	412	35	370	89.8	354	85.9	328	79.6	304	73.8
nqowiki	1,137	360	31.7	166	46.1	144	40	114	31.7	92	25.6
smwiki	1,077	246	22.8	185	75.2	169	68.7	143	58.1	120	48.8
chrwiki	1,034	467	45.2	406	86.9	397	85	366	78.4	334	71.5
twwiki	1,030	734	71.3	501	68.3	458	62.4	396	54	353	48.1
ltgwiki	1,017	202	19.9	126	62.4	105	52	78	38.6	60	29.7
stwiki	977	392	40.1	309	78.8	278	70.9	233	59.4	176	44.9
gotwiki	975	446	45.7	376	84.3	346	77.6	279	62.6	227	50.9
pihwiki	919	232	25.2	184	79.3	153	65.9	111	47.8	74	31.9
nywiki	909	445	49	302	67.9	259	58.2	199	44.7	152	34.2
klwiki	869	137	15.8	121	88.3	117	85.4	106	77.4	100	73
kswiki	865	252	29.1	148	58.7	137	54.4	111	44	98	38.9
tnwiki	856	547	63.9	375	68.6	334	61.1	268	49	218	39.9
cuwiki	817	186	22.8	172	92.5	161	86.6	133	71.5	108	58.1
rmywiki	796	461	57.9	355	77	336	72.9	311	67.5	279	60.5
chywiki	787	397	50.4	351	88.4	328	82.6	281	70.8	238	59.9
tswiki	734	153	20.8	111	72.5	98	64.1	79	51.6	70	45.8
tumwiki	726	428	59	373	87.1	363	84.8	329	76.9	252	58.9
rnwiki	725	511	70.5	350	68.5	259	50.7	208	40.7	181	35.4
ikwiki	720	402	55.8	350	87.1	334	83.1	299	74.4	267	66.4
vewiki	713	167	23.4	140	83.8	129	77.2	110	65.9	91	54.5
iuwiki	689	346	50.2	304	87.9	293	84.7	267	77.2	243	70.2
eewiki	650	114	17.5	93	81.6	79	69.3	60	52.6	45	39.5
ffwiki	648	345	53.2	202	58.6	140	40.6	93	27	64	18.6
adywiki	581	202	34.8	91	45	80	39.6	68	33.7	59	29.2
sswiki	576	181	31.4	132	72.9	110	60.8	75	41.4	56	30.9
chwiki	557	390	70	375	96.2	358	91.8	328	84.1	304	77.9
sgwiki	540	347	64.3	240	69.2	177	51	120	34.6	84	24.2
pntwiki	530	178	33.6	146	82	137	77	119	66.9	108	60.7
dinwiki	507	404	79.7	372	92.1	344	85.1	296	73.3	242	59.9
tiwiki	378	144	38.1	102	70.8	97	67.4	92	63.9	65	45.1
dzwiki	303	100	33	46	46	43	43	36	36	32	32
crwiki	174	126	72.4	118	93.7	115	91.3	110	87.3	103	81.7

Evaluation

Here, we evaluate the quality of de-orphanizing recommendations made by our proposed link-translation approach and compare it with 4 strong baselines, namely: (1) Findlink^[1], (2) Morelike^[2], (3) Reciprocity, and (4) VERSE^[3].

Data and setup

We extract the hyperlink graphs for all the 305 language versions of Wikipedia from the Wikitext dumps published in Jan 2022 and Feb 2022, respectively. The graphs from Jan 2022 were used for training the aforementioned methods (Findlink and Morelike are exceptions as they are available only as APIs, and thus, we couldn’t use a specific dump for obtaining results with these methods. We are currently in the process of mitigating this gap and this should be resolved in our next update.). We tracked all the articles that were orphans in Jan 2022 but were de-orphanized in Feb 2022, which serve as the ground-truth set of deorphanization queries and consequently, as our test set for evaluating the aforementioned methods. Note that our setup ensures that there is no data leakage, i.e., the methods do not have access to the de-orphanizing links added to articles in Feb 2022.

Baselines

We carefully select four strong baselines, which can be further grouped into three broad categories.

Existing tools and resources from Wikimedia

1. Findlink: The Find Link tool^[1] does a search for article titles/keywords throughout Wikipedia to highlight those articles that mention the search term and therefore ought to be linked to. This tool is available online: https://edwardbetts.com/find_link/, and has been the de facto choice of the Wikipedia editor community to de-orphanize orphan articles (WikiProject Orphanage)
2. Morelike: The Morelike query ^[2] is available as a part of the CirrusSearch functionality offered by the Wikimedia Search team. It is based on Elasticsearch, and finds articles whose text is most similar to the text of the given articles.

Heuristics

3. Reciprocity: is a simple heuristic, where for each “directed” edge (u,v), we add a reciprocal edge (v,u) to the graph. For a given query article (v), the reciprocal links are ranked based on the degree of the source (u). More details at en:Reciprocity_(network_science)

Graph embeddings

4. VERSE ^[3]: is one of the state-of-the-art node representation learning methods, which scales gracefully to Web-scale graphs. Once trained, VERSE facilitates computation of the similarity between any two Wikipedia articles based on the similarities in the network structure around them. This similarity (the higher the better) is used as a score to rank all the recommendations from a given article.

Metrics

We report Micro (query-level) and Macro (language-level) averages for Recall@k (k=1, 2, 3, 4, 5, 10, 25, 50, 75, 100) and Mean Reciprocal Rank (MRR) obtained by the aforementioned methods.

Results

Category	Method	Macro Average
Category	Method	recall@1	recall@2	recall@3	recall@4	recall@5	recall@10	recall@25	recall@50	recall@75	recall@100	MRR
Wikimedia Existing Tools	Findlink*	0.002	0.002	0.003	0.003	0.003	0.003	0.004	0.004	0.005	0.005	0.002
Wikimedia Existing Tools	Morelike*	0.095	0.138	0.161	0.19	0.201	0.242	0.304	0.345	0.375	0.395	0.145
Heuristics	Reciprocity	0.058	0.09	0.123	0.136	0.148	0.183	0.201	0.204	0.204	0.205	0.097
Graph embeddings	VERSE	0.05	0.063	0.082	0.092	0.111	0.14	0.185	0.222	0.243	0.259	0.078
Proposed Approach	Link-translation	0.149	0.22	0.263	0.293	0.311	0.379	0.426	0.441	0.446	0.448	0.223

Category	Method	Micro Average
Category	Method	recall@1	recall@2	recall@3	recall@4	recall@5	recall@10	recall@25	recall@50	recall@75	recall@100	MRR
Wikimedia Existing Tools	Findlink*	0.002	0.002	0.003	0.003	0.003	0.004	0.005	0.007	0.007	0.008	0.003
Wikimedia Existing Tools	Morelike*	0.095	0.132	0.155	0.171	0.185	0.228	0.289	0.339	0.37	0.392	0.14
Heuristics	Reciprocity	0.03	0.064	0.108	0.131	0.153	0.212	0.251	0.258	0.26	0.261	0.083
Graph embeddings	VERSE	0.03	0.046	0.056	0.065	0.072	0.094	0.132	0.166	0.186	0.203	0.052
Proposed Approach	Link-translation	0.126	0.167	0.192	0.21	0.222	0.255	0.282	0.292	0.296	0.298	0.168

It is clear from the results in the aforementioned tables (best performance in bold) that the proposed link-translation approach considerably outperforms all the baselines (statistical significance tests TBD). Specifically, the link-translation approach is very powerful in critical application scenarios, exemplified by strong performances for (1) lower values of k (a recall@1 of 15% is a remarkably strong outcome), and (2) low-resourced languages (macro average is as good as, and even stronger than micro average, indicating that link-translation performs equally well, and in fact, better for languages with fewer resources).

Lastly, in some cases (Micro average of recall@k, with k>=25) Morelike outperforms the proposed link-translation based approach. We hypothesize that this could be due to a difference in evaluation setup. We have reasons to believe that the reported performance for Findlink and Morelike is an overestimation of their true performance. This is because Findlink and Morelike are available as APIs, and thus, we could not evaluate them on the dumps from a specific snapshot (in our case Jan 2022). Instead, the reported performance is based on the results obtained via the call to their APIs executed in July 2022, thereby, providing an unfair advantage to these methods as they have access to information beyond what was available in Jan 2022. We are currently working to resolve this by a two-pronged approach:

Identifying ways to run Morelike on the dumps from Jan 2022. We held discussions with the Cirrussearch team, and have identified ways to carry out such an experiment.
Morelike is based on textual content of each Wikipedia article. We are trying to leverage the complementary information manifested in the textual content by incorporating it as an additional signal in our link-translation approach.

A detailed evaluation of the aforementioned methods (and their variants) showcasing wiki-specific results on all the 305 language versions of Wikipedia along with some intermediary analysis are present in this Google sheet:Orphans: First-eval results.

References

↑ ^a ^b Edward Betts. The Find Link tool - Add Wikipedia links to pages that really ought to have a link. Available: https://edwardbetts.com/find_link/
↑ ^a ^b Morelike. Available: https://www.mediawiki.org/wiki/Help:CirrusSearch#Morelike
↑ ^a ^b Tsitsulin et al. VERSE: Versatile Graph Embeddings from Similarity Measures. Available: https://dl.acm.org/doi/10.1145/3178876.3186120

[:0-1] Edward Betts. The Find Link tool - Add Wikipedia links to pages that really ought to have a link. Available: https://edwardbetts.com/find_link/

[:1-2] Morelike. Available: https://www.mediawiki.org/wiki/Help:CirrusSearch#Morelike

[:2-3] Tsitsulin et al. VERSE: Versatile Graph Embeddings from Similarity Measures. Available: https://dl.acm.org/doi/10.1145/3178876.3186120

[1]

[2]

[3]