Research:Revision scoring as a service/Word lists/hr


ISO code Language Generated list Badwords Informal words Stopwords Dictionary Stemmer Contact person Wiki labels Interface Forms Campaign Needs
hr hrvatski (Wikipedia) 250 - - - - - See: Word lists requested no no no -
Generated list [1]

Words in the generated list commonly appear in reverted revisions but not in others. This list is generated using a TF-IDF approach.

  1. adeo
  2. ahmađyinad
  3. alkos
  4. allaha
  5. anatiomaros
  6. anegodat
  7. aprila
  8. atmosferskim
  9. automobilskih
  10. avio
  11. avionske
  12. avionskih
  13. bambifan
  14. bencin
  15. bensiini
  16. bensin
  17. benzina
  18. benzinas
  19. benzine
  20. benzini
  21. benzinjača
  22. benzino
  23. benzinu
  24. benzyna
  25. bljuvač
  26. bris
  27. budala
  28. budale
  29. cak
  30. cest
  31. cesto
  32. cet
  33. cilindru
  34. covek
  35. covjek
  36. crotouristica
  37. debil
  38. defnyddiwr
  39. deo
  40. dereventa
  41. doprinosi
  42. dragy
  43. dugorepy
  44. dve
  45. eats
  46. ejči
  47. eksploatacijsko
  48. elđi
  49. ententini
  50. epro
  51. essence
  52. evrope
  53. evropi
  54. facebook
  55. familije
  56. fijufić
  57. finepix
  58. formulu
  59. franulic
  60. gasolina
  61. gasoline
  62. gay
  63. gde
  64. glup
  65. glupa
  66. glupi
  67. glupost
  68. gluposti
  69. govana
  70. govna
  71. govno
  72. guravac
  73. haha
  74. hahaha
  75. hibry
  76. hibryd
  77. hnslatest
  78. homework
  79. hvala
  80. hydrocarbure
  81. ilustrisimus
  82. inace
  83. instalaciji
  84. isparljiv
  85. isparljivi
  86. isparljivost
  87. itakodalje
  88. izmedju
  89. jebanja
  90. jebanje
  91. jebač
  92. jebe
  93. jebem
  94. jebi
  95. jebiga
  96. jebite
  97. jebo
  98. jeste
  99. kaze
  100. kiky
  101. klipnih
  102. korny
  103. kreten
  104. kreteni
  105. kurac
  106. kurca
  107. kurce
  108. kurva
  109. kurzivni
  110. lebac
  111. lenga
  112. liganjac
  113. lochead
  114. logiteč
  115. lol
  116. lupanja
  117. maloglavi
  118. mater
  119. materina
  120. mauli
  121. medju
  122. mejkor
  123. međupopisnom
  124. midorag
  125. miky
  126. mirnije
  127. mockbuster
  128. morons
  129. moze
  130. mozete
  131. muljavac
  132. mundravac
  133. nacin
  134. naj
  135. najcesce
  136. najveca
  137. najveci
  138. najvise
  139. nazalost
  140. nazy
  141. nemala
  142. neoblikovani
  143. nepodobna
  144. nesagorive
  145. nesto
  146. nezna
  147. neznam
  148. nečlanova
  149. nista
  150. niste
  151. nowiki
  152. obdy
  153. ogg
  154. oksimorfem
  155. oktanska
  156. oktanske
  157. opštine
  158. ostavljati
  159. pampered
  160. parazyt
  161. peatrail
  162. peder
  163. pederi
  164. pederski
  165. pederčina
  166. penjanje
  167. petrol
  168. picka
  169. picku
  170. pig
  171. pirgavac
  172. pička
  173. pičke
  174. pičku
  175. ple
  176. plinski
  177. podebljani
  178. posle
  179. postavljenoj
  180. povlaštenima
  181. protuustavnoj
  182. pry
  183. pumpi
  184. punđo
  185. radoviđen
  186. rafinerije
  187. rasplinjač
  188. reci
  189. refinery
  190. rips
  191. rodjen
  192. rutavy
  193. sakrij
  194. seadestdva
  195. shit
  196. siromašnijom
  197. skiny
  198. smajlox
  199. smetnje
  200. smjesom
  201. smjesu
  202. smola
  203. smrdi
  204. sranje
  205. srbin
  206. sta
  207. stausu
  208. ste
  209. sto
  210. strucnjaci
  211. suljić
  212. suljo
  213. suodlučivanju
  214. suradničko
  215. svedeni
  216. tacno
  217. takodje
  218. takođe
  219. tlakovima
  220. unesi
  221. unesite
  222. uoka
  223. ustase
  224. uvek
  225. uzlijetanje
  226. vam
  227. vas
  228. vecina
  229. veterinu
  230. vise
  231. voli
  232. volim
  233. vrelišta
  234. vreme
  235. wikedsik
  236. yakumo
  237. yelinek
  238. zagrebacki
  239. zanzybar
  240. zimzy
  241. zirodent
  242. zivi
  243. zivota
  244. zločinac
  245. zmijicat
  246. zoks
  247. zoky
  248. zoljavac
  249. zomy
  250. zujar
  251. čađenja
  252. čepovi
  253. šipac
  254. šta
  255. šupak
  256. žemy
  257. žižo
  258. žužy
Generated common words

Common words appear on all revisions reverted or otherwise. In the English language this would include words like 'the' or 'is' which are meaningless on their own. This list is generated using a TF-IDF approach.

  1. ako
  2. ali
  3. align
  4. and
  5. asp
  6. aspx
  7. bez
  8. bila
  9. bili
  10. bilo
  11. bio
  12. biti
  13. broj
  14. category
  15. center
  16. class
  17. com
  18. commons
  19. commonscat
  20. commonscathr
  21. dan
  22. dana
  23. danas
  24. datoteka
  25. datum
  26. defaultsort
  27. desno
  28. dio
  29. dobio
  30. dok
  31. dolazi
  32. druga
  33. druge
  34. drugi
  35. drugih
  36. država
  37. države
  38. dva
  39. dvije
  40. eng
  41. file
  42. gdje
  43. glavni
  44. glavniraspored
  45. godina
  46. godine
  47. grad
  48. grada
  49. hrvatska
  50. hrvatske
  51. hrvatski
  52. hrvatskoj
  53. htm
  54. html
  55. http
  56. iako
  57. ili
  58. ima
  59. image
  60. imaju
  61. imao
  62. ime
  63. index
  64. infookvir
  65. interwiki
  66. ipak
  67. ivan
  68. između
  69. izvor
  70. izvori
  71. jedan
  72. jedna
  73. jednom
  74. jer
  75. jezik
  76. još
  77. jpg
  78. kad
  79. kada
  80. kako
  81. kao
  82. karta
  83. kasnije
  84. kategorija
  85. kod
  86. koja
  87. koje
  88. kojeg
  89. kojem
  90. koji
  91. kojih
  92. kojima
  93. kojoj
  94. koju
  95. kolovoza
  96. kraj
  97. kroz
  98. left
  99. lijevo
  100. link
  101. lipnja
  102. listopada
  103. ljudi
  104. među
  105. mini
  106. mjesta
  107. mjesto
  108. mjestu
  109. mogu
  110. može
  111. mrva
  112. nagrade
  113. nakon
  114. nalazi
  115. name
  116. naslov
  117. naziv
  118. način
  119. nego
  120. neke
  121. neki
  122. nekoliko
  123. nema
  124. net
  125. nije
  126. nisu
  127. njegov
  128. njegova
  129. njih
  130. novi
  131. odnosno
  132. oko
  133. old
  134. ona
  135. oni
  136. opis
  137. org
  138. osim
  139. ostali
  140. ova
  141. ovaj
  142. ove
  143. ovo
  144. oznaka
  145. ožujka
  146. pdf
  147. php
  148. png
  149. pod
  150. području
  151. popis
  152. poslije
  153. postaje
  154. postao
  155. postoji
  156. poveznice
  157. povijest
  158. povijesti
  159. pred
  160. preko
  161. prema
  162. preusmjeri
  163. pri
  164. prije
  165. prosinca
  166. protiv
  167. prva
  168. prvi
  169. puno
  170. put
  171. puta
  172. radi
  173. rat
  174. rata
  175. ref
  176. republike
  177. right
  178. rođenja
  179. rujna
  180. sad
  181. sam
  182. samo
  183. sastav
  184. siječnja
  185. slika
  186. slike
  187. small
  188. smrti
  189. srpnja
  190. stoljeća
  191. stoljeće
  192. str
  193. strane
  194. stranica
  195. stub
  196. style
  197. sve
  198. svg
  199. svi
  200. svibnja
  201. svih
  202. svjetski
  203. svoj
  204. svoje
  205. svojim
  206. svoju
  207. tada
  208. taj
  209. tako
  210. također
  211. tek
  212. the
  213. thumb
  214. tijekom
  215. time
  216. title
  217. toga
  218. tom
  219. tome
  220. travnja
  221. tri
  222. uglavnom
  223. uvijek
  224. vanjske
  225. velika
  226. velike
  227. veliki
  228. veličina
  229. veljače
  230. već
  231. vidi
  232. više
  233. vremena
  234. vrijeme
  235. vrlo
  236. vrsta
  237. web
  238. wprojekti
  239. www
  240. zagreb
  241. zajedno
  242. zbog
  243. čak
  244. često
  245. četiri
  246. širina
  247. što
  248. život
  249. životopis
  250. životopisi
Bad words

Bad words are words that would be commonly associated with vandalism. They are generally used to insult or be vulgar. This includes curse words, racial slurs, assertions of- and prejudices against sexual preferences.

  1. fuck
  2. jebi
  3. jebite
  4. jebanje
  5. kučka
  6. kurva
  7. kuja
  8. kuje
  9. prokleta
  10. proklet
  11. proklete
  12. prokleto
  13. drolja
  14. drolje
  15. droljetine
  16. droljo
  17. kreten
  18. kretenčuga
  19. kretenčina
  20. kreteni
  21. kretenu
  22. krebil
  23. krebulu
  24. krebili
  25. idiot
  26. idijot
  27. idijoti
  28. idioti
  29. glupan
  30. glupani
  31. glupav
  32. glupavi
  33. glupavo
  34. glupson
  35. glupsoni
  36. glupača
  37. glupaća
  38. glupačo
  39. glupaćo
  40. glupo
  41. glup
  42. glupi
  43. debil
  44. debilu
  45. debili
  46. debel
  47. debelo
  48. debela
  49. debeli
  50. shit
  51. sranje
  52. sranja
  53. govno
  54. govna
  55. govana
  56. kurac
  57. kurca
  58. pička
  59. pičku
  60. pizda
  61. pizdu
  62. ukurac
  63. mrš
  64. marš
  65. peder
  66. pederu
  67. pederi
  68. gay
  69. dragy
  70. glupa
  71. glupost
  72. gluposti
  73. jebanja
  74. jebač
  75. jebe
  76. jebem
  77. jebiga
  78. jebo
  79. defnyddiwr
  80. ententini
  81. kurce
  82. materina
  83. pederski
  84. fijufić
  85. pederčina
  86. picka
  87. picku
  88. pičke
  89. šupak
  90. šipac
  91. pig
  92. lebac
  93. nazi
  94. nazy
  95. morons
  96. budala
  97. smrdi
  98. budale
  99. bljuvač
  100. suljić
  101. suljo
  102. zločinac
  103. maloglavi
Informal words

Informal words are words unwelcome on article namespace but would be acceptable on talk pages. This would include words such as 'hello' or 'hahaha' which would be fine in discussions but not in articles.

  1. adeo
  2. pozdrav
  3. bok
  4. lol
  5. hej
  6. haha
  7. hahaha
  8. nezna
  9. neznam
  10. hahahah
  11. hahahaha
  12. okej
  13. jeste
  14. ok
  15. vidimo se
  16. hvala
  17. zahvaljujem
  18. inace
  19. inače
  20. šta
  21. vas
  22. moze
  23. mozete
  24. gde
  25. reci
  26. niste
  27. unesi
  28. unesite
  29. suradnik
  30. suradnicko
  31. suradničko
  32. suradnica
  33. suradnice
  34. suradnici
  35. vam
  36. čak
  37. ste
  38. sta