Research:Revision scoring as a service/Word lists/bs


ISO code Language Generated list Badwords Informal words Stopwords Dictionary Stemmer Contact person Wiki labels Interface Forms Campaign Needs
bs bosanski (Wikipedia) 250 - - - - - See: Word lists requested no no no -
Generated list [1]

Words in the generated list commonly appear in reverted revisions but not in others. This list is generated using a TF-IDF approach.

  1. abend
  2. aladin
  3. alapre
  4. alfoldy
  5. anderen
  6. apisa
  7. apsolutna
  8. arcmin
  9. arhižupan
  10. astronomska
  11. astronomski
  12. atlas
  13. aufmerksamkeit
  14. balija
  15. band
  16. baz
  17. besten
  18. bester
  19. bestimmt
  20. bigourdan
  21. boriću
  22. browse
  23. brzina
  24. bubaj
  25. button
  26. cat
  27. celu
  28. cest
  29. cgcg
  30. cgi
  31. chte
  32. cine
  33. commentaria
  34. dank
  35. datonu
  36. dec
  37. deklinacija
  38. dijeloma
  39. dobrodošlica
  40. doprinos
  41. dopuštan
  42. dopuštano
  43. drzava
  44. dve
  45. einmal
  46. entdeckung
  47. epoha
  48. fajla
  49. fašisti
  50. fedrativne
  51. freund
  52. freundes
  53. freundlichen
  54. galaksija
  55. gehen
  56. glup
  57. govna
  58. govno
  59. gsfc
  60. guten
  61. haben
  62. haha
  63. hause
  64. heasarc
  65. hier
  66. hliche
  67. ihnen
  68. ihr
  69. ihre
  70. ihres
  71. ilirdoma
  72. iliriski
  73. incidentnim
  74. interaktivni
  75. invazionista
  76. isključivani
  77. istorija
  78. izjašnjavaju
  79. izvorištem
  80. izvšeni
  81. java
  82. javelle
  83. jebe
  84. jebem
  85. jebi
  86. jebo
  87. jsp
  88. katalog
  89. katalogisierung
  90. katalozi
  91. kaze
  92. klasifikacija
  93. klaster
  94. kontaktieren
  95. ksg
  96. kurac
  97. kurcina
  98. lenin
  99. log
  100. lol
  101. luft
  102. mag
  103. magnituda
  104. mater
  105. mess
  106. messier
  107. mich
  108. morfološka
  109. moze
  110. mpc
  111. msg
  112. naj
  113. najmanji
  114. naoruzali
  115. naočigled
  116. napravio
  117. nasa
  118. nawlinwiki
  119. našiem
  120. ndig
  121. nebeln
  122. nebo
  123. nebrojeni
  124. neformatirani
  125. nelogičnih
  126. nenenaseljeno
  127. nesto
  128. neznam
  129. ngcdata
  130. ngcic
  131. ngcicproject
  132. nichts
  133. night
  134. nightskyatlas
  135. nista
  136. nnen
  137. noviplamen
  138. novosagrađena
  139. nschen
  140. objekata
  141. obnažene
  142. obs
  143. odbijani
  144. okrutnošću
  145. opći
  146. opština
  147. opštini
  148. orgaizovanje
  149. otkriće
  150. oštećivani
  151. parafrazirano
  152. parsek
  153. peder
  154. pederi
  155. picka
  156. picke
  157. pisser
  158. pička
  159. podebljan
  160. pokusava
  161. pokušavajuci
  162. pomak
  163. posmatrača
  164. posmatrači
  165. potkupljivati
  166. povijest
  167. povješničari
  168. površinska
  169. pregledaču
  170. prečnik
  171. pripojivši
  172. prividna
  173. prividne
  174. privoliti
  175. projekt
  176. puff
  177. puškomet
  178. pxwebhrv
  179. radijalna
  180. rektascenzija
  181. revizirani
  182. revngcic
  183. rgb
  184. rotiralo
  185. rušeni
  186. rxid
  187. sajtu
  188. sazviježđu
  189. sažetku
  190. schwassmann
  191. seds
  192. sid
  193. simbad
  194. sky
  195. slavljenog
  196. sollten
  197. spider
  198. sranje
  199. srbin
  200. srpski
  201. srpskom
  202. ssen
  203. sta
  204. ste
  205. steinicke
  206. sternhaufen
  207. sto
  208. strasbg
  209. svemir
  210. svijetlo
  211. svjetlosna
  212. swift
  213. takođerr
  214. titovskoj
  215. ubijane
  216. ucvršćivanja
  217. udaljena
  218. udaljenost
  219. ugao
  220. uglovna
  221. uspaničena
  222. vam
  223. vareša
  224. vcc
  225. vec
  226. vecina
  227. vidljivo
  228. vielen
  229. vise
  230. vjeri
  231. vukana
  232. weg
  233. weihnachten
  234. wenn
  235. wikisky
  236. wolfgang
  237. worten
  238. young
  239. zadnjeprispjeli
  240. zamišljano
  241. zapadati
  242. zatič
  243. zivjeli
  244. zivjelo
  245. značajnosti
  246. zuerst
  247. zvijezda
  248. zwg
  249. zzuuzz
  250. šireči
  251. županu
Generated common words

Common words appear on all revisions reverted or otherwise. In the English language this would include words like 'the' or 'is' which are meaningless on their own. This list is generated using a TF-IDF approach.

  1. accessdate
  2. ali
  3. align
  4. and
  5. astronomija
  6. author
  7. bazirano
  8. bez
  9. bih
  10. bila
  11. bili
  12. bilješke
  13. bilo
  14. bio
  15. biografije
  16. biti
  17. book
  18. border
  19. bosna
  20. bosne
  21. bosni
  22. broj
  23. buta
  24. cambridge
  25. catalogue
  26. catalogues
  27. category
  28. cellspacing
  29. center
  30. citation
  31. cite
  32. class
  33. clusters
  34. com
  35. commonscat
  36. complete
  37. constellation
  38. content
  39. corwin
  40. dan
  41. danas
  42. datoteka
  43. datum
  44. deset
  45. desno
  46. digital
  47. dio
  48. dok
  49. druge
  50. drugi
  51. drugo
  52. država
  53. države
  54. dužina
  55. dva
  56. dvije
  57. editor
  58. edu
  59. eliptična
  60. euklidska
  61. euklidsku
  62. first
  63. flag
  64. font
  65. galaxies
  66. gdje
  67. general
  68. gif
  69. glavni
  70. godina
  71. godine
  72. gov
  73. grad
  74. grada
  75. grb
  76. gustoća
  77. height
  78. hercegovina
  79. hercegovine
  80. hercegovini
  81. historija
  82. how
  83. htm
  84. html
  85. http
  86. ili
  87. ima
  88. ime
  89. index
  90. infokutija
  91. isbn
  92. između
  93. izvor
  94. izvori
  95. jakiel
  96. jedan
  97. jedna
  98. jer
  99. jezik
  100. još
  101. jpg
  102. kada
  103. kako
  104. kao
  105. karta
  106. kasnije
  107. kategorija
  108. kod
  109. koja
  110. koje
  111. koji
  112. koju
  113. kroz
  114. label
  115. last
  116. left
  117. line
  118. link
  119. linkovi
  120. literatura
  121. location
  122. lokacija
  123. map
  124. međutim
  125. mini
  126. minuta
  127. mjesta
  128. mjesto
  129. može
  130. najbliži
  131. najbližih
  132. nakon
  133. nalazi
  134. name
  135. naslov
  136. naziv
  137. nebulae
  138. nedostaju
  139. nekoliko
  140. new
  141. nije
  142. nisu
  143. note
  144. novi
  145. observe
  146. odewahn
  147. oko
  148. old
  149. opis
  150. općina
  151. org
  152. ova
  153. ovaj
  154. pdf
  155. php
  156. png
  157. pod
  158. pogledajte
  159. položaj
  160. površina
  161. preko
  162. prema
  163. preusmjeri
  164. prečkasta
  165. prije
  166. proširiti
  167. prvi
  168. publisher
  169. publishing
  170. put
  171. rat
  172. ref
  173. reference
  174. refspisak
  175. rezultati
  176. richard
  177. right
  178. rođeni
  179. rođenja
  180. sad
  181. sadrži
  182. samo
  183. sbb
  184. sbbc
  185. sbc
  186. sdss
  187. sekciju
  188. sib
  189. simboli
  190. sinnott
  191. size
  192. slika
  193. slike
  194. sljedeći
  195. sloan
  196. službeni
  197. small
  198. smrt
  199. smrti
  200. sortable
  201. spiralna
  202. spisak
  203. springer
  204. star
  205. strane
  206. stranica
  207. stub
  208. style
  209. survey
  210. sve
  211. svg
  212. svoje
  213. tako
  214. također
  215. tačka
  216. text
  217. the
  218. them
  219. thumb
  220. title
  221. toga
  222. tokom
  223. tri
  224. uglovnih
  225. ukupno
  226. umrli
  227. university
  228. uploads
  229. url
  230. vanjski
  231. vaucouleurs
  232. veliki
  233. veličina
  234. već
  235. vijek
  236. visina
  237. više
  238. vrijeme
  239. vrsta
  240. web
  241. wikitable
  242. work
  243. www
  244. year
  245. zastava
  246. zbog
  247. zvanična
  248. čvor
  249. širina
  250. što
Bad words

Bad words are words that would be commonly associated with vandalism. They are generally used to insult or be vulgar. This includes curse words, racial slurs, assertions of- and prejudices against sexual preferences.

  1. balija
  2. debil
  3. debili
  4. debilu
  5. drolja
  6. drolje
  7. droljetine
  8. droljo
  9. fašisti
  10. fuck
  11. govna
  12. govno
  13. iliriski
  14. jebanje
  15. jebe
  16. jebem
  17. jebem
  18. jebi
  19. jebiga
  20. jebite
  21. jebo
  22. kreten
  23. kretenčina
  24. kretenčuga
  25. kreteni
  26. kretenu
  27. kučka
  28. kuja
  29. kuje
  30. kurac
  31. kurce
  32. kurcina
  33. kurčina
  34. kurva
  35. lezbac
  36. lezbać
  37. maloglavi
  38. materinu
  39. mrš
  40. peder
  41. pederi
  42. pederima
  43. pederski
  44. pederu
  45. picka
  46. pička
  47. picke
  48. pičke
  49. picko
  50. pičko
  51. pizda
  52. pizdo
  53. pizdu
  54. puškomet
  55. shit
  56. sranje
  57. šupak
Informal words

Informal words are words unwelcome on article namespace but would be acceptable on talk pages. This would include words such as 'hello' or 'hahaha' which would be fine in discussions but not in articles.

  1. boriću
  2. bubaj
  3. drzava
  4. glup
  5. haha
  6. hahaha
  7. hahahaha
  8. hahahahaha
  9. hihi
  10. hihihi
  11. istorija
  12. lmao
  13. lol
  14. nesto
  15. neznam
  16. nista
  17. opština
  18. opštini
  19. orgaizovanje
  20. pokusava
  21. pokušavajuci
  22. povijest
  23. povješničari
  24. pregledaču
  25. šireči
  26. takođerr
  27. ucvršćivanja
  28. vecina
  29. zivjeli
  30. zivjelo