Research:Revision scoring as a service/Word lists/no


ISO code Language Generated list Badwords Informal words Stopwords Dictionary Stemmer Contact person Wiki labels Interface Forms Campaign Needs
no norsk (Wikipedia) 250 - - - - - See: Word lists requested no no no -
Generated list [1]

Words in the generated list commonly appear in reverted revisions but not in others. This list is generated using a TF-IDF approach.

  1. abduct
  2. abducted
  3. abduction
  4. abetting
  5. administratorene
  6. administratorer
  7. adresser
  8. ambassador
  9. anal
  10. arrange
  11. arranging
  12. arrest
  13. artikkelrommet
  14. ascott
  15. assurance
  16. attn
  17. baht
  18. balla
  19. bangkokpost
  20. bastards
  21. beneficiary
  22. bieber
  23. billiardballs
  24. blocked
  25. bombene
  26. bæsj
  27. bæsje
  28. bæsjen
  29. bæsjer
  30. cartel
  31. causing
  32. cet
  33. commited
  34. committing
  35. connected
  36. criminals
  37. dahlmo
  38. dealers
  39. defraud
  40. defrauded
  41. deilig
  42. digg
  43. dildo
  44. doing
  45. drinks
  46. drit
  47. dritt
  48. dum
  49. dust
  50. easyspace
  51. elsewhere
  52. emails
  53. ementor
  54. enclosed
  55. etterforsk
  56. example
  57. ezzex
  58. fack
  59. faen
  60. feit
  61. fet
  62. fitta
  63. fitte
  64. fogh
  65. forged
  66. forsøple
  67. fraud
  68. frauds
  69. fuck
  70. fucka
  71. funds
  72. gay
  73. girlfriend
  74. gøy
  75. haha
  76. hahaha
  77. hahahaha
  78. hahahahaha
  79. halla
  80. hallo
  81. hardbarka
  82. harim
  83. hater
  84. heathside
  85. hehe
  86. hei
  87. heihei
  88. heroin
  89. hihi
  90. hilsen
  91. homo
  92. homse
  93. homser
  94. hore
  95. horer
  96. idiot
  97. interfering
  98. intimidated
  99. isorel
  100. jaja
  101. janedoe
  102. jcb
  103. jeblad
  104. jellinek
  105. jepp
  106. jævla
  107. jævlig
  108. killtown
  109. klinsj
  110. klynge
  111. knull
  112. knulla
  113. knulle
  114. knuller
  115. kontrakts
  116. kph
  117. kreung
  118. kuk
  119. kuken
  120. kuker
  121. kukk
  122. kul
  123. kuleste
  124. kåt
  125. kødd
  126. laundering
  127. lawyers
  128. lenketittel
  129. liker
  130. likes
  131. lol
  132. loose
  133. looted
  134. looting
  135. lovlydige
  136. mafia
  137. manipulate
  138. massemord
  139. massemordet
  140. massemyrder
  141. mecos
  142. menneskerettighetsforbrytelser
  143. menneskerettighetsforbryteren
  144. mervyn
  145. mordi
  146. morra
  147. murdered
  148. murdering
  149. mvh
  150. målside
  151. nazist
  152. nazister
  153. nazistisk
  154. nesbitt
  155. netnapa
  156. nettverkene
  157. nextgentel
  158. noder
  159. nothings
  160. oppmerksomme
  161. overskrift
  162. overstreket
  163. paedophile
  164. paedophiles
  165. pattaya
  166. pedofil
  167. penis
  168. pikk
  169. pikken
  170. piss
  171. porno
  172. prescott
  173. prioriterer
  174. promp
  175. pst
  176. pule
  177. puler
  178. pulte
  179. pupper
  180. rar
  181. recall
  182. reminder
  183. ressursjer
  184. robbed
  185. robbing
  186. rompa
  187. rompe
  188. romper
  189. ruler
  190. ræva
  191. røster
  192. sabotasje
  193. samarbeidspartnere
  194. satanic
  195. satanists
  196. sathorn
  197. scientologists
  198. scientology
  199. sensurerer
  200. sex
  201. sexy
  202. skjønner
  203. soi
  204. solicitors
  205. soulkeeper
  206. statsmakter
  207. stealing
  208. stygg
  209. suck
  210. sug
  211. suge
  212. suger
  213. sulphate
  214. suspect
  215. swap
  216. taenjamras
  217. tampered
  218. tango
  219. teit
  220. tele
  221. terrorise
  222. terrorised
  223. terrorising
  224. terrorist
  225. terrorstorm
  226. thaicia
  227. thetasym
  228. tildekke
  229. tiss
  230. tissemann
  231. tissen
  232. torturere
  233. torturerer
  234. tull
  235. uformatert
  236. ulflarsen
  237. ulovligheter
  238. untrustworthy
  239. uob
  240. vandaliseringen
  241. wanton
  242. weybridge
  243. whilst
  244. wikipeida
  245. woking
  246. wtc
  247. yaa
  248. yolo
  249. ytringsfriheten
  250. zorroiii
Generated common words

Common words appear on all revisions reverted or otherwise. In the English language this would include words like 'the' or 'is' which are meaningless on their own. This list is generated using a TF-IDF approach.

  1. alle
  2. alt
  3. and
  4. andre
  5. annen
  6. annet
  7. april
  8. august
  9. autoritetsdata
  10. bare
  11. begge
  12. begynte
  13. består
  14. bilde
  15. bildetekst
  16. biografi
  17. blant
  18. ble
  19. bli
  20. blir
  21. blitt
  22. bruk
  23. brukes
  24. brukt
  25. både
  26. com
  27. commons
  28. dag
  29. dato
  30. defaultsort
  31. del
  32. deler
  33. dem
  34. den
  35. denne
  36. der
  37. deres
  38. derfor
  39. dermed
  40. desember
  41. det
  42. dette
  43. disse
  44. død
  45. dødsfall
  46. egen
  47. eksempel
  48. eksterne
  49. eller
  50. ene
  51. eneste
  52. engelsk
  53. enn
  54. ett
  55. etter
  56. europa
  57. februar
  58. fikk
  59. fil
  60. finnes
  61. fire
  62. flagg
  63. flere
  64. fleste
  65. for
  66. fordi
  67. forfatter
  68. forskjellige
  69. fra
  70. fram
  71. frem
  72. fått
  73. fødsler
  74. født
  75. før
  76. først
  77. første
  78. gamle
  79. gang
  80. ganger
  81. geografi
  82. gikk
  83. gjennom
  84. gjorde
  85. grunn
  86. går
  87. hadde
  88. han
  89. hans
  90. har
  91. hele
  92. helt
  93. her
  94. historie
  95. hos
  96. htm
  97. html
  98. http
  99. hva
  100. hver
  101. hvert
  102. hvor
  103. igjen
  104. ikke
  105. image
  106. imidlertid
  107. infoboks
  108. ingen
  109. inn
  110. innen
  111. isbn
  112. januar
  113. jpg
  114. juli
  115. juni
  116. kalt
  117. kan
  118. kart
  119. kategori
  120. kilde
  121. kildeløs
  122. kilder
  123. kjent
  124. kjente
  125. kom
  126. kommer
  127. kun
  128. kunne
  129. land
  130. left
  131. lenker
  132. ligger
  133. like
  134. link
  135. liste
  136. litteratur
  137. mai
  138. man
  139. mange
  140. mars
  141. med
  142. mellom
  143. men
  144. mens
  145. mer
  146. mest
  147. mindre
  148. mot
  149. mye
  150. name
  151. navn
  152. navnet
  153. nbsp
  154. ned
  155. noe
  156. noen
  157. nord
  158. norge
  159. norges
  160. norsk
  161. norske
  162. november
  163. nye
  164. når
  165. offisielt
  166. ofte
  167. også
  168. okt
  169. oktober
  170. old
  171. omdirigering
  172. opp
  173. org
  174. oslo
  175. over
  176. per
  177. personer
  178. png
  179. portal
  180. ref
  181. referanser
  182. references
  183. reflist
  184. rekke
  185. right
  186. rundt
  187. samme
  188. sammen
  189. samt
  190. samtidig
  191. satt
  192. seg
  193. selv
  194. senere
  195. september
  196. sett
  197. side
  198. siden
  199. sin
  200. sine
  201. siste
  202. sitt
  203. skal
  204. skulle
  205. slik
  206. som
  207. spesielt
  208. språk
  209. stor
  210. store
  211. stort
  212. større
  213. største
  214. svg
  215. svært
  216. særlig
  217. sør
  218. tallet
  219. tatt
  220. the
  221. thumb
  222. tid
  223. tiden
  224. tidligere
  225. til
  226. tilbake
  227. tillegg
  228. tittel
  229. tok
  230. tre
  231. type
  232. ulike
  233. under
  234. url
  235. usa
  236. uten
  237. var
  238. ved
  239. verden
  240. vest
  241. videre
  242. viktig
  243. vil
  244. ville
  245. vis
  246. være
  247. vært
  248. www
  249. årene
  250. året
Bad words

Bad words are words that would be commonly associated with vandalism. They are generally used to insult or be vulgar. This includes curse words, racial slurs, assertions of- and prejudices against sexual preferences.

  1. b1tch
  2. bitch
  3. blabla
  4. boobs
  5. bullshit
  6. bæsj
  7. bæsje
  8. bæsjen
  9. bæsjer
  10. cool
  11. cunt
  12. drit
  13. dritt
  14. fack
  15. faen
  16. fitta
  17. fitte
  18. fuck
  19. fucka
  20. homo
  21. homoseksuell
  22. homse
  23. hore
  24. jævla
  25. jævlig
  26. knull
  27. knulle
  28. kuk
  29. kukk
  30. kåt
  31. kødd
  32. ludder
  33. mordi
  34. motherfucker
  35. niggah
  36. nigger
  37. p0rn
  38. p3nis
  39. p3n1s
  40. pen1s
  41. pikk
  42. porn
  43. pr0n
  44. pule
  45. pulte
  46. pupper
  47. pussy
  48. rompa
  49. rompe
  50. ræva
  51. stupid
  52. teit
  53. tissemann
  54. tits
  55. twat
  56. wanker
  57. weed
  58. whore
Informal words

Informal words are words unwelcome on article namespace but would be acceptable on talk pages. This would include words such as 'hello' or 'hahaha' which would be fine in discussions but not in articles.

  1. haha
  2. hallo
  3. hehe
  4. hei
  5. heisann
  6. hey
  7. heya
  8. hihi
  9. lmao
  10. lol
  11. omg
  12. rofl
  13. yea
  14. yeah