Investigación:Premio de investigación Wikimedia Francia/Artículos nominados/Creando, destruyendo y restaurando valor en Wikipedia

Creando, destruyendo y restaurando valor en Wikipedia

Creando, destruyendo y restaurando valor en Wikipedia es un artículo innovador y clásico publicado en la conferencia de la ACM sobre el apoyo al trabajo en grupo (GROUP) en 2007.

El texto completo está disponible aquí.

Resumen

Este artículo presenta un enfoque cuantitativo para medir el impacto de una edición. Los seis autores (Reid Priedhorsky, Jilin Chen, Shyong (Tony) K. Lam, Katherine Panciera, Loren Terveen, y John Riedl) trabajaron en el laboratorio de investigación GroupLens en la Universidad de Minnesota.

Los autores sugieren cuantificar el impacto de una edición determinada usando el número de veces que dicha edición ha sido vista. Construyen el concepto de vista persistente de palabra (VPP) a partir en la idea de la vista de un artículo: cada vez que se ve un artículo, también se ven todas sus palabras. Cuando una palabra escrita por un editor X es vista, entonces esa persona recibe crédito con una VPP.

Usan grupos de datos que cubren cuatro años, analizando 4,2 millones de editores y 58 millones de ediciones, con resultados resaltando la importancia de los editores frecuentes, quienes dominan lo que la gente ve cuando visitan Wikipedia y mostrando que este dominio se está incrementando. Por ejemplo, el 10% de los mayores editores por cantidad de ediciones contribuyen el 85% de las VPP, y el 0,1% de los mayores editores contribuyó el 44%.

También implementan una medida de detección de vandalismo usando solamente los comentarios asociados a las reversiones. La métrica se implementa usando un protocolo de análisis sofisticado parcialmente automatizado y parcialmente manual que muestra la velocidad de reparación de los daños (el 42% de los incidentes de vandalismo se reparan inmediatamente, con solamente el 0,75% de los incidentes persistiendo por más de 1000 visitas). Es interesante que no solo consideran la cantidad de tiempo que los artículos permanecieron vandalizados, sino también la cantidad de veces que fueron visitados en ese estado. Muestran que el impacto general del daño en Wikipedia es bajo pero que está aumentando. La aparición de bots para reparar el vandalismo a inicios de 2006 parece haber detenido el crecimiento exponencial.

Usan categorías de daños a los artículos (sin sentido, ofensivo, contenido falso, ...) identificadas a partir de artículos anteriores, como el artículo de 2004 «Estudio sobre la cooperación y el conflicto entre autores con visualizaciones de flujos históricos» (también nominado para este premio), pero también agregan algunas propias (desinformación, borrado parcial, contenido promocional). Usando el juicio humano, muestra que la mayor parte de los daños pertenecen a la categoría «sin sentido».

Comentarios de los jueces

ideas influyentes, enfoque cuantitativo, mucho contenido

Vote for this paper

Vote

  1. Very useful measure of edit impact. Avenue (talk) 00:12, 25 February 2013 (UTC)
  2. Interesting work --PierreSelim (talk) 13:29, 26 February 2013 (UTC)
  3. Ypnypn (talk) 13:55, 6 March 2013 (UTC)
  4. Most definitely; the D_LOOSE and D_STRICT regular expressions alone would win this a prize. Ironholds (talk) 21:22, 9 March 2013 (UTC)
  5. Introduces several broadly relevant new metrics for assessing edit impact & article quality; shows the importance of Wikipedia's core editor base in creating and maintaining the value of the encyclopedia, refuting the commonsense notion that Wikipedia is somehow a product of a nameless, faceless "crowd". And exposes both the ways in which Wikipedia and open wikis in general are vulnerable to quality degradation, and the robust mechanisms that exist to combat it. Best of the five! Disclosure: I have co-authored a research paper with the last author. Jtmorgan (talk) 21:27, 10 March 2013 (UTC)
  6. Tbayer (WMF) (talk) 22:31, 10 March 2013 (UTC)
  7. "Persistent word view" is a interesting idea. Finn Årup Nielsen (fnielsen) (talk) 13:57, 11 March 2013 (UTC)