Template:Model card ORES damaging edit/es

Model card
This page is an on-wiki machine learning model card.
A diagram of a neural network
A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interfaceOres homepage
CodeORES Github, ORES training data, y ORES model binaries
Uses PIINo
In production?Yes
Which projects?{{{language}}} {{{project}}}
Este modelo utiliza datos sobre una revisión para predecir la probabilidad de que la revisión sea perjudicial.


Motivación

edit

Algunas ediciones de buena fe dañan un artículo, y no todas las ediciones dañinas son de mala fe. Este modelo (junto con un modelo de buena fe) tiene como objetivo diferenciar entre ediciones que son intencionalmente dañinas (mal fe/vandalismo) y ediciones que tienen como objetivo ser dañinas.

Este modelo ayuda a priorizar la revisión de ediciones potencialmente dañinas o vandalismo. proporciona una predicción sobre si una revisión dada es dañina o no, y proporciona algunas probabilidades para servir como medida de su nivel de confianza.

Utilizadores y usos

edit
Use this model for
  • Este modelo debe utilizarse para priorizar la revisión y la posible reversión del vandalismo en la Wikipedia española.
  • Este modelo debe utilizarse para detectar contribuciones perjudiciales de los editores en la Wikipedia española.
Don't use this model for
  • Este modelo no debe utilizarse como árbitro final de si una edición debe o no considerarse perjudicial.
  • El modelo no debe utilizarse fuera de la Wikipedia española.
Current uses
  • Wikipedia Española utiliza el modelo como un servicio para facilitar el triaje eficiente del vandalismo, editar reseñas o apoyar a los recién llegados.
  • En una base individual, cualquiera puede enviar una llamada de API correctamente formateada a ORES para una revisión dada y obtener el resultado de este modelo.
Example API call:
{{{model_input}}}

Considerancias éticas, advertencias y recomendaciones

edit

Wikipedia española decidió utilizar este modelo. Con el tiempo, el modelo ha sido validado a través del uso en la comunidad.

Este modelo es conocido por dar a los editores más nuevos una mayor probabilidad de que las ediciones dañen.

Los cambios internos o externos que podrían hacer que este modelo sea obsoleto o ya no pueda utilizarse son:

  • La deriva de datos significa que los datos de formación del modelo ya no son utilizables.
  • No cumple con las métricas de rendimiento deseadas en la producción.
  • La comunidad de Wikipedia en español decide no utilizar más este modelo.

Modelo

edit

Desempeño

edit

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

Aplicación

edit
Model architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}

Output:

{{{model_output}}}

Datos

edit
Data pipeline
Los datos tablales sobre las ediciones se recogen de la API de Mediawiki, se procesan previamente (a través de las transformaciones de registro, se unen con los datos del editor público, etc.), y se unen a las etiquetas de buena fe/dañinas generadas por el usuario.
Training data
Este modelo fue entrenado utilizando datos de entrenamiento etiquetados a mano que tienen varios años de antigüedad.
Test data
Las estadísticas presentadas aquí se calcularon seleccionando una partición aleatoria de los datos de formación para mantenerse fuera del proceso de formación.

Licencias

edit

Citación

edit

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_damaging,
  title={ {{{language}}} {{{project}}} damaging model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_ORES_damaging_edit/es }
}