Template:Model card ORES damaging edit/pt

Model card
This page is an on-wiki machine learning model card.
A diagram of a neural network
A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interfaceOres homepage
CodeORES Github, ORES training data, e ORES model binaries
Uses PIINo
In production?Yes
Which projects?{{{language}}} {{{project}}}
Este modelo utiliza dados sobre uma revisão para prever a probabilidade de que a revisão seja prejudicial.


Motivação

edit

Algumas edições de boa fé prejudicam um artigo, e nem todas as edições prejudiciais são de má fé. Este modelo (junto com um modelo de boa fé) é destinado a diferenciar entre edições que são intencionalmente prejudiciais (mafia / vandalismo) e edições que pretendem ser prejudiciais (boas edições / dano de boa fé).

Este modelo ajuda a priorizar a revisão de edições potencialmente prejudiciais ou vandalismo. Ele fornece uma previsão sobre se uma determinada revisão é prejudicial ou não, e fornece algumas probabilidades para servir como uma medida do seu nível de confiança.

Utilizadores e utilizações

edit
Use this model for
  • Este modelo deve ser utilizado para priorizar a revisão e a possível reversão do vandalismo na Wikipédia portuguesa.
  • Este modelo deve ser utilizado para detectar contribuições prejudiciais de editores na Wikipédia portuguesa.
Don't use this model for
  • Este modelo não deve ser utilizado como árbitro final sobre se uma edição deve ou não ser considerada prejudicial.
  • O modelo não deve ser utilizado fora da Wikipédia portuguesa.
Current uses
  • A Wikipédia Portuguesa usa o modelo como um serviço para facilitar a triagem eficiente de vandalismo, editar avaliações ou apoiar recém-chegados.
  • Em uma base individual, qualquer pessoa pode enviar uma chamada de API de forma correta para a ORES para uma revisão dada e obter o resultado deste modelo.
Example API call:
{{{model_input}}}

Considerações éticas, avisos e recomendações

edit

A Wikipédia Portuguesa decidiu usar este modelo.

Este modelo é conhecido por dar aos editores mais novos uma maior probabilidade de edições prejudiciais.

As alterações internas ou externas que podem tornar este modelo obsoleto ou não mais utilizável são:

  • A deriva de dados significa que os dados de formação do modelo deixam de ser utilizáveis.
  • Não atende às métricas de desempenho desejadas na produção.
  • A comunidade portuguesa da Wikipédia decide não usar mais este modelo.

Modelo

edit

Performance

edit

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

Implementação

edit
Model architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}

Output:

{{{model_output}}}

Dados

edit
Data pipeline
Os dados tabulares sobre edições são coletados a partir da API da Mediawiki, pré-processados (através de log-transformações, juntando-se aos dados do editor público, etc.), e unidos a rótulos de boa fé/destruição gerados pelo usuário.
Training data
Este modelo foi treinado utilizando dados de formação etiquetados à mão que têm vários anos.
Test data
As estatísticas aqui relatadas foram calculadas selecionando uma partição aleatória dos dados de formação para se manterem fora do processo de formação.

Licenças

edit

Citação

edit

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_damaging,
  title={ {{{language}}} {{{project}}} damaging model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_ORES_damaging_edit/pt }
}