Template:Model card ORES damaging edit/ja

Model card
This page is an on-wiki machine learning model card.
A diagram of a neural network
A model card is a document about a machine learning model that seeks to answer basic questions about the model.
Model Information Hub
Model creator(s)Aaron Halfaker (User:EpochFail) and Amir Sarabadani
Model owner(s)WMF Machine Learning Team (ml@wikimediafoundation.org)
Model interfaceOres homepage
CodeORES GithubORES training dataおよびORES model binaries
Uses PIINo
In production?Yes
Which projects?{{{language}}} {{{project}}}
このモデルは,修正に関するデータを使用して,修正が有害である可能性を予測する.


動機

edit

善意の編集は,文章に害をもたらすものであり,悪意の編集はすべて悪意ではない.このモデル (善意のモデルとともに) は,意図的に有害な編集 (悪意/破壊主義) と有害な編集の区別を目的としている (善意・善意の修正/悪意の損傷).

このモデルは,潜在的な有害な編集や破壊行為のレビューを優先する手助けをします.特定の修正が有害であるか否かを予測し,信頼のレベルを測定する確率をいくつか提供します.

ユーザー及び利用

edit
Use this model for
  • このモデルは,日本語ウィキペディアにおける破壊行為のレビューと潜在的な逆戻りに優先順位を与えるために使用されるべきである.
  • このモデルは,日本語ウィキペディアの編集者の有害な貢献を検出するために使用されるべきです.
Don't use this model for
  • このモデルは,編集が有害であるかどうかを決定する最終的な仲裁者として使用されるべきではない.
  • このモデルは日本語ウィキペディアの外では使用されるべきではありません.
Current uses
  • 日本語ウィキペディアは,効率的な破壊調査,レビュー編集,または新人サポートを可能にするサービスとしてこのモデルを使用しています.
  • 個別的に,誰でも,適切なフォーマットされたAPI呼び出しをORESに提出し,このモデルの結果を返却することができます.
Example API call:
{{{model_input}}}

倫理的考慮事項,注意事項,勧告

edit

日本語ウィキペディアはこのモデルを使用することを決定しました.時間とともに,このモデルはコミュニティでの使用によって検証されました.

このモデルは新しい編集者に 編集を害する可能性が高くなる.

このモデルが時代遅れになるか,もはや使用できないものとする内部または外部変更は,

  • データ漂移は,モデルのためのトレーニングデータがもはや使用できないことを意味します.
  • 生産で望ましいパフォーマンスメトリックを満たしていない.
  • 日本語ウィキペディアコミュニティは,このモデルを使用しないことを決定しました.

モデル

edit

性能

edit

Test data confusion matrix: {{{confusion_matrix}}}

Test data sample rates: {{{sample_rates}}}

Test data performance: {{{performance}}}

実施

edit
Model architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}

Output:

{{{model_output}}}

データは

edit
Data pipeline
編集に関する表記データは Mediawiki APIから収集され,事前処理 (ログ変換,公開編集者データなど) で結合し,ユーザー生成した善意/有害なラベルに結合されます.
Training data
このモデルは数年前の手書きの訓練データを使って訓練されました
Test data
ここで報告された統計は,訓練プロセスから引き離される訓練データのランダムな分割を選択して計算された.そのモデルはそのデータに基づいて予測を行い,その基礎的な基礎真実と比較した.

ライセンス

edit

引用

edit

Cite this model card as:

@misc{
  Triedman_Bazira_2023_{{{language}}}_{{{project}}}_damaging,
  title={ {{{language}}} {{{project}}} damaging model card },
  author={ Triedman, Harold and Bazira, Kevin },
  year={ 2023 },
  url={ https://meta.wikimedia.org/wiki/Model_card_ORES_damaging_edit/ja }
}