Template:Model card ORES damaging edit/zh
Model card | |
---|---|
This page is an on-wiki machine learning model card. | |
Model Information Hub | |
Model creator(s) | Aaron Halfaker (User:EpochFail) and Amir Sarabadani |
Model owner(s) | WMF Machine Learning Team (ml@wikimediafoundation.org) |
Model interface | Ores homepage |
Code | ORES Github、ORES training data和ORES model binaries |
Uses PII | No |
In production? | Yes |
Which projects? | {{{language}}} {{{project}}} |
这个模型使用关于修订的数据来预测修订的可能性。 | |
动机
edit一些善意修改对一篇文章造成了损害,并非所有有害修改都是恶意的。 这个模型 (加上善意模型) 旨在区分有意有害的修改 (不信仰/破坏) 和旨在有害的修复 (善意修复/善意损害) 。
这种模型有助于优先考虑对可能有害的修改或破坏行为。 它提供了一个预测,即给定的修改是否会有损害,并提供了一些作为其自信水平的衡量标准的可能性。
用户和用途
editUse this model for
- 这个模型应该用于优先考虑中文维基百科上破坏的审查和可能的逆转。
- 这个模型应用于检测中文维基百科编辑的损害贡献。
Don't use this model for
- 这个模型不应用作修改是否应该被认为是有害的最终仲裁者。
- 该模型不应在中文维基百科之外使用。
Current uses
- 中文维基百科使用该模型作为一种服务,以促进有效的破坏性分类,编辑评论或新人支持。
- 在个人基础上,任何人都可以向ORES提交一个正确格式的API呼叫,以进行给定修订,并恢复该模型的结果。
。 例子API调用:
Example API call:{{{model_input}}}
道德考虑、警告和建议
edit中文维基百科决定使用该模型。 随着时间的推移,该模型已通过社区使用得到验证。
这种模型已知使得新编辑器更有可能产生损害。
内部或外部变化可能使该模型过时或不再可用的是:
- 数据漂移意味着模型的培训数据不再可用。
- 不符合生产中的所需性能度量标准。
- 中文维基百科社区决定不再使用这个模型。
模型
edit表演
editTest data confusion matrix: {{{confusion_matrix}}}
Test data sample rates: {{{sample_rates}}}
Test data performance: {{{performance}}}
实施
editModel architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}
Output:
{{{model_output}}}数据
editData pipeline
关于编辑的表格数据从Mediawiki API中收集,预处理 (通过日志转换,与公共编辑数据连接等),并与用户生成的善信/损坏标签连接。
Training data
这种模型使用了几年历史的手动标记训练数据进行了训练。
Test data
这里报告的统计数据是通过选择训练数据的随机分区来计算的,以便从训练过程中保持不变。 然后,模型对该数据做出预测,这与基本的真相相比较。
许可证
edit- Code: MIT license
- Model: MIT license
引文
editCite this model card as:
@misc{
Triedman_Bazira_2023_{{{language}}}_{{{project}}}_damaging,
title={ {{{language}}} {{{project}}} damaging model card },
author={ Triedman, Harold and Bazira, Kevin },
year={ 2023 },
url={ https://meta.wikimedia.org/wiki/Model_card_ORES_damaging_edit/zh }
}