Template:Model card ORES goodfaith edit/zh
Model card | |
---|---|
This page is an on-wiki machine learning model card. | |
Model Information Hub | |
Model creator(s) | Aaron Halfaker (User:EpochFail) and Amir Sarabadani |
Model owner(s) | WMF Machine Learning Team (ml@wikimediafoundation.org) |
Model interface | Ores homepage |
Code | ORES Github、ORES training data和ORES model binaries |
Uses PII | No |
In production? | Yes |
Which projects? | {{{language}}} {{{project}}} |
这个模型使用了关于修订的数据来预测修订的可能性。 | |
动机
edit这种模型旨在区分故意有害的修改 (坏信仰/破坏行为) 和旨在有害的修复 (好修改/善意损害) 。 该模型提供了一个猜测,即给定修改是否真实,并提供了一些概率作为衡量其自信水平。这个模型受到维基百科质控制系统的研究的启发。
用户和用途
editUse this model for
- 这个模型应该用于优先考虑中文维基百科上破坏的审查和可能的逆转。
- 这个模型应该用于检测中文维基百科编辑的善意贡献。
Don't use this model for
- 这个模型不应用作最终仲裁者,确定是否应该被认为是善意。
- 该模型不应在中文维基百科之外使用。
Current uses
- 中文维基百科使用该模型作为一种服务,以促进高效的编辑评论或新人支持。
- 在个人基础上,任何人都可以向ORES提交一个正确格式的API呼叫,以进行给定修订,并恢复该模型的结果。
。 例子API调用:
Example API call:{{{model_input}}}
道德考虑、警告和建议
edit中文维基百科决定使用该模型。 随着时间的推移,该模型已通过社区使用得到验证。
这种模型已知使得新编辑者更低的善意编辑概率。
内部或外部变化可能使该模型过时或不再可用的是:
- 数据漂移意味着模型的培训数据不再可用。
- 不符合生产中的所需性能度量标准。
- 中文维基百科社区决定不再使用这个模型。
模型
edit表演
editTest data confusion matrix: {{{confusion_matrix}}}
Test data sample rates: {{{sample_rates}}}
Test data performance: {{{performance}}}
实施
editModel architecture
{{{model_architecture}}}
Output schema
{{{model_output_schema}}}
Example input and output
Input:
{{{model_input}}}
Output:
{{{model_output}}}数据
editData pipeline
关于编辑的表格数据从Mediawiki API中收集,预处理 (通过日志转换,与公共编辑数据连接等),并与用户生成的善信/损坏标签连接。
Training data
这种模型使用了几年历史的手动标记训练数据进行了训练。
Test data
这里报告的统计数据是通过选择训练数据的随机分区来计算的,以便从训练过程中保持不变。 然后,模型对该数据做出预测,这与基本的真相相比较。
许可证
edit- Code: MIT license
- Model: MIT license
引文
editCite this model card as:
@misc{
Triedman_Bazira_2023_{{{language}}}_{{{project}}}_goodfaith,
title={ {{{language}}} {{{project}}} goodfaith model card },
author={ Triedman, Harold and Bazira, Kevin },
year={ 2023 },
url={ https://meta.wikimedia.org/wiki/Model_card_ORES_goodfaith_edit/zh }
}