Contribution d'IP : Amélioration de la confidentialité et limitation des abus

This page is a translated version of the page IP Editing: Privacy Enhancement and Abuse Mitigation and the translation is 75% complete.
Other languages:
Deutsch • ‎English • ‎Türkçe • ‎español • ‎français • ‎italiano • ‎magyar • ‎polski • ‎português do Brasil • ‎беларуская (тарашкевіца) • ‎български • ‎українська • ‎বাংলা • ‎中文 • ‎日本語

Aperçu

Ces dernières années, les internautes sont devenus plus informés de l'importance de comprendre la collecte et l'utilisation de leurs données personnelles. Les gouvernements de divers pays ont créé de nouvelles lois afin de mieux protéger la vie privée des utilisateurs. Les équipes juridique et « public policy » de la fondation Wikimedia suivent continuellement l'évolution des lois dans le monde, elles s'intéressent aux moyens de mieux protéger la vie privée des utilisateurs, de respecter leurs attentes et de défendre les valeurs du mouvement Wikimedia. Avec cette toile de fond, elles nous ont demandé d'enquêter et d'entreprendre une amélioration technique des projets. Nous devons le faire avec vous.

MediaWiki stocke et publie les adresses IP des contributeurs non enregistrés (dans leur signature, l'historique des pages et les journaux), et les rend visibles à quiconque visite nos sites. La publication de ces adresses IP compromet la sûreté et l'anonymat de ces utilisateurs. Dans certains cas, cela peut même exposer les gens au risque d'être persécutés par le gouvernement. Bien que nous informions les utilisateurs que leur adresse IP sera visible, peu comprennent les ramifications de cette information. Nous travaillons à une meilleure protection de la vie privée pour les contributeurs non enregistrés en cachant leur adresse IP quand ils contribuent aux projets, de la même manière que les lecteurs lambdas ne peuvent pas voir l'IP des utilisateurs enregistrés. Cela implique de créer un nom d'utilisateur « IP masquée », qui sera généré automatiquement, mais lisible humainement. Nous avons différentes idées sur comment implémenter cela. Vous pouvez commenter pour nous faire savoir ce dont vous avez besoin.

Les projets Wikimedia ont une très bonne raison de stocker et de publier des adresses IP : elles jouent un rôle essentiel pour empêcher le vandalisme et le harcèlement sur nos wikis. Il est très important que les patrouilleurs, les administrateurs et les fonctionnaires disposent d'outils capables d'identifier et de bloquer les vandales, les faux-nez, les éditeurs en conflit d'intérêts et autres acteurs néfastes. En travaillant avec vous, nous voulons trouver des moyens de protéger la vie privée de nos utilisateurs tout en maintenant nos outils anti-vandalisme au même niveau que leur fonctionnement actuel. La partie la plus importante de ceci est le développement de nouveaux outils pour aider à lutter contre le vandalisme. Une fois cela fait, nous espérons travailler sur la protection des adresses IP de nos wikis, notamment en limitant le nombre de personnes pouvant voir les adresses IP des autres utilisateurs et en réduisant la durée de stockage des adresses IP dans nos bases de données et journaux. Il est important de noter qu'une partie essentielle de ce travail sera de s'assurer que nos wikis ont toujours accès au même - ou meilleur - niveau d'outils anti-vandalisme et ne risquent pas d'être victimes d'abus.

L'objectif de la Wikimedia Foundation est de créer un ensemble d'outils de modération qui élimineront le besoin de chacun d'avoir un accès direct aux adresses IP. Avec cette évolution de nos outils de modération, nous pourrons masquer les IP des comptes non enregistrés. Nous sommes pleinement conscients que ce changement aura un impact sur les flux de travail de modération actuels, et nous voulons nous assurer que les nouveaux outils permettront une modération efficace, protégeront les projets du vandalisme et soutiendront la surveillance effectuée par la communauté.

Nous ne pouvons atteindre ce but qu'en travaillant en partenariat avec les vérificateurs d'adresses IP, stewards, administrateurs et autres combattants anti-vandales.

C'est un défi très difficile à relever, avec des risques pour notre capacité à protéger nos wikis si nous échouons, c'est pourquoi il a été repoussé au fil des ans. Mais à la lumière de l'évolution des normes de confidentialité des données sur Internet, des nouvelles lois et des attentes changeantes des utilisateurs, la fondation Wikimedia pense qu'il est maintenant temps de s'attaquer à ce défi.

Mises à jour

10 juin 2021

Salut à tous. Cela fait quelques mois depuis notre dernière mise à jour sur ce projet. Nous avons pris ce temps pour parler à beaucoup de gens - à travers la communauté d'édition et au sein de la Fondation. Nous avons soigneusement réfléchi à toutes les préoccupations soulevées lors de nos discussions avec des membres expérimentés de la communauté concernant l'impact que cela aura sur les efforts de lutte contre le vandalisme dans l'ensemble de nos projets. Nous avons également entendu un nombre important de personnes qui soutiennent cette proposition comme une étape vers l'amélioration de la confidentialité des éditeurs non enregistrés et la réduction de la menace juridique que l'exposition des IP au monde fait peser sur nos projets.

Lorsque nous parlons de ce projet par le passé, nous n'avions pas une idée claire de la forme que prendrait ce projet. Notre intention était de comprendre comment les adresses IP sont utiles à nos communautés. Depuis, nous avons reçu beaucoup de commentaires sur ce point d'une série de conversations en différentes langues et dans différentes communautés. Nous sommes reconnaissant envers tous les membres de la communauté qui ont pris le temps de nous informer sur comment fonctionne la modération sur leurs wikis ou dans leur environnement spécifique de « multi-wikis ».

Proposition pour partager les adresses IP avec ceux qui ont besoin d'accès

Nous avons maintenant une proposition plus concrète pour ce projet qui, nous l'espérons, permettra à la plupart des travaux anti-vandalisme de se dérouler sans se décourager tout en restreignant l'accès aux adresses IP des personnes qui n'ont pas besoin de les voir. Je veux mettre l'accent sur le mot « proposition » parce qu'il n'est en aucun cas, une forme ou une forme de verdict final sur ce qui va se passer. Notre intention est de solliciter vos commentaires sur cette idée. Selon vous, qu'est-ce qui fonctionnera ? Que pensez-vous ne fonctionnera pas? Quelles autres idées peuvent améliorer cela ? Nous avons développé ces idées au cours de plusieurs discussions avec des membres expérimentés de la communauté, et nous les avons affinées en collaboration avec notre service juridique. En voici les grandes lignes :

  • Les checkusers, les stewards et les administrateurs devraient pouvoir voir les adresses IP complètes en optant pour une préférence où ils acceptent de ne pas la partager avec d'autres qui n'ont pas accès à ces informations.
  • Les éditeurs qui participent à des activités anti-vandalisme, approuvées par la communauté, peuvent se voir accorder le droit de voir les adresses IP pour continuer leur travail. Cela pourrait être géré de la même manière que l'est l'attribution du statut d'administrateur sur nos projets. L'approbation de la communauté est importante pour garantir que seuls les éditeurs qui ont vraiment besoin de cet accès peuvent l'obtenir. Les éditeurs devront avoir un compte avec au moins un an d'ancienneté et 500 modifications.
  • Tous les utilisateurs avec des comptes de plus d'un an et au moins 500 modifications pourront accéder aux adresses IP partiellement non masquées sans autorisation. Cela signifie qu'une adresse IP apparaîtra avec son ou ses octets de queue - la ou les dernières parties - masquées. Celles-ci seront accessibles via une préférence où ils s'engagent à ne pas les partager avec d'autres qui n'ont pas accès à ces informations.
  • Tous les autres utilisateurs ne pourront pas accéder aux adresses IP des utilisateurs non enregistrés.

L'accès à l'adresse IP sera enregistré afin qu'un examen minutieux puisse être effectué si et quand cela est nécessaire. Ceci est similaire au journal que nous tenons pour vérifier l'accès des utilisateurs aux données privées. C'est ainsi que nous espérons trouver un équilibre entre le besoin de confidentialité et le besoin des communautés d'accéder aux informations pour lutter contre le spam, le vandalisme et le harcèlement. Nous voulons donner l'information à ceux qui en ont besoin, mais nous avons besoin d'un processus, nous avons besoin qu'il soit souscrit explictement afin que seuls ceux qui en ont réellement besoin puissent le voir et nous avons besoin que les accès soient enregistrés.

Nous voudrions connaître vos opinions sur cette proposition d'approche. Merci de nous donner votre avis sur la page de discussion.

  • Selon vous, qu'est-ce qui fonctionnera ?
  • À votre avis, qu'est-ce qui ne fonctionnera pas ?
  • Quelles autres idées peuvent améliorer cela ?

Mise à jour sur le développement de l'outil

Comme vous le savez peut-être déjà, nous travaillons à la création de nouveaux outils, en partie pour atténuer l'impact du masquage IP, mais aussi simplement pour créer de meilleurs outils anti-vandalisme pour tout le monde. Ce n'est un secret pour personne que l'état des outils de modération sur nos projets ne donne pas aux communautés les outils qu'elles méritent. Il y a beaucoup de possibilités d'amélioration. Nous voulons créer des outils qui facilitent le travail efficace des combattants anti-vandalisme. Nous voulons également réduire la barrière à l'entrée dans ces rôles pour les contributeurs non techniques.

Nous avons déjà parlé d'idées pour ces outils et je vais vous fournir une brève mise à jour ci-dessous. Notez que les progrès sur ces outils ont été lents au cours des derniers mois, car notre équipe travaille sur la refonte de SecurePoll pour répondre aux besoins des prochaines élections du conseil d'administration du WMF.

Fonction d'informations IP

 
Maquette pour les informations IP.

Nous construisons un outil qui affichera des informations importantes sur une adresse IP qui est couramment recherchée dans les enquêtes. Généralement, les patrouilleurs, les administrateurs et les checkusers s'appuient sur des sites Web externes pour fournir ces informations. Nous espérons leur faciliter ce processus en intégrant des informations provenant de fournisseurs IP fiables sur nos sites Web. Nous avons récemment construit un prototype et mené une série de tests utilisateurs pour valider notre approche. Nous avons constaté que la majorité des rédacteurs interrogés ont trouvé l'outil utile et ont indiqué qu'ils aimeraient l'utiliser à l'avenir. Il y a une mise à jour sur la page du projet sur laquelle j'aimerais attirer votre attention. Questions clés sur lesquelles nous aimerions avoir vos commentaires sur la page de discussion du projet :

  • Lorsque vous enquêtez sur une IP, quels types d'informations recherchez-vous ? Sur quelle page êtes-vous probablement lorsque vous recherchez ces informations ?
  • Quels types d'informations IP trouvez-vous les plus utiles ?
  • Quels types d'informations IP, lorsqu'elles sont partagées, pourraient selon vous mettre nos éditeurs anonymes en danger ?

Fonctionnalité de correspondance de l'éditeur

Ce projet a également été appelé « Éditeurs à proximité » et « Détection de marionnettes » dans des conversations antérieures. Nous essayons de lui trouver un nom approprié qui soit compréhensible même pour les personnes qui ne comprennent pas le mot sockpuppetry. Nous sommes aux premiers stades de ce projet. La fondation de recherche Wikimedia a un projet qui pourrait aider à détecter quand deux éditeurs présentent des comportements d'édition similaires. Cela aidera à connecter différents éditeurs non enregistrés lorsqu'ils éditent sous différents noms d'utilisateur de compte générés automatiquement. Nous avons entendu beaucoup de soutien pour ce projet lorsque nous avons commencé à en parler il y a un an. Nous avons également entendu parler des risques de développer une telle fonctionnalité. Nous prévoyons de construire un prototype à court terme et de le partager avec la communauté. Il y a une page du projet mal nourrie pour ce projet. Nous espérons avoir une mise à jour bientôt. Vos réflexions sur ce projet sont les bienvenues sur la page de discussion du projet.

Données sur Wikipédia portugais désactivant les modifications IP

Wikipédia en portugais a interdit aux éditeurs non enregistrés d'apporter des modifications au projet l'année dernière. Au cours des derniers mois, notre équipe a collecté des données sur les répercussions de ce bouleversement sur la santé générale du projet. Nous avons également parlé à plusieurs membres de la communauté sur leur expérience. Nous travaillons sur les derniers détails pour compiler toutes les données qui présentent une image précise de l'état du projet. Nous espérons avoir une mise à jour à ce sujet dans un proche avenir.

Mises à jour précédentes

30 octobre 2020

Nous avons mis à jour la FAQ avec plus de questions que celles posées sur la page de discussion. Le service juridique de la fondation Wikimedia a ajouté une déclaration sur demande à la discussion de la page de discussion, et nous l'avons ajoutée ici aussi sur la page principale. Sur la page de discussion, nous avons essayé d'expliquer à peu près comment nous envisageons de donner aux combattants anti-vandales l'accès aux données dont ils ont besoin sans qu'ils deviennent des CheckUsers ou des administrateurs.

15 octobre 2020

Cette page était devenue en grande partie obsolète et nous avons décidé de la réécrire en partie pour refléter où nous en sommes dans le processus. Voici à quoi cela ressemblait. Nous l'avons mis à jour avec les dernières informations sur les outils sur lesquels nous travaillons, la recherche, étoffé les motivations et ajouté quelques éléments à la FAQ. Particulièrement les points pertinents sont probablement notre travail sur la fonctionnalité d'information IP, le nouvel outil CheckUser qui est maintenant en ligne sur quatre wikis et nos recherches sur la meilleure façon de gérer l'identification IP : faites-nous savoir ce dont vous avez besoin, les problèmes potentiels que vous voyez et si la combinaison d'une adresse IP avec un cookie peut être utile pour vos flux de travail.

Déclaration du service juridique de la fondation Wikimedia

Cette déclaration du département juridique de la fondation Wikimedia a été écrite à la demande de la page de discussion et vient de ce contexte. Pour plus de visibilité, nous voulions que vous puissiez le lire ici aussi.

Hello All. This is a note from the Legal Affairs team. First, we’d like to thank everyone for their thoughtful comments. Please understand that sometimes, as lawyers, we can’t publicly share all of the details of our thinking; but we read your comments and perspectives, and they’re very helpful for us in advising the Foundation.

On some occasions, we need to keep specifics of our work or our advice to the organization confidential, due to the rules of legal ethics and legal privilege that control how lawyers must handle information about the work they do. We realize that our inability to spell out precisely what we’re thinking and why we might or might not do something can be frustrating in some instances, including this one. Although we can’t always disclose the details, we can confirm that our overall goals are to do the best we can to protect the projects and the communities at the same time as we ensure that the Foundation follows applicable law.

Within the Legal Affairs team, the privacy group focuses on ensuring that the Foundation-hosted sites and our data collection and handling practices are in line with relevant law, with our own privacy-related policies, and with our privacy values. We believe that individual privacy for contributors and readers is necessary to enable the creation, sharing, and consumption of free knowledge worldwide. As part of that work, we look first at applicable law, further informed by a mosaic of user questions, concerns, and requests, public policy concerns, organizational policies, and industry best practices to help steer privacy-related work at the Foundation. We take these inputs, and we design a legal strategy for the Foundation that guides our approach to privacy and related issues. In this particular case, careful consideration of these factors has led us to this effort to mask IPs of non-logged-in editors from exposure to all visitors to the Wikimedia projects. We can’t spell out the precise details of our deliberations, or the internal discussions and analyses that lay behind this decision, for the reasons discussed above regarding legal ethics and privilege.

We want to emphasize that the specifics of how we do this are flexible; we are looking for the best way to achieve this goal in line with supporting community needs. There are several potential options on the table, and we want to make sure that we find the implementation in partnership with you. We realize that you may have more questions, and we want to be clear upfront that in this dialogue we may not be able to answer the ones that have legal aspects. Thank you to everyone who has taken the time to consider this work and provide your opinions, concerns, and ideas.

Outils

Comme nous l'avons mentionné précédemment, notre objectif premier est de fournir de meilleurs outils anti-vandalisme à nos communautés, ce qui permettra une meilleure expérience de modération pour nos combattants du vandalisme tout en s'efforçant de rendre la chaîne d'adresses IP moins précieuse pour eux. Une autre raison importante de procéder ainsi est que les adresses IP sont difficiles à comprendre et ne sont vraiment utiles qu'aux utilisateurs avertis. Cela crée un obstacle pour les nouveaux utilisateurs qui n'ont pas de connaissances techniques pour entrer dans des rôles fonctionnels, car il y a une courbe d'apprentissage plus élevée pour eux de travailler avec des adresses IP. Nous espérons arriver à un point où nous pourrons disposer d'outils de modération que tout le monde pourra utiliser sans grandes connaissances préalables.

The first thing we decided to focus on was to make the CheckUser tool more flexible, powerful and easy to use. It is an important tool that services the need to detect and block bad actors (especially long-term abusers) on a lot of our projects. The CheckUser tool was not very well maintained for many years and as a result it appeared quite dated and lacked necessary features.

We also anticipated an uptick in the number of users who opt-in to the role of becoming a CheckUser on our projects once IP Masking goes into effect. This reinforced the need for a better, easier CheckUser experience for our users. With that in mind, the Anti-Harassment Tools team spent the past year working on improving the CheckUser tool – making it much more efficient and user-friendly. This work has also taken into account a lot of outstanding feature requests by the community. We have continually consulted with CheckUsers and stewards over the course of this project and have tried our best to deliver on their expectations. The new feature is set to go live on all projects in October 2020.

The next feature that we are working on is IP info. We decided on this project after a round of consultation on six wikis which helped us narrow down the use cases for IP addresses on our projects. It became apparent early on that there are some critical pieces of information that IP addresses provide which need to be made available for patrollers to be able to do their roles effectively. The goal for IP Info, thus, is to quickly and easily surface significant information about an IP address. IP addresses provide important information such as location, organization, possibility of being a Tor/VPN node, rDNS, listed range, to mention a few examples. By being able to show this, quickly and easily without the need for external tools everyone can’t use, we hope to be able to make it easier for patrollers to do their job. The information provided is high-level enough that we can show it without endangering the anonymous user. At the same time, it is enough information for patrollers to be able to make quality judgements about an IP address.

After IP Info we will be focusing on a finding similar editors feature. We’ll be using a machine learning model, built in collaboration with CheckUsers and trained on historical CheckUser data to compare user behavior and flag when two or more users appear to be behaving very similarly. The model will take into account which pages users are active on, their writing styles, editing times etc to make predictions about how similar two users are. We are doing our due diligence in making sure the model is as accurate as possible.

Once it’s ready, there is a lot of scope for what such a model can do. As a first step we will be launching it to help CheckUsers detect socks easily without having to perform a lot of manual labor. In the future, we can think about how we can expose this tool to more people and apply it to detect malicious sockpuppeting rings and disinformation campaigns.

You can read more and leave comments on our project page for tools.

Motivation

We who are working on this are doing this because the legal and public policy teams advised us that we should evolve the projects’ handling of IP addresses in order to keep up with current privacy standards, laws, and user expectations. That’s really the main reason.

We also think there are other compelling reasons to work on this. If someone wants to help out and don’t understand the ramifications of their IP address being publicly stored, their desire to make the world and the wiki a better place results in inadvertently sharing their personal data with the public. This is not a new discussion: we’ve had it for about as long as the Wikimedia wikis have been around. An IP address can be used to find out a user’s geographical location and institution and other personally identifiable information, depending on how the IP address was assigned and by whom. This can sometimes mean that an IP address can be used to pinpoint exactly who made an edit and from where, especially when the editor pool is small in a geographic area. Concerns around exposing IP addresses on our projects have been brought repeatedly by our communities and the Wikimedia movement as a whole has been talking about how to solve this problem for at least fifteen years. Here’s a (non-exhaustive) list of some of the previous discussions that have happened around this topic.

We acknowledge that this is a thorny issue, with the potential for causing disruptions in workflows we greatly respect and really don’t want to disrupt. We would only undertake this work, and spend so much time and energy on it, for very good reason. These are important issues independently, and together they have inspired this project: there’s both our own need and desire to protect those who want to contribute to the wikis, and developments in the world we live in, and the online environment in which the projects exist.

Recherche

 
Rapport soutenu par la Wikimedia Foundation sur l’impact du masquage IP sur notre communauté.

Impact du masquage IP

Les adresses IP constituent un identifiant partiel semi-fiable, que son utilisateur ne manipule pas facilement. Selon le fournisseur et la configuration de l'appareil, les informations d'adresse IP ne sont pas toujours exactes ni précises. De plus, une connaissance technique approfondie et une certaine aisance sont nécessaires pour utiliser au mieux les informations d'adresse IP, bien que les administrateurs ne soient pas obligés de démontrer ces aptitudes pour pouvoir y accéder. Ces informations techniques sont utilisées pour appréhender, dans la mesure du possible, des informations supplémentaires (appelées « connaissances comportementales ») et ces données extraites des adresses IP ont un impact significatif sur le cours des décisions administratives.

Sur le volet social, la question de savoir s'il fallait autoriser les utilisateurs non enregistrés à publier a fait l'objet de débats approfondis. Jusqu'ici, le débat a porté sur la possibilité de modifier pour les utilisateurs non enregistrés. Le débat oppose généralement volonté de limiter le vandalisme et désir de réduire les barrières à la contribution en laissant les utilisateurs non enregistrés modifier. Il existe un biais de perception à l'égard des utilisateurs non enregistrés en raison de leur association au vandalisme, laquelle fait également l'objet d'un biais algorithmique dans les outils tels qu'ORES. En outre, des problèmes majeurs en matière de communication sont observés lorsque l'on essaie de s'adresser à un utilisateur non enregistré, essentiellement en raison de l'absence de notifications et parce qu'il n'y a aucune assurance que c'est bien la personne visée qui lira le message déposé sur la page de discussion de l'IP.

Concernant l'impact potentiel du masquage des adresses IP, il se fera ressentir de manière significative sur le travail des administrateurs et pourrait accroître la charge de travail des vérificateurs d'adresses IP à court terme. Si/quand les adresses IP étaient/seront masquées, nous devons nous attendre à ce que la capacité des administrateurs à lutter contre le vandalisme soit fortement entravée. Cela peut être atténué en fournissant des outils avec des fonctionnalités équivalentes voire meilleures, mais nous devons anticiper une période de transition caractérisée par une moindre efficacité des administrateurs. Dans l'objectif de fournir des outils appropriés au travail des administrateurs, nous devons nous attacher à préserver ou à fournir des alternatives pour les fonctions suivantes, actuellement assurées par la publication des adresses IP :

  • Efficacité des blocages et estimation des effets collatéraux ;
  • Une manière de faire ressortir des similitudes ou des motifs (pattern) parmi les utilisateurs non enregistrés, tels que des similitudes géographiques ou l'appartenance à des institutions (par exemple si les modifications proviennent d'un établissement scolaire ou du supérieur) ;
  • La possibilité de viser certains groupes spécifiques d'utilisateurs non enregistrés tels que des vandales utilisant plusieurs IP au sein d'une plage d'adresses IP déterminée ;
  • La faculté d'opérer des actions (pas nécessairement des blocages) liées à la localisation géographique ou l'institution rattachée à l'adresse IP, par exemple la capacité à déterminer si des modifications sont effectuées par un proxy ouvert, ou bien à identifier qu'il s'agit d'un lieu public tel qu'une école ou une bibliothèque.

Selon la manière dont nous traitons les comptes temporaires ou identifiants dédiés aux utilisateurs non enregistrés, nous pourrions être en mesure d'améliorer la communication avec ces derniers. Il est peu probable que les débats et inquiétudes relatifs aux modifications par des utilisateurs non enregistrés, au vandalisme sous adresse IP et aux préjugés sur les utilisateurs non enregistrés changent significativement si nous masquons les adresses IP et que nous maintenons la capacité de modifier les projets sans être connecté.

CheckUser Workflow

We interviewed CheckUsers on multiple projects throughout our process for designing the new Special:Investigate tool. Based on interviews and walkthroughs of real-life cases, we broke down the general CheckUser workflow into five sections:

  • Triaging: assessing cases for feasibility and complexity.
  • Profiling: creating a pattern of behaviour which will identify the user behind multiple accounts.
  • Checking: examining IPs and useragents using the CheckUser tool.
  • Judgement: matching this technical information against the behavioural information established in the Profiling step, in order to make a final decision about what kind of administrative action to take.
  • Closing: reporting the outcome of the investigation on public and private platforms where necessary, and appropriately archiving information for future use.

We also worked with staff from Trust and Safety to get a sense for how the CheckUser tool factors into Wikimedia Foundation investigations and cases that are escalated to T&S.

The most common and obvious pain points all revolved around the CheckUser tool's unintuitive information presentation, and the need to open up every single link in a new tab. This cause massive confusion as tab proliferation quickly got out of hand. To make matters worse, the information that CheckUser surfaces is highly technical and not easy to understand at first glance, making the tabs difficult to track. All of our interviewees said that they resorted to separate software or physical pen and paper in order to keep track of information.

We also ran some basic analyses of English Wikipedia's Sockpuppet Investigations page to get some baseline metrics on how many cases they process, how many are rejected, and how many sockpuppets a given report contains.

Utilisation des adresses IP par les patrouilleurs

Previous research on patrolling on our projects has generally focused on the workload or workflow of patrollers. Most recently, the Patrolling on Wikipedia study focuses on the workflows of patrollers and identifying potential threats to current anti-vandal practices. Older studies, such as the New Page Patrol survey and the Patroller work load study, focused on English Wikipedia. They also look solely at the workload of patrollers, and more specifically on how bot patrolling tools have affected patroller workloads.

Notre étude a tenté de recruter à partir de cinq wikis cibles, qui étaient :

  • Wikipédia en japonais
  • Wikipédia en hollandais
  • Wikipédia en allemand
  • Wikipédia en chinois
  • Wikiquote en anglais

Ils ont été sélectionnés pour leurs attitudes connues à l'égard des modifications IP, le pourcentage de modifications mensuelles effectuées par les IP et toute autre circonstance unique ou inhabituelle rencontrée par les éditeurs IP (à savoir, l'utilisation de la fonction Modifications en attente et l'utilisation répandue des proxys). Les participants ont été recrutés via des appels ouverts sur les bistrots ou l'équivalent local. Dans la mesure du possible, nous avons également publié sur les pages ambassadrices Wiki. Malheureusement, alors que nous disposions du support d'interpréteurs pour les entretiens eux-mêmes, nous n'avons pas étendu le support de traduction aux messages, ce qui peut expliquer les faibles taux de réponse. Tous les entretiens ont été menés via Zoom, en présence d'un preneur de notes.

Supporting the findings from previous studies, we did not find a systematic or unified use of IP information. Additionally, this information was only sought out after a certain threshold of suspicion. Most further investigation of suspicious user activity begins with publicly available on-wiki information, such as checking previous local edits, Global Contributions, or looking for previous bans.

Precision and accuracy were less important qualities for IP information: upon seeing that one chosen IP information site returned three different results for the geographical location of the same IP address, one of our interviewees mentioned that precision in location was not as important as consistency. That is to say, so long as an IP address was consistently exposed as being from one country, it mattered less if it was correct or precise. This fits with our understanding of how IP address information is used: as a semi-unique piece of information associated with a single device or person, that is relatively hard to spoof for the average person. The accuracy or precision of the information attached to the user is less important than the fact that it is attached and difficult to change.

Our findings highlight a few key design aspects for the IP info tool:

  • Provide at-a-glance conclusions over raw data
  • Cover key aspects of IP information:
    • Geolocation (to a city or district level where possible)
    • Registered organization
    • Connection type (high-traffic, such as data center or mobile network versus low-traffic, such as residential broadband)
    • Proxy status as binary yes or no

D'un point de vue éthique, il sera important de pouvoir expliquer comment les conclusions sont tirées et les inexactitudes ou les imprécisions inhérentes à l'extraction des informations IP. Bien que ce n'était pas une préoccupation majeure pour les patrouilleurs à qui nous avons parlé, si nous voulons créer un outil qui servira à justifier une action administrative, nous devons prendre soin de préciser quelles sont les limites de nos outils.

FAQ

Est-ce que les utilisateurs avec des permissions avancées tels que les vérificateurs d'adresses IP, les admins ou les stewards auront toujours accès aux adresses IP lorsque ce projet sera achevé ?

Réponse : Nous n'avons pas encore de réponse définitive à cette question. Dans l'idéal, les adresses IP devraient être accessibles au moins de monde possible (y compris au sein des employés de la WMF). Nous espérons restreindre l'accès aux adresses IP aux seuls utilisateurs qui en ont besoin.

Comment fonctionneraient les outils de lutte contre le vandalisme, sans accès aux adresses IP ?

Réponse : Il existe plusieurs idées potentielles pour accomplir cet objectif. D'une part, nous pourrions être capables de fournir aux contributeurs (functionaries) d'autres informations pertinentes sur l'utilisateur au lieu de communiquer son IP, tout en proposant une quantité d'informations équivalente. De plus, il pourrait être possible de vérifier automatiquement si deux comptes utilisateur distincts sont liés à la même adresse IP, sans pour autant publier l'IP — lors d'investigations relatives aux faux-nez. Il est également possible que les outils de lutte contre le vandalisme continuent d'utiliser les adresses IP, mais que l'accès à ces outils soit restreint. Nous avons besoin de travailler en étroite collaboration avec la communauté pour trouver les solutions optimales.

Si nous ne pouvons pas voir les adresses IP, qu'est-ce que nous verrons lorsque les modifications sont publiées par des utilisateurs non enregistrés ?

Réponse : Au lieu des adresses IP, les utilisateurs pourront voir un nom d'utilisateur unique, généré automatiquement et lisible par les humains. Il pourrait par exemple ressembler à « Anonyme 12345 ».

Est-ce qu'un nom d'utilisateur sera généré pour chaque modification effectuée par un utilisateur non enregistré ?

Réponse : Non. Nous souhaitons mettre en œuvre une méthode qui fasse que les noms d'utilisateur générés soient au moins partiellement durables, par exemple en les associant à un cookie, à l'adresse IP de l'utilisateur, ou les deux.

Est-ce que vous allez également retirer les adresses IP existantes des wiki, au cours de ce projet ?

Réponse : Dans le cadre de ce projet, nous n'allons pas cacher les adresses IP existantes présentes dans les historiques, les journaux d'opération (logs) ou les signatures. Ne seront affectées que les futures modifications effectuées après le lancement de ce projet.

Est-ce que ce projet est la conséquence de l'adoption d'une loi en particulier ?

Réponse : Non. Les normes relatives aux données personnelles évoluent dans de nombreux pays et régions dans le monde, de même que les attentes des utilisateurs. Nous avons toujours travaillé avec ardeur à protéger la vie privée des utilisateurs et nous continuons d'apprendre et d'appliquer les meilleures pratiques fondées sur les nouvelles normes et attentes. Ce projet est la prochaine étape dans notre évolution en ce sens.

Quel est le calendrier de ce projet ?

Réponse : Comme mentionné supra, nous ne prendrons aucune décision définitive concernant ce projet tant que nous n'aurons pas recueilli l'avis des communautés. Nous aimerions déterminer quelles sont les premières étapes opportunes sur lesquelles une équipe de développement pourrait commencer à travailler prochainement, de sorte que nous puissions amorcer un projet que nous estimons être de longue haleine, mais nous ne poussons pas au respect d'une échéance précise.

Comment puis-je m'investir dans le projet ?

Réponse : Nous serions ravis de lire vos idées et remarques concernant ce projet ! Nous aimerions notamment savoir si vous avez des processus ou des manières de travailler susceptibles d'être affectées par ce projet. Vous pouvez partager vos idées sur la page de discussion ou bien compléter ce formulaire et nous vous contacterons. Plusieurs d'entre nous seront présents à la Wikimania et seront ravis de vous y rencontrer.

Q : Pourquoi cette proposition est si peu claire ?

R : Il ne s'agit pas vraiment d'une proposition et il ne fallait pas la décrire comme telle. Nous n'avons pas de solution, mais nous essayons de trouver les meilleures solutions avec les communautés. Il pourrait être utile de comprendre ceci comme une enquête technique essayant de comprendre comment le masquage IP pourrait fonctionner.

Q : Pourquoi ne pas seulement retirer la possibilité de modifier sans créer un compte ?

R : L'édition non enregistrée fonctionne différemment selon les wikis Wikimedia. Par exemple, la Wikipédia suédoise a discuté de l'édition non enregistrée à la lumière de cette enquête et a décidé qu'elle voulait toujours l'édition non enregistrée. La Wikipédia japonaise a un pourcentage d'édition IP beaucoup plus élevé que la Wikipédia anglaise, mais le taux de retour de ces éditions est seulement un tiers - 9,5% contre 27,4% - ce qui indique qu'elles sont aussi beaucoup plus utiles. Nous pensons que décider pour tous les wikis qu'ils ne peuvent pas avoir d'édition IP est une solution destructrice. La recherche effectuée sur l'édition IP indique aussi que l'édition IP est importante pour le recrutement des éditeurs.

Q : Qui aura accès aux IPs des utilisateurs non-enregistrés désormais ?

R : Nous n'allons pas laisser cette charge aux seuls CheckUsers et stewards, par exemple. Nous aurons un nouveau droit d'utilisateur ou la possibilité de choisir de voir l'IP si vous remplissez certaines conditions. D'autres pourraient potentiellement voir des adresses IP partielles. Nous discutons encore avec les communautés de la meilleure façon de procéder.

Q : Est-ce que cela a été décidé ?

R : Oui. Le service juridique de la Fondation Wikimedia a déclaré que cela était nécessaire. En tant qu'entité légalement responsable de la protection de la vie privée des utilisateurs de Wikimedia, la Wikimedia Foundation a accepté ce conseil et travaille maintenant à trouver la meilleure façon de mettre en œuvre cette mesure tout en soutenant et en écoutant les communautés d'utilisateurs. Certains Wikimédiens ne seront pas satisfaits de cette décision, mais les décisions juridiques de ce type n'ont jamais fait l'objet d'un consensus au sein de la communauté. Ce que les communautés peuvent contribuer à décider, c'est "comment" nous faisons cela. Cela doit être défini avec les communautés Wikimedia.

Q : Les masques seront-ils globaux, pour tous les wikis Wikimedia, ou locaux, pour un wiki ?

R : Globaux. Une IP masquée aura la même apparence sur tous les wikis Wikimedia.

Q : Est-ce tous les utilisateurs non enregistrés seront débloqués quand cela arrivera ? Sinon vous pourriez retracer l'information dans les journaux.

R : Non. Cela causerait des ravages sur les wikis. Cette solution devra être un compromis. Nous devons trouver un équilibre entre la vie privée de nos éditeurs non-enregistrés et notre capacité à protéger les wikis.