Wikimedia Enterprise
L'attenzione si concentra sulle organizzazioni che vogliono riutilizzare i contenuti Wikimedia in altri contesti, fornendo servizi di dati su larga scala, in modo che siano più veloci e più completi, affidabili e sicuri. Wikimedia Enterprise mira a migliorare la user experience dei lettori di Wikimedia al di là dei nostri siti web; aumentare la portata e la reperibilità dei contenuti; migliorare la consapevolezza e la facilità di attribuzione e verificabilità da parte delle organizzazioni che riutilizzano i dati del progetto Wikimedia, principalmente attraverso servizi di autofinanziamento.
Wikimedia Enterprise | |
---|---|
![]() Building new opportunities for both revenue generation and free knowledge dissemination through partnerships and earned income. | |
enterprise.wikimedia.com | |
Project |
|
Technical | |
Wikimedia Enterprise è un nuovo servizio interdipartimentale della Wikimedia Foundation disponibile su enterprise.wikimedia.com. L'obiettivo di questo servizio è quello di costruire servizi per grandi riutilizzatori commerciali di contenuti dei progetti wikimedia. Il servizio è stato annunciato a marzo 2021 (blogpost, articolo WIRED) e lanciato a ottobre 2021 (comunicato stampa, articolo OpenFutures article).
La barriera all'ingresso per l'utilizzo dei dati Wikimedia è molto alta, al di fuori dei casi d'uso comuni di lettura o modifica. Questo perché i contenuti sono difficili da segmentare e comprendere per le macchine, il che a sua volta influisce sulla portata dei dati del progetto Wikimedia al di là del nostro ecosistema e sulla portata dell'impatto che possono avere.
Nelle raccomandazioni della Strategia del Movimento per aumentare la sostenibilità del nostro movimento e migliorare l'esperienza degli utenti ci sono le raccomandazioni per, rispettivamente: "Esplorare nuove opportunità sia per la generazione di entrate che per la diffusione della conoscenza libera attraverso partnership e redditi da lavoro, ad esempio... costruendo API di livello aziendale" e "Rendere la suite di API di Wikimedia più completa, affidabile, sicura e veloce, in collaborazione con utenti su larga scala.... e migliorare la consapevolezza e la facilità di attribuzione e verificabilità per i riutilizzatori di contenuti".
È ben noto che alcune grandi aziende utilizzano i dati dei nostri progetti. Queste aziende riconoscono che senza i progetti Wikimedia non sarebbero in grado di fornire un'esperienza altrettanto ricca o affidabile ai propri utenti. Da tempo i membri della comunità ritengono che queste aziende dovrebbero fare di più per reinvestire nelle comunità Wikimedia per i benefici che traggono dai contenuti e dalle risorse che utilizzano.
Questo ha portato all'idea di sviluppare un nuovo approccio che sia più sostenibile a lungo termine e che fornisca un rapporto molto più chiaro tra Wikimedia e gli utenti aziendali. La maggior parte dei benefici finanziari per Wikimedia verrebbero probabilmente solo da una piccola parte di riutilizzatori commerciali e verrebbero reintegrati nel movimento Wikimedia.
Man mano che l'idea si è sviluppata, è emersa la responsabilità di democratizzare i nostri dati per le organizzazioni che non possiedono le risorse di questi grandi utenti, per garantire che stiamo preservando equilibrato il campo di gioco e aiutando a promuovere un Internet sano senza rafforzare i monopoli. I vantaggi di questo servizio non dovrebbero essere solo per le startup o per le alternative ai giganti di Internet, ma anche per le università e i ricercatori universitari, per gli archivi e gli archivisti e per il più ampio movimento Wikimedia.

Panoramica
Wikimedia Enterprise si concentra sulle aziende che riutilizzano i nostri contenuti, tipicamente su larga scala, ad esempio integrati in grafici di conoscenza, ricerca, assistenti vocali, mappe, notizie, strumenti della comunità, applicazioni di terze parti e studi di ricerca full-corpus. Aumentare i numerosi set di dati di Wikimedia per dare una struttura ai nostri contenuti non strutturati consentirà a tutti i nostri riutilizzatori di contenuti di soddisfare le loro esigenze individuali e ci metterà in condizione di costruire nuovi strumenti e servizi in futuro, a disposizione di tutti. I riutilizzatori dei nostri contenuti cercano tre componenti fondamentali:
- Frequenza: istantanee regolarmente aggiornate dei progetti Wikimedia.
- 'Affidabilità: infrastruttura affidabile e accessibile
- Qualità: una "migliore ultima versione".
L'enfasi su una serie di casi d'uso specifici autofinanziati consente al team di Wikimedia API di concentrarsi su volontari, team e organizzazioni che desiderano accedere ai nostri set di dati (e, soprattutto, interagire con essi). Questo include la maggior parte degli strumenti di editing della comunità, che non rientrano nell'ambito di questo servizio. Per ulteriori informazioni sui miglioramenti alle API di Wikimedia esistenti, consultare la pagina del servizio sull'iniziativa "API Gateway".
Obiettivi del programma:
- Contenuto: rendere disponibile un maggior numero di contenuti del nostro movimento in formati coerenti e leggibili da macchina, liberamente disponibili per tutti i ricercatori e i riutilizzatori.
- Carico di risorse: Ridurre la necessità di un'intensa attività di site-scraping da parte dei riutilizzatori più frequenti e con un volume più elevato, che attualmente si rivolgono ai nostri server di produzione.
- Raccolta fondi: fornire un modo più chiaro e coerente per i maggiori riutilizzatori di reinvestire i benefici derivati nel movimento, invece di fare donazioni altruistiche occasionali e di entità variabile.
Comunità
Contattate il team se desiderate organizzare una conversazione su questo servizio con la vostra comunità, in un momento e su una piattaforma software di comunicazione di vostra scelta.
Incontri pubblici precedenti:
-
Marzo 2021 - #1
-
Marzo 2021 - #2
-
Aprile 2021
-
giugno 2022
-
febbraio 2023
...and also at the EMWCon Spring 2021 conference (video); March and July 2022 Strategic Wikimedia Affiliates Network (SWAN) meetings; the May 2021 Wikimedia Clinic; and at Wikimania 2021.
Following are the introduction paragraphs for a much more detailed Community essay.
Libre and Gratis are the two meanings of “free,” commonly phrased as free as in speech, or free as in beer.
Wikimedia projects are, have always been, and will always remain libre. The principles of free cultural works mean that anyone can use Wikimedia without restriction, including commercially. As a movement, we embrace this. It is why we reject ‘non-commercial’ licenses, as they would limit the kinds of reuse possible. And it is why we consider commercial reuse an important means of distributing knowledge to audiences.
Equally, Wikimedia projects are, have always been, and will always remain gratis. The ability to freely access the knowledge available across all Wikimedia projects has always been core to the mission of the Foundation and the movement. We provide this access not only to individuals visiting our websites but also programmatically to machines so that our content can be repurposed in other environments. The full corpus of Wikimedia content always has been, and will continue to be, made available for reuse in various forms (including but not limited to database dumps, APIs, and scraping) at no cost.
As a result, our content is often repurposed by for-profit organizations that rely on it to support their business models, and which consequently earn revenue from it. Outside of voluntary corporate donations to the Wikimedia Foundation, the movement has never received benefits from any of this revenue through return investment. In acknowledgement of this, under the heading of Increase the sustainability of our movement the Movement Strategy process asked the Wikimedia Foundation to explore, among other things, “enterprise-level APIs...models for enterprise-scale for-profit reusers, taking care to avoid revenue dependencies or other undue external influence in product design and development.” Furthermore, under the heading Improve User Experience, a further recommendation stated, "Make the Wikimedia API suite more comprehensive, reliable, secure, and fast, in partnership with large scale users where that aligns with our mission and principles, to improve the user experience of both our direct and indirect users, increase the reach and discoverability of our content and the potential for data returns, and improve awareness of and ease of attribution and verifiability for content reusers."
The Enterprise project team is developing a new resource aimed at for-profit content reusers, who have product, service, and system requirements that go beyond what we freely provide. Use of this offering will not be required for for-profit content reuse; companies can continue to use the current tools available at no cost. All Enterprise API revenue will unequivocally be used to support the Wikimedia mission—for example, to fund Wikimedia programs or help grow the Wikimedia Endowment.
This project represents a new kind of activity at the Foundation. The project is at a very early stage that should be considered a learning period. We will have successes, we will make mistakes, and we will need to adapt our strategies. The team is committed to listening, engaging, and where possible, integrating the feedback we get on our work. This document is organic and is reflective of the team's current thinking; we are attempting to document as much work as possible in the open. Up until now, our work has been shaped by a series of initial interviews with community members, Wikimedia Foundation Board and staff, researchers, and reusers.
...continue to read the rest of the Community essay. See also the FAQ and Principles.
Data la natura del servizio, il processo decisionale principale spetterà alla Wikimedia Foundation. Abbiamo sollecitato il contributo della comunità, in particolare della comunità tecnica e di coloro che sono stati coinvolti nel processo strategico, per tutta la durata del servizio. Il feedback tecnico è stato raccolto dai colleghi della Wikimedia Foundation, dai partner dell'industria e della ricerca, dai partner tecnici del movimento e dalle comunità tecniche più ampie tramite Phabricator. I contributi per lo sviluppo dei finanziamenti del servizio seguiranno uno schema simile. Continueremo a raccogliere input attraverso interviste di ricerca e focus group, nonché feedback qui su Meta come da i nostri principi.
Tecnica
For full information about the product work, see the documentation homepage on MediaWiki.org and the API documentation subpage.
Nel corso del tempo, il "prodotto" offerto crescerà e migliorerà. Queste informazioni sono accurate a partire dalla febbraio 2023.
On-demand API
I riutilizzatori ad alto traffico che utilizzano un'infrastruttura basata sulla piattaforma EventStream dipendono da servizi come RESTBase per estrarre l'HTML dai titoli delle pagine e dalle revisioni correnti per aggiornare i loro prodotti. I riutilizzatori ad alto traffico hanno richiesto un mezzo affidabile per raccogliere questi dati, nonché strutture diverse dall'HTML quando incorporano i nostri contenuti nei loro KG e prodotti.
Wikimedia Enterprise On-demand API, at release, will contain:
- A commercial schema
- SLA
Realtime API
High-volume reusers currently rely heavily on the changes that are pushed from our community to update their products in real time, using EventStream APIs to access such changes. High-volume reusers are interested in a service that will allow them to filter the changes they receive to limit their processing, guarantee stable HTTP connections to ensure no data loss, and supply a more useful schema to limit the number of api calls they need to make per event.
Enterprise Realtime API, at release, will contain:
- Filtering of events by Project or Revision Namespace
- Guaranteed connections
- Commercially useful schema similar* to those that we are building in our On-demand API and Snapshot API
- SLA
*We are still in the process of mapping out the technical specifications to determine the limitations of schema in event platforms and will post here when we have finalized our design.
Snapshot API
For high volume reusers that currently rely on the Wikimedia Dumps to access our information, we have created a solution to ingest Wikimedia content in near real time without excessive API calls (On-demand API) or maintaining hooks into our infrastructure (Realtime).
Enterprise Snapshot API, at release, will contain:
- 24-hour JSON[1], Wikitext, or HTML compressed dumps of "text-based" Wikimedia projects
- A hourly update file with revision changes of "text-based" Wikimedia projects
- SLA
- ↑ JSON dumps will contain the same schema per page as the On-demand API.
Access
There are several methods to obtain access to the Enterprise API datasets:
- Paid
- Realtime API (Batch and Streaming) and daily dump file in NDJSON format through the dedicated Enterprise API product website https://enterprise.wikimedia.com/
- Free
- Creating an account via the Enterprise API product website includes 10,000 on-demand API requests (including the Structured Contents endpoint) and monthly snapshot API file in NDJSON format at no cost.
- An update of the Enterprise API data is provided for all every two weeks at https://dumps.wikimedia.org/other/enterprise_html/
- Snapshot API + Realtime (Batch) via Data services, available to anyone with a Wikimedia cloud services account.
- Those who have a non-commercial and mission-relevant use-case, which cannot be fulfilled by existing free-access APIs/dumps etc, can request ongoing access to the paid service at no cost.
Team
Il personale della Wikimedia Foundation che lavora specificamente a questo progetto:
Business
-
Lane Becker
Sviluppo commerciale -
Amy Muller
Customer Experience -
Eloisa Granado
Vendite
Prodotto
-
Ryan Brounley
Principal Product Manager -
Stephanie Delbecque
Gestione del prodotto -
Chuck Reynolds
Product Marketing -
Francisco Navas
Product Management
Engineering
-
Haroon Shaikh
Engineering Management -
Prabhat Tiwary
Software Engineering -
Ricardo Esquito
Software Engineering -
Luvo Dlulisa
Software Engineering -
Ruairi O'Donnell
Software Engineering -
Ehi Enabulele
Software Engineering -
Nuova posizione, attualmente aperta
Senior Site Reliability Manager
Programma
-
Naïké Nembetwa Nzali
Operations Management -
Liam Wyatt
Community Advocacy -
Jackeline Arguello
Technical Program Management
I nomi in grassetto indicano i dirigenti.
Many people from different teams also contribute significantly, including from the WMF Legal, Engineering, Partnerships, Design, Communications teams etc. Additional contract work provided by: Speed & Function are providing engineering support; PartnerHero provide customer support services; Vuurr are assisting our sales process; and Super Natural Design are the designers of the project website.
The board of the LLC overseeing the project are Ex officio from Wikimedia Foundation leadership, representing their Wikimedia Foundation staff roles. This includes the Chief Advancement Officer Lisa Seitz-Gruwell; General Counsel Stephen LaPorte; Chief Product and Technology Officer Selena Deckelman; and Lane Becker who serves as the LLC's president. The LLC is subject to the governance of the Wikimedia Foundation Board of Trustees as described at the Wikimedia Foundation Board Statement on Wikimedia Enterprise revenue principles.
Documents covering the legal relationship of the LLC to the Wikimedia Foundation are published on the Wikimedia Foundation Governance Wiki under "Category:Wikimedia Enterprise". Specifically, these are the operating, cost-sharing, and inter-company licensing agreements.The LLC's legal registration can be found at the State of Delaware, Division of Corporations, Entity name: Wikimedia, LLC, File number: 7828447.
Stampa
Commercial launch - October 2021 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
Wikimedia Foundation Press release Of particular note:
|
First customers - June 2022 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Press Release Of particular note:
|
Vedi anche
- API:Main page – the central listing of all Wikimedia APIs.
- Wikitech: Data Services portal – A list of community-facing services that allow for direct access to databases and dumps, as well as web interfaces for querying and programmatic access to data stores.
- Enterprise hub – a page for those interested in using the MediaWiki software in corporate contexts.
- MediaWiki Stakeholders group – an independent affiliate organisation that advocates for the needs of MediaWiki users outside the Wikimedia Foundation, including for-profit enterprises.
- Enterprise MediaWiki Conference – an independent conference series for that community.