Wikimedia Enterprise

This page is a translated version of the page Wikimedia Enterprise and the translation is 67% complete.
Outdated translations are marked like this.

Wikimedia Enterprise és un nou servei interdepartamental de la Fundació Wikimedia disponible a enterprise.wikimedia.com. L'objectiu del servei és construir serveis per a reutilitzadors comercials de gran volum de contingut de Wikimedia. El servei va ser anunciat el març de 2021 (blogpost, article a WIRED) i es va posar en marxa l'octubre de 2021 (Nota de premsa, article a OpenFutures).

Wikimedia Enterprise
Wikimedia Enterprise logo.svg
Construint noves oportunitats tant per a la generació d'ingressos com per a la difusió gratuïta del coneixement a través dels convenis i dels ingressos obtinguts.
enterprise.wikimedia.com
ProjectePortadaPrincipis
Preguntes freqüents & Assaig (març 2021)
TècnicMediaWikiActualitzacionsPhabricatorGit
Documentació API

L'objectiu se centra en les organitzacions que volen reutilitzar el contingut de Wikimedia en altres contextos, tot proporcionant serveis de dades a gran escala, de manera que siguin més ràpids i més complets, fiables i segurs. Wikimedia Enterprise té com a objectiu millorar l'experiència d'usuari dels lectors de Wikimedia més enllà dels nostres propis llocs web; augmentar l'abast i la visibilitat del contingut; i millorar la consciència i la facilitat d'atribució i verificabilitat de les organitzacions que reutilitzen més el contingut de Wikimedia, mitjançant serveis d'autofinançament.


Hi ha una barrera d'entrada molt elevada per utilitzar les dades de Wikimedia, fora dels casos d'ús habituals de lectura o edició. Això es deu al fet que el contingut és difícil de segmentar i comprendre per les màquines, cosa que al seu torn afecta fins a quin punt les dades de Wikimedia arriben més enllà del nostre propi ecosistema, i l'escala d'impacte que pot tenir.

En les recomanacions de l'Estratègia del Moviment per augmentar la sostenibilitat del nostre moviment i millorar l'experiència d'usuari hi ha les següents recomanacions, respectivament: "Explorar noves oportunitats tant per a la generació d'ingressos com per a la difusió gratuïta del coneixement mitjançant els convenis i els ingressos obtinguts, per exemple [...] Construint una API empresarial" i "feu que el paquet d'API de Wikimedia sigui més complet, fiable, segur i ràpid, en col·laboració amb usuaris de gran escala [...] i millorar la consciència i la facilitat d'atribució i verificabilitat per als reutilitzadors de contingut".

És ben sabut que algunes empreses massives utilitzen les dades dels nostres projectes. Aquestes empreses reconeixen que sense els projectes de Wikimedia, no podrien proporcionar una experiència tan rica ni fiable als seus propis usuaris. Des de fa temps hi ha la sensació entre els membres de la comunitat que aquestes empreses haurien de fer més per reinvertir a les comunitats de Wikimedia pels avantatges que obtenen del contingut i els recursos que utilitzen.

Això va dur a la idea de desenvolupar un nou enfocament que sigui més sostenible a llarg termini i que proporcioni una relació molt més clara entre Wikimedia i els usuaris empresarials. La majoria dels beneficis financers per a Wikimedia probablement només provindria d'un grapat molt reduït d'usuaris intensos amb ànim de lucre, i es retroalimentaria al moviment Wikimedia.

A mesura que es va desenvolupar aquesta idea, va quedar clar que hi ha la responsabilitat de democratitzar les nostres dades per a les organitzacions que no disposen dels recursos d'aquests usuaris més grans, per assegurar-nos que estem igualant el terreny de joc i ajudar a fomentar una Internet sana sense reforçar els monopolis. Els avantatges d'aquest servei no només haurien de ser per a empreses emergents o alternatives als gegants d'Internet, sinó també per a universitats i investigadors universitaris; arxius i arxivers; juntament amb el moviment Wikimedia més ampli.

Screenshot Wikimedia Enterprise homepage.png

Resum

L'atenció de Wikimedia Enterprise se centra en empreses que reutilitzen el nostre contingut, normalment a gran escala, per exemple, integrades en gràfics de coneixement, cerques, assistents de veu, mapes, notícies, eines de la comunitat, aplicacions de tercers i estudis de recerca de corpus complet. Augmentar els nombrosos conjunts de dades de Wikimedia per posar estructura darrere del nostre contingut no estructurat permetrà que tots els nostres reutilitzadors de contingut satisfacin els seus requisits individuals, alhora que permetrà construir noves eines i serveis en el futur, disponibles per a tothom. Els usuaris que reutilitzen el nostre contingut busquen tres components crítics:

  • Freqüència: captures actuals i regulars de projectes de Wikimedia
  • Fiabilitat: una nfraestructura fiable i accessible
  • Qualitat: la "darrera millor revisió"

Cal fer èmfasi en què un conjunt autofinançat de casos d'ús específics permet a l'equip d'API de Wikimedia centrar-se en els voluntaris, els equips i les organitzacions que volen accedir als nostres conjunts de dades (i, sobretot, interactuar amb ells). Això inclou la majoria de les eines d'edició de la comunitat, que estaran fora de l'abast d'aquest servei. Per a més informació sobre les millores de les API de Wikimedia existents, vegeu la pàgina del servei sobre la iniciativa API Gateway.

Objectius del programa:

  • Contingut: fer que el contingut del nostre moviment estigui disponible en formats coherents llegibles per màquina, disponibles de manera gratuïta per a tots els investigadors i reutilitzadors.
  • Càrrega de recursos: reduir la necessitat de scraping de llocs d'alta intensitat per part dels reutilitzadors de major freqüència i volum, que actualment s'orienten als nostres servidors de producció.
  • Finançament: proporcionar una manera més clara i coherent perquè els reutilitzadors més grans reinverteixin els beneficis derivats en el moviment, en lloc de fer donacions altruistes ocasionals que varien de mida.

Comunitat

Posa't en contacte amb l'equip si t'agradaria concertar una conversa sobre aquest servei amb la teva comunitat, a l'hora i en la plataforma que preferiu.

Trobades públiques recents:

...i també a la trobada del març de l'Strategic Wikimedia Affiliates Network (SWAN); la Wikimedia Clinic del maig de 2021; i a Wikimania 2021.

Aquests són paràgrafs d'introducció. Per a una descripció molt més detallada, consulta l'assaig.

L'assaig complet cobreix els temes següents:

En anglès, la paraula "free" té dos significats, que en català són dues paraules molt diferents: lliure i gratuït.

Els projectes de Wikimedia són, sempre ho han estat i sempre romandran lliures. Els principis de les obres culturals lliures signifiquen que qualsevol persona pugui utilitzar Wikimedia sense restriccions, inclús comercialment. Com a moviment, ho acceptem. És per això que rebutgem les llicències no comercials, ja que limitarien els tipus de reutilització possibles. I és per això que considerem la reutilització comercial com un mitjà important de distribució de coneixement al públic.

Igualment, els projectes Wikimedia són, han estat i seran sempre gratuïts. La capacitat d'accedir lliurement al coneixement disponible a tots els projectes de Wikimedia sempre ha estat el nucli de la missió de la Fundació i del moviment. Proporcionem aquest accés no només a les persones que visiten els nostres llocs web, sinó també a les màquines programades perquè el nostre contingut pugui ser reutilitzat en altres entorns. El corpus complet del contingut de Wikimedia sempre ha estat, i continuarà estant, disponible per a la seva reutilització en diverses formes (incloent-hi, però no limitant-se, a bolcats de bases de dades, API i scraping) sense cap cost.

Com a resultat, el nostre contingut és reutilitzat amb freqüència per organitzacions comercials que en depenen per donar sostenir els seus models de negoci, i que en conseqüència, n'obtenen ingressos. Fora de les donacions corporatives voluntàries a la Fundació Wikimedia, el moviment no ha rebut beneficis de cap d'aquests ingressos a través de la inversió de retorn. Tot reconeixent aquest fet, sota el títol d'Augmentar la sostenibilitat del moviment, el procés d'Estratègia del Moviment va demanar a la Fundació Wikimedia que explorés, entre altres coses, "API a nivell empresarial [...] models per als reutilitzadors comercials a escala empresarial, tot intentant evitar les dependències dels ingressos o una altra influència externa indeguda en el disseny i desenvolupament del producte". A més, sota el títol Millorar l'experiència d'usuari, una altra recomanació deia: "Fer que el conjunt d'API de Wikimedia sigui més complet, fiable, segur i ràpid, en col·laboració amb els usuaris a gran escala on s'alineï amb la nostra missió i principis, per millorar l'experiència d'usuari tant dels usuaris directes com indirectes, augmentar l'abast i la capacitat de descobriment del nostre contingut i el potencial de retorn de dades, i millorar el coneixement i la facilitat d'atribució i verificabilitat per als reutilitzadors de contingut".

L'equip del projecte Enterprise està desenvolupant un nou recurs adreçat als reutilitzadors de continguts amb ànim de lucre, que tenen requisits de producte, servei i sistema que van més enllà del que oferim gratuïtament. Utilitzar aquesta oferta no serà necessari per a reutilitzar continguts comercials; les empreses poden seguir utilitzant les eines actuals disponibles sense cap cost. Tots els ingressos de l'API Enterprise s'utilitzaran inequívocament per donar suport a la missió de Wikimedia, per exemple, per finançar els programes de Wikimedia o ajudar a augmentar la dotació dels projectes.

Aquest projecte representa un nou tipus d'activitat a la Fundació. El projecte es troba en una fase molt primerenca que s'ha de considerar un període d'aprenentatge. Tindrem èxits, cometrem errors i haurem d'adaptar les nostres estratègies. L'equip es compromet a escoltar, participar en diàlegs i, en la mesura del possible, integrar els comentaris que rebem sobre el nostre treball. Aquest document és orgànic i reflecteix el pensament actual de l'equip; estem intentant documentar tot el treball possible de forma oberta. Fins ara, el nostre treball ha estat modelat per una sèrie d'entrevistes inicials amb membres de la comunitat, la Junta Directiva i el personal de la Fundació Wikimedia, investigadors i reutilitzadors de contingut.

...continua llegint la resta de l'assaig. Vegeu també les preguntes freqüents i els principis.

Donada la naturalesa del projecte, la presa de decisions primària correspon a la Fundació Wikimedia. Cerquem aportacions de la comunitat, en particular de la comunitat tècnica i de les persones que han participat en el procés d'estratègia, durant tota la vida del projecte. S'han recopilat comentaris tècnics de companys de la Fundació Wikimedia, socis de la indústria i de la recerca, socis tècnics de tot el moviment i de les comunitats tècniques més àmplies mitjançant Phabricator. Les aportacions al desenvolupament del finançament del projecte seguiran un patró similar. Continuarem recopilant aportacions mitjançant entrevistes de recerca i grups de discussió, així com comentaris aquí a Meta segons el document dels nostres principis.

Tècnic

For full information about the product work, seethe documentation homepage on MediaWiki.org and the API documentation subpage.
Over time, the "product" being offered will grow and improve. We are still defining the exact nomenclature for API endpoints and documentation, but these are the main products that our team is currently building. This information is accurate as of Version 1.0.

Structured Content API

High-volume reusers that use an infrastructure reliant on the EventStream platform depend on services like RESTBase to pull HTML from page titles and current revisions to update their products. High-volume reusers have requested a reliable means to gather this data, as well as structures other than HTML when incorporating our content into their KGs and products.

Wikimedia Enterprise Structured Content API, at release, will contain:

  • A commercial schema
  • SLA

Firehose API

High-volume reusers currently rely heavily on the changes that are pushed from our community to update their products in real time, using EventStream APIs to access such changes. High-volume reusers are interested in a service that will allow them to filter the changes they receive to limit their processing, guarantee stable HTTP connections to ensure no data loss, and supply a more useful schema to limit the number of api calls they need to make per event.

Enterprise Firehose API, at release, will contain:

  • Filtering of events by Project or Revision Namespace
  • Guaranteed connections
  • Commercially useful schema similar* to those that we are building in our Structured Content API and Bulk API
  • SLA

*We are still in the process of mapping out the technical specifications to determine the limitations of schema in event platforms and will post here when we have finalized our design.

Bulk API

For high volume reusers that currently rely on the Wikimedia Dumps to access our information, we have created a solution to ingest Wikimedia content in near real time without excessive API calls (Structured Content API) or maintaining hooks into our infrastructure (Firehose).

Enterprise Bulk API, at release, will contain:

  • 24-hour JSON*, Wikitext, or HTML compressed dumps of "text-based" Wikimedia projects
  • A hourly update file with revision changes of "text-based" Wikimedia projects
  • SLA

*JSON dumps will contain the same schema per page as the Structured Content API.

Accés

Per obtenir accés als conjunts de dades de l'API empresarial, hi ha tres mètodes:

  • De pagament

**Massiu i en temps real. A través del lloc web dedicat al producte de les API per a empreses, quan es posi en marxa.

  • De franc

**Massiu. Es proporcionarà una actualització quinzenal de les dades de l'API per a empreses per a tothom a https://dumps.wikimedia.org/ **Canvis cada dia i hora. A través de Wikitech:Portal:Data Services, disponible per qualsevol persona amb un compte dels serveis al núvol de Wikimedia.

Equip

Additional contract work provided by: Speed & Function are providing engineering support; Boldr provide customer support services; Vuurr are assisting our sales process; and Super Natural Design are the designers of the project website.

La junta de l'LLC que supervisa el projecte des de la direcció de la Fundació Wikimedia, en representació del seu paper en l'equip de la WMF, són: Lisa Seitz-Gruwell, directora de promoció; Tony Sebro, conseller legal general adjunt, i Lane Becker. En última instància, l'LLC està sotmesa al govern del Junta Directiva de la Fundació Wikimedia.

Documents covering the legal relationship of the LLC to the Wikimedia Foundation are published on the Governance Wiki under "Category:Wikimedia Enterprise". Specifically, these are the operating, cost-sharing, and inter-company licensing agreements.El registre legal de l'LLC es pot trobar a la Divisió de Corporació de l'Estat de Delaware amb el nom d'entitat "Wikimedia, LLC" i el número de fitxer 7828447.

See also: FAQ § Legal

Vegeu també

  • API:Portada – la llista central de totes les API de Wikimedia.
  • Wikitech: Portal de serveis de dades – Una llista de serveis orientats a la comunitat que permeten l'accés directe a les bases de dades i als bolcats, així com interfícies web per a la consulta i l'accés programàtic als magatzems de dades.
  • Enterprise hub – una pàgina per a aquells interessats en utilitzar el programari MediaWiki en contextos corporatius.