Wikimedia Enterprise/FAQ
Wikimedia Enterprise | |
---|---|
enterprise.wikimedia.com | |
Project | |
Technical | |
Quelle che seguono sono delle brevi risposte alle domande più comuni. Per maggiori dettagli o contesto su qualsivoglia argomento, per favore leggete la presentazione, i principi o la documentazione tecnica. Il progetto era originariamente noto come “Okapi”.
Domande generali
Che cos’è?
Wikimedia Enterprise è una società a responsabilità limitata posseduta interamente da WMF che fornisce servizi per il riutilizzo di contenuti di terze parti, erogati tramite servizi API. Fornisce un accesso ad alto volume e ad alta affidabilità ai contenuti di Wikimedia, progettato per le esigenze di organizzazioni commerciali, come motori di ricerca, assistenti vocali e startup tecnologiche. Questo servizio sarà accompagnato da una garanzia contrattuale (Service Level Agreements) per i clienti paganti.
Al momento del lancio, il servizio includerà i contenuti di tutte le edizioni linguistiche di tutti i progetti Wikimedia, eccetto Wikimedia Commons e Wikidata. Essere in grado di includere anche le informazioni di Wikidata è una priorità nella roadmap di sviluppo. Puoi saperne di più sui progressi dello sviluppo attraverso gli aggiornamenti tecnici mensili sulla pagina del progetto su Mediawiki.org.
Specifically, the API service is provided in three products:
- Snapshot: Retrieve an entire Wikimedia project, updated daily
- On-Demand: Retrieve any article from any Wikimedia project at anytime
- Realtime: Stream real-time updates from any Wikimedia project
Questo avrà effetti su di me come utente o possessore di un bot?
No. Tutto questo non influirà sulle vostre attività di modifica, fatte con le vostre utenze o con i bot. Tutte le API pre-esistenti continueranno a essere disponibili.
L’Enterprise API avrà effetti sui dump e sulle API attuali?
Il sistema di dump del database e API forniti gratuitamente rimane in vigore e continua a essere supportato. Non sono stati rimossi o limitati e continueranno a ricevere supporto e a essere sviluppati. Parte del motivo per cui l'API Enterprise è stata costruita separatamente è per non turbare gli ecosistemi esistenti.
Infatti, l'ecosistema di API esistente è attualmente in fase di rinnovamento nell'ambito dell'iniziativa "API Gateway". Fino a ora, le API e i servizi forniti per il riutilizzo dei contenuti di Wikimedia dovevano essere in grado di supportare le esigenze di singoli individui e anche di aziende estremamente grandi, come i motori di ricerca.
Questo ha portato a un esempio pratico di tragedia dei beni comuni, in cui rendere un singolo servizio ugualmente disponibile a tutti ha permesso ai più grandi di dominare, riducendo la qualità del servizio per tutti gli altri. L'esistenza dell'API Enterprise, progettata per le esigenze degli utenti più grandi, permetterà al nuovo Gateway API di essere costruito per gli individui e con restrizioni nei confronti degli utenti commerciali più grandi (ad esempio, limiti di velocità).
Perché si chiama “Enterprise”?
L’API e il progetto in precedenza si chiamavano “Okapi”: si trattava di un nome temporaneo, utilizzato finché non è stato definito il nome ufficiale. Un okapi è un bellissimo mammifero africano, che conteneva le lettere “a-p-i” nel suo nome e che è stato scelto per questo motivo. Il nome “Wikimedia Enterprise” (e “Enterprise API”) sono stati scelti per chiarire da subito chi sono i destinatari del servizio: le organizzazioni a scopo di lucro. Uno dei criteri importanti per la selezione di questo nome era che non implica che il contenuto dell’API sia commerciale o esclusivo o che le API esistenti stessero cambiando. Il nome “Enterprise API” appare anche nella strategia del movimento e quindi è coerente con l'utilizzo precedente nel movimento. Infine, era importante trovare un nome che non interferisse con i nomi esistenti di siti web, affiliati, progetti e team di Wikimedia.
Il progetto, e le API, non devono essere confusi con il MediaWiki Stakeholders group o la Enterprise MediaWiki Conference - rispettivamente, un'organizzazione indipendente affiliata a Wikimedia che difende i bisogni degli utenti MediaWiki al di fuori della Wikimedia Foundation, comprese le imprese commerciali, e una serie di conferenze per quella comunità.
Avrà effetti diretti sui contenuti Wikimedia?
No. Questa API permette l’accesso e il riuso di grandi volumi e a grande velocità di contenuti Wikimedia. Non ha nessun tipo di controllo editoriale o tecnico sui contenuti dei progetti Wikimedia. Ovviamente, coerentemente con i diritti garantiti dal framework di licenza culturale libera di Wikimedia, i riutilizzatori di Wikimedia possono creare opere derivate dai contenuti.
Accedendo ai contenuti di Wikimedia attraverso questo nuovo singolo metodo di importazione e firmando un contratto SLA per esso, saremo in grado di garantire che i riutilizzatori su larga scala siano più coerenti e accurati con la visualizzazione dell'attribuzione e delle licenze di copyright per i contenuti Wikimedia. Qualsiasi riduzione nella ripubblicazione involontaria di vandalismi da parte di riutilizzatori su larga scala va a vantaggio della comunità: rafforza la reputazione della nostra comunità nella cura di contenuti affidabili e riduce la posta in gioco per i membri della comunità dediti alla lotta contro i vandalismi. Nel tempo, il team di Wikimedia Enterprise spera di creare meccanismi per aiutare i riutilizzatori a ridurre la probabilità che inseriscano contenuti vandalici nei loro prodotti. Se questo lavoro si tradurrà in un migliore rilevamento dei vandalismi, eventuali lezioni apprese e/o codice sviluppato verranno condivisi con la comunità al fine di migliorare strumenti e flussi di lavoro e, di conseguenza, migliorare l'integrità della conoscenza.
Sul lungo termine, il team di Wikimedia Enterprise spera anche di esplorare metodi con cui nuove informazioni (ad esempio “microcontribuzioni”) potranno essere fornite ai progetti Wikimedia dal pubblico che utilizza prodotti realizzati dai clienti di Wikimedia Enterprise. Ciò è in accordo con la raccomandazione sulla strategia di movimento Improve User Experience che parla dell'utilizzo delle API per “...il potenziale di ritorno dei dati”. A quel punto, verrà effettuata un'adeguata consultazione della comunità per garantire che tali contributi possano essere richiesti in risposta alle effettive esigenze della comunità e in un modo conforme alla cultura editoriale di Wikimedia, alla politica sulla privacy, ai termini di utilizzo, ecc.
Questo impedirà agli errori/vandalismi di apparire nei risultati dei motori di ricerca?
Contribuirà a non farli apparire.
Rendendo il processo di inserimento dei contenuti Wikimedia più coerente per le parti terze che operano a larga scala e ad alta velocità, si ridurrà la probabilità che esse mostrino vandalismi e/o la durata della loro visualizzazione. I feed delle API non includeranno funzioni esclusive di rilevamento dei vandalismi che non siano già disponibili al pubblico, ma permetteranno un migliore riutilizzo degli strumenti esistenti anche ai nostri riutilizzatori (come i punteggi ORES e la frequenza corrente con cui una voce viene modificata). Questo permetterà ai clienti di Enterprise di avere più strumenti a disposizione per decidere cosa mostrare e quando.
Coerentemente con il principio delle opere libere, la Wikimedia Foundation non ha controllo sul modo in cui i riutilizzatori mostrano il contenuto dei progetti Wikimedia, in quale contesto venga visualizzato o con quali altri insiemi di dati viene combinato. Se trovi un esempio di contenuto Wikimedia usato in un contesto inappropriato nel risultato di un motore di ricerca, il suo operatore avrà una procedura per fornire un feedback in merito. A titolo di esempio, Google ha una policy su "come segnalare un featured snippet".
In che modo questo si collega alla strategia del movimento?
Nelle raccomandazioni sulla strategia di movimento Increase the sustainability of our movement e Improve User Experience ci sono riferimenti, rispettivamente, a “Esplorare nuove opportunità sia per la generazione di entrate, sia per la diffusione gratuita della conoscenza attraverso partnership e ricavi ottenuti per esempio... costruendo API di livello aziendale” e “Rendere la suite di API Wikimedia più completa, affidabile, sicura e veloce, in collaborazione con utenti su larga scala... e migliorare la consapevolezza e la facilità di attribuzione e verificabilità per i riutilizzatori di contenuti”.
Allo stesso tempo, il miglioramento della nostra API contribuisce in modo significativo al nostro progresso verso la nostra direzione strategica e la nostra visione, contribuendo significativamente alla Conoscenza come Servizio e all’Equità della Conoscenza. Nelle parole della raccomandazione, ciò renderà “la suite di API di Wikimedia più completa, affidabile, sicura e veloce, in collaborazione con utenti su larga scala dove ciò è in linea con la nostra missione e i nostri principi”, migliorerà “l'esperienza dei nostri utenti sia diretti, sia indiretti, aumentare la portata e la rilevabilità dei nostri contenuti e il potenziale di restituzione dei dati e migliorare la consapevolezza e la facilità di attribuzione e verificabilità per i riutilizzatori di contenuti”.
Oltre alle due raccomandazioni sopra citate, a cui Enterprise è esplicitamente collegata, hanno un ruolo da svolgere anche le iniziative strategiche. Queste includono: "3. Aumentare la consapevolezza sul Movimento Wikimedia"; "36. Identificare l'impatto dei progetti e dei contenuti Wikimedia" e "Disinformazione"; e "45. Politiche adattive". Molte delle raccomandazioni strategiche implicano un aumento delle entrate in tutto il movimento: è una strategia ambiziosa e, in definitiva, costosa da attuare. Pertanto, la creazione dell'API Enterprise nei prossimi anni ci consente di sviluppare questo nuovo flusso di entrate, che aiuterà a supportare in modo sostenibile il resto di queste raccomandazioni. Quindi è inclusa anche l'iniziativa "7. Generazione di ricavi per il movimento".
Sappiamo che, nel voto della comunità sulla priorità che avrebbero dovuto ricevere le raccomandazioni sul livello di attenzione, queste raccomandazioni sulle API erano piuttosto in basso nell’elenco. Riconosciamo e ci aspettiamo ampiamente che queste raccomandazioni non siano di interesse generale. Questa è un’attività che non impatta direttamente sulla comunità di utenti. Tuttavia, questa è una delle poche raccomandazioni a cui WMF è l’unica ad avere la possibilità esclusiva di rispondere. Questo significa che WMF può iniziare questo progetto immediatamente e indipendentemente da qualsiasi altra attività strategica senza interrompere, distogliere l'attenzione o ridurre la priorità del resto.
Dove è stato discusso tutto questo in precedenza?
La Wikimedia Foundation ha offerto servizi di dati a pagamento sin dal suo inizio, fornendo feed per consentire a terzi di ospitare i propri database locali. La creazione di questo servizio è stato ciò che ha portato all'assunzione iniziale di Brion Vibber, ed è stato utilizzato per avviare la Wikimedia Foundation nei primi anni. Il servizio è stato chiuso a nuovi clienti nel 2010 e il servizio è stato definitivamente disattivato nel 2014, principalmente per mancanza di manutenzione.
La riconsiderazione di servizi di dati su larga scala per garantire il successo del movimento, indipendentemente dal cambiamento dei metodi di scoperta dei contenuti Wikimedia, è stata discussa come una possibile idea da esplorare nel 2015 e di nuovo su Wikimedia-l nel 2016. L'idea è stata avanzata da due gruppi di lavoro durante la fase 2 del processo di strategia di movimento e il lavoro per migliorare l'utilizzo delle API da parte di terzi è stato identificato due volte nelle raccomandazioni strategiche finali (1, 2). L'inizio dei lavori sul progetto Enterprise API è stato annunciato nello specifico su Wikimedia-l a metà del 2020.
Nota: Questa FAQ è stata pubblicata a marzo 2021. A quel tempo, fu pubblicato un post sul blog Wikimedia, furono pubblicati avvisi in varie mailing list e su wiki, così come molte testate importanti ne hanno dato notizia – fra tutte, WIRED. Questo ha portato a un aumento significativo delle discussioni della comunità nelle nostre pagine di discussione, negli hub di discussione di molti wiki e sui social media. Un elenco completo dei media indipendenti che hanno scritto articoli su questo argomento è pubblicato su Wikimedia Enterprise#Press. Nell'ottobre 2021, è stato pubblicato un comunicato stampa di WMF che annunciava la disponibilità commerciale del prodotto e un report dell'Open Future Institute. Nel giugno 2022 è stato pubblicato un un altro comunicato stampa che annunciava i primi clienti del progetto e la creazione del sistema di auto-iscrizione. È stata inoltre creata una nuova pagina dedicata alle notizie, dove verranno pubblicati tutti i futuri annunci riguardanti il progetto.
Domande sugli aspetti finanziari
Stiamo per caso “vendendo” o “costringendo Big Tech a pagare” per Wikipedia?
No. Tutto il contenuto di Wikimedia è disponibile con licenza libera e può essere utilizzato da chiunque per qualsiasi scopo. Ciò non sarà e non può essere modificato. Il servizio Enterprise API è un nuovo metodo per fornire contenuti con volumi e velocità progettati specificamente per le esigenze delle principali organizzazioni commerciali che stanno già utilizzando i contenuti di Wikimedia commercialmente. L’Enterprise API sta vendendo come servizio questo nuovo metodo di accesso, ma non impedisce a nessuno (inclusi i potenziali clienti) di utilizzare i metodi di accesso gratuiti esistenti.
Molti governi e settori professionali (come quello giornalistico) in tutto il mondo stanno attualmente discutendo su come costruire un modello finanziariamente sostenibile mentre si lavora con “Big Tech”. La realizzazione della Wikimedia Enterprise API crea un modo per quelle organizzazioni commerciali che hanno costruito modelli di business dall'uso di contenuti Wikimedia disponibili gratuitamente per investire anche nel movimento Wikimedia in modo affidabile e continuo.
La community potrà accedere all’Enterprise API senza pagare?
Sì. Per l'accesso in blocco, una copia dell'output dell'API viene fornita tramite il servizio di dump del database pubblico, aggiornato ogni due settimane. Questa è la stessa frequenza già fornita da altri dump XML.
I dump giornalieri e i diff orari sono forniti tramite il portale Data Services, disponibile per chiunque abbia un account Wikimedia cloud services.
Una versione "di prova" del servizio live sarà disponibile gratuitamente sul sito web del prodotto. Questa versione è stata progettata principalmente per consentire a potenziali clienti commerciali di esaminare il servizio e pertanto ha un tasso massimo di utilizzo limitato. Tuttavia, è consentito (e anzi incoraggiato!) ai wikimediani di registrarsi e utilizzare il servizio anche per sé stessi. Le persone con un caso d'uso rilevante per la missione per la versione a pagamento del servizio che non è affrontato da quanto sopra, o da altri servizi Wikimedia, possono ricevere un accesso gratuito continuo.
Come verranno spesi i soldi?
La direzione strategica che miriamo a raggiungere entro il 2030 richiede, tra gli altri obiettivi, un'espansione su larga scala nelle lingue meno servite in tutto il mondo, e ciò richiederà una crescita significativa dei ricavi. Oltre a coprire i costi del progetto stesso, tutti i fondi generati dai clienti Enterprise verranno utilizzati per supportare la mission di Wikimedia. Ciò include investimenti nei progetti Wikimedia, nella comunità, nelle nostre organizzazioni di movimento e in Wikimedia Endowment. In questi primi tempi, è difficile prevedere quando Wikimedia Enterprise raggiungerà la redditività ed è ancora più difficile prevedere con precisione quanto profitto produrrà nei prossimi anni. Una volta che avremo un quadro più chiaro dei tempi e della redditività, il Board della Fondazione potrà pianificare pianificare il modo in cui desidera investire i profitti per sostenere la missione. È probabile che ci voglia almeno un anno per tutto questo.
In these early days, it is difficult to predict when Wikimedia Enterprise will reach profitability and even more difficult to accurately predict how much profit it will produce over the next few years. Once we have a more clear picture of timing and profitability, the Board of Trustees can plan for how they want to invest the profits to support the mission. That is likely to be at least a year away.
Quanti soldi sarà in grado di raccogliere questa iniziativa?
The annual financial reports are collated here, beginning in 2022 - the project's first year of operation. This information is also included within the scope of the overarching Wikimedia Foundation annual financial reports. Though not a legal requirement, the publishing of the LLC's financial information separately, and in greater granularity, from the overarching WMF report allows greater transparency of financial operations for this specific project.
Questa è, senza dubbio, una delle domande più importanti dal punto di vista del modello di business, ma è anche una domanda a cui non è possibile rispondere in anticipo. Sono state condotte ampie ricerche per sapere cosa vogliono e di cosa hanno bisogno i potenziali clienti di Enterprise API, che hanno informato lo sviluppo del prodotto e, di conseguenza, le stime delle entrate potenziali nel tempo. Una cosa è chiara: questo non sostituirà la nostra necessità di essere finanziati dalle donazioni dei lettori. In accordo con il principio operativo di indipendenza finanziaria di Wikimedia Enterprise e la relativa Dichiarazione del Board di Wikimedia Foundation sui principi sulle entrate di Wikimedia Enterprise, il reddito d'impresa non correlato proveniente da Wikimedia Enterprise e altre fonti non supererà il 30% delle entrate totali della Wikimedia Foundation. Ciò significa che almeno il 70% dei finanziamenti proverrà sempre da donazioni e sovvenzioni, eccetera.
In accordo con il principio operativo di onestà e trasparenza di Wikimedia Enterprise pubblicheremo le entrate e le spese complessive, differenziate da quelle più generali di Wikimedia Foundation, almeno annualmente. In aggiunta, facendo seguito alla dichiarazione del Board di Wikimedia Foundation, la Fondazione sarà informata in anticipo di tutti gli accordi che si prevede generino entrate superiori a 250.000 dollari USA all'anno, concedendo sufficiente tempo per poter sollevare eventuali obiezioni. Questo è coerente con la modalità con cui la Wikimedia Foundation gestisce le grandi donazioni da aziende.
Per quanto riguarda gli obiettivi finanziari del progetto che sono stati inizialmente definiti durante la fase di sviluppo, il Piano annuale 2021-22 prevede “10,2 milioni di dollari in entrate contrattuali e circa 3,6 milioni di dollari in spese per Wikimedia Enterprise...”.
Questa iniziativa avrà effetti sulle donazioni o sul fundraising?
No, Wikimedia Foundation continuerà a ricevere la maggior parte del suo sostegno dai lettori. Crediamo che questo sia importante affinché Wikipedia rimanga indipendente. Il finanziamento proveniente da milioni di lettori che donano una media di 15 dollari ci permette di rimanere allineati all'interesse pubblico. Le entrate di Wikimedia Enterprise integreranno il supporto dei nostri lettori, ma non lo elideranno. La API Enterprise è un modo per gli utenti aziendali, che già traggono profitto dal riutilizzo dei contenuti Wikimedia, per contribuire anche loro ai progetti.
Domande sugli aspetti tecnici
È open source?
Sì. Il codice si trova qui: https://github.com/wikimedia/OKAPI
The specific purpose of this API's code, and this service, is to be useful to very large commercial organizations and their unique infrastructural, legal, and metadata requirements. Those organizations are unique not just in the sense of sheer scale but also unique relative to each other: with their own mutually-incompatible way of dealing with similar problems. Given that one of the stated principles of the project is "no exclusivity" of the API – either by contract, or by features – we need to ensure that no user (free or paid) should be unintentionally excluded from being able to use it. Therefore, it was considered preferable to publish stable versions. This ensures that no one builds upon, or has expectations for, code that is not yet fit for everyone's purposes.
Meanwhile, all of the development work itself is tracked as per Wikimedia standard practice publicly and “live” on phabricator.
Perché state utilizzando una infrastruttura cloud/AWS operata da terzi?
Uno dei principali bisogni di Wikimedia Enterprise è quello di avere la capacità di realizzare prototipi e costruire rapidamente soluzioni che possano scalare in relazione alle esigenze dei potenziali clienti dell'API Enterprise. Per fare questo, abbiamo ottimizzato l'iterazione veloce, la separazione infrastrutturale dai progetti Wikimedia critici e l'utilizzo di Service Level Agreements (SLA) a valle. Almeno per la fase iniziale, i servizi cloud esterni ci forniscono queste capacità. Nonostante ci siano molti vantaggi nell'usare un cloud esterno per il nostro caso d'uso, riconosciamo che ci sono anche tensioni fondamentali, data la cultura e i principi su come le applicazioni vengono costruite qui in Fondazione. Le esigenze dei potenziali clienti dell'API Enterprise sono importanti per raggiungere la nostra missione di rendere la conoscenza disponibile a tutte le persone. Tuttavia, usare le risorse esistenti della Wikimedia Foundation per sviluppare prodotti che rispondano a queste esigenze sovvenzionerebbe i requisiti hardware di alcune delle più grandi organizzazioni for-profit del mondo.
L'API di Wikimedia Enterprise è ospitata su Amazon Web Services (AWS), un sistema molto utilizzato per questo tipo di operazioni. Tuttavia, non c'è alcun obbligo contrattuale, tecnico o finanziario nell'utilizzo dell'infrastruttura AWS. Stiamo immagazzinando contenuto di Wikimedia disponibile pubblicamente, dati di registro generali e dati di uso leggero in AWS. Cerchiamo di fornire accordi di livello di servizio (SLA) ai clienti con garanzie simili a quelle di Amazon. Non abbiamo informazioni equivalenti sull'uptime dell'infrastruttura esistente della Wikimedia Foundation. Ciò nonostante, questo è qualcosa che stiamo esplorando con Wikimedia Site Reliability Engineering.
Nel frattempo, stiamo cercando alternative ad AWS (e rimaniamo aperti a idee che possano essere adeguate al nostro caso di uso) per la fase in cui questo progetto sarà più consolidato e in cui saremo più sicuri riguardo quali siano davvero le nostre esigenze di infrastruttura. Nel frattempo, l'infrastruttura di hosting di WMF rimane interamente di proprietà di WMF, indipendente e non influenzata dall'API Enterprise.
Perché si tratta di un sito .com?
La pagina principale del servizio è enterprise.wikimedia.com, invece di .org come gli altri siti gestiti dalla Wikimedia Foundation, per le seguenti ragioni:
- Limiti di privacy e sicurezza dei dati. I domini DNS fungono da confini tecnici per le linee guida su privacy e sicurezza dei dati. Poiché Wikimedia Enterprise opera su un'infrastruttura separata, con regole e controlli separati, è più sicuro marcare una differenza fra questi confini, evitando di ospitare Wikimedia Enterprise su un dominio wikimedia.org, dove la Wikimedia Foundation gestisce i siti esistenti. La Wikimedia Foundation non gestisce nessun altro sito all'interno del dominio wikimedia.com, quindi questo garantisce una separazione chiara.
- Autenticità. È permesso usare un dominio .org per un progetto a scopo di lucro che sia di proprietà di un'organizzazione non-profit. Tuttavia, il team di Wikimedia Enterprise ha ritenuto che sia più accurato e onesto che il sito web sia .com, dal momento che è un progetto for-profit.
Ci saranno effetti su Wikidata o sul Wikidata Query Service?
La API Enterprise non avrà effetti diretti su Wikidata o sul Wikidata Query Service (WDQS). Inoltre, in questa fase dello sviluppo, l'API Enterprise non fornirà dati da Wikidata (o da Wikimedia Commons). Mentre WDQS è un servizio significativo per chi utilizza su larga scala i dati di Wikidata per fare baselining dei propri grafici di conoscenza, attualmente gli scopi della API Enterprise sono più focalizzati sullo streaming di contenuti in tempo quasi reale, che è un servizio differente da quello fornito da WDQS. Alla fine, alcune informazioni che i clienti di API Enterprise possono ottenere tramite WDQS potranno essere adesso ottenute attraverso l'API, con ciò diminuendo la quantità di utilizzo del WDQS.
Perché non lasciamo che siano gli altri a costruirsi il servizio?
Tutti i potenziali clienti iniziali dell'API Enterprise stanno già utilizzando i contenuti Wikimedia nei loro prodotti in varia misura. Indipendentemente l'uno dall'altro, investono per estrarre, ristrutturare e standardizzare i nostri contenuti per le loro esigenze. Tuttavia, quello che non possono fare internamente è assicurare la velocità, la coerenza e l'affidabilità fornita dai servizi Wikimedia. E questo è qualcosa che solo la Wikimedia Foundation può offrire. Inoltre, fornendo un prodotto disponibile per qualsiasi cliente, l'API Enterprise rende più equo l'accesso alle imprese piccole che desiderano utilizzare i contenuti Wikimedia nei propri servizi, ma che non hanno le risorse adeguate dei loro competitori più grandi per effettuare le necessarie conversioni di dati.
Cosa sono i segnali di credibilità
Segnali di credibilità è il nome di una funzionalità del set di dati API. Aiuta a rendere più comprensibili le informazioni contestuali che gli editori di Wikimedia utilizzano per rendere le loro decisioni editoriali all'interno di un feed API.
Quando rivedono le cronologie delle modifiche degli articoli, gli editor spesso prendono nota di molti fattori. Questi includono se un articolo ha: ricevuto improvvisamente molte nuove modifiche; è stato recentemente modificato da diversi account di nuova creazione o da diversi editor "anonimi"; le frequenti modifiche sono state annullate; il suo stato di protezione o il suo livello di qualità sono stati modificati; o improvvisamente ha ricevuto più visualizzazioni di pagina del normale. Segnali di credibilità è la trasformazione di queste informazioni contestuali in punti dati nell'API che i riutilizzatori possono applicare per prendere le proprie decisioni su come trattare le nuove revisioni – in tempo reale. Ad esempio: se un articolo viene identificato come correlato a "ultime notizie", alcuni riutilizzatori potrebbero voler rispondere a questo "segnale" aggiornando la loro copia il più rapidamente possibile, mentre altri potrebbero voler sospendere temporaneamente i loro aggiornamenti.
Questa caratteristica non è punteggi, filtri, classifiche, o giudizi di valore di "modifiche buone o cattive". Né è un'intelligenza artificiale che prende decisioni sull'accuratezza, la verità, o la qualità dei contenuti. Un elenco completo dei campi da cui è possibile ricavare nella creazione di un dato "segnale" è su https://www.mediawiki.org/w/api.php Nel portare avanti l'obiettivo strategico di "Knowledge as a service", ci auguriamo che Credibility Signals amplierà il numero di terze parti che incorporano informazioni in tempo reale da Wikimedia, abbassare la barriera all'ingresso di farlo, e diminuire i casi in cui proliferano atti di vandalismo ecc. A sua volta generando fiducia nei contenuti di Wikimedia e nel lavoro del movimento.
What is Breaking News
Just like "Credibility signals", this is the name for a a feature of the API. It identifies new and likely "newsworthy" events as they are being written about across Wikipedia language editions at any given moment. These events are then marked with a boolean field, allowing API users to easily identify this kind of content within their copy of the dataset. For a full essay documenting the nature and purpose of this, and how you can access it yourself, see its dedicated documentation page.
Consistent with the Wikimedia Enterprise principles (in particular that of "no exclusive content") the information this API feature is built upon is already public information that Wikimedia editors are already commonly using in their content moderation workflows – for example "does this article have a sudden increase in the number of pageviews, or of unique editors?", "was this article recently created/moved and have a 'current event' template?". The feature turns that kind of information into a feed of articles which API users can treat differently, if they wish. For example to re-index these articles more rapidly, or to pause re-indexing entirely until the content becomes more stable. This feature does not imply a change of Wikipedia editorial policy: most particularly regarding notability, reliable sources – summarised in the English Wikipedia policy "NOTNEWS".
What is Structured Contents
Within the Enterprise API suite, Structured Contents refers to the features making Wikimedia data more machine readable: these efforts are both focussed on pre-parsing Wikipedia snippets as well as connecting the different projects closer together. The Structured Contents endpoint (beta) has been released in September 2023 to the On-demand API, as a means to both facilitate more frequent updates as well as improve transparency in the development process. This endpoint includes pre-parsed Wikipedia abstracts, main images, descriptions, infoboxes and sections. To access this structured information in bulk the Structured Contents Snapshot endpoint (beta) in some languages was released to testing partners, and a public version made available on Hugging Face. Features will be continued to be added to this endpoint, see the Mediawiki Updates page.
Domande sulle questioni legali
Perché questo progetto viene gestito da una compagnia affiliata
La Wikimedia Foundation ha creato una società a responsabilità limitata a socio unico (LLC), che firmerà i contratti con i clienti dell'API Enterprise. Questa struttura societaria proteggerà la Fondazione dalle responsabilità generate dal servizio. Si tratta di un approccio standard quando una organizzazione non-profit gestisce un'attività a scopo di lucro, che ci aiuterà sia a gestire il rischio, sia a promuovere la trasparenza. Ciò premesso, la Fondazione è comunque tenuta secondo la legge statunitense a rendere pubbliche entrate e uscite della LLC nelle sue dichiarazioni fiscali annuale (vedi i report finanziari certificati). La LLC opera sotto gli auspici di Wikimedia Foundation, il suo staff è parte dello staff di Wikimedia Foundation e le sue operazioni sono, in ultimo, soggette alla governance del Board di Wikimedia Foundation (WMF). Il direttivo della LLC che supervisiona il progetto è composto da dirigenti della Wikimedia Foundation, in rappresentanza dei propri ruoli all'interno di WMF, e il “presidente” della LLC è il Direttore dello sviluppo commerciale della WMF.
Puoi visualizzare i contratti che costituiscono il rapporto legale tra la Wikimedia Foundation e questa LLC su Governance Wiki. Sono rispettivamente:
- l'accordo operativo della LLC, che istituisce formalmente l'LLC con la Wikimedia Foundation come suo unico membro;
- l'accordo di licenza interaziendale, che affronta il diritto della LLC di usare i marchi Wikimedia, eccetera;
- l'accordo sulla condivisione dei costi, che affronta la contabilizzazione di entrate e spese della LLC da parte di WMF.
La registrazione legale della LLC è disponibile presso State of Delaware, Division of Corporations, nome entità: Wikimedia, LLC, numero: 7828447. Negli Stati Uniti, la creazione di un'entità legale nello Stato del Delaware è comune perché il corpo del diritto societario nel Delaware è ben sviluppato e facilmente comprensibile. Usare la LLC per far funzionare Wikimedia Enterprise aiuterà a isolare la Wikimedia Foundation dall'esposizione. La chiarezza del diritto societario del Delaware promuove tale obiettivo e riduce anche i costi legali sia a breve che a lungo termine. In quanto organizzazione senza scopo di lucro, la LLC registrata nello stato del Delaware non crea alcuna differenza nella nostra responsabilità fiscale federale degli Stati Uniti o trasparenza finanziaria nei requisiti di rendicontazione fiscale rispetto all'essere registrata in qualsiasi altro stato.
La valutazione del trattamento fiscale appropriato delle attività della LLC è stato coordinato con il revisore contabile di Wikimedia Foundation, che è KPMG.
Chi saranno i “clienti”?
L'API Enterprise è stata inizialmente progettata per le esigenze di un numero molto piccolo di organizzazioni tecnologiche, ossia alcune delle aziende più grandi e ricche del mondo comunemente chiamate “Big Tech”. Dato che non ci saranno contratti esclusivi né contenuti esclusivi, lo sviluppo di questo prodotto aiuterà anche a fornire la possibilità alle piccole organizzazioni a scopo di lucro di beneficiare dell'uso dei contenuti Wikimedia nei loro prodotti. Questo viene affrontato anche nella descrizione del progetto su Open Future, quando si parla di "livellamento del campo di gioco", ed è coerente con la direzione strategica sulla "Conoscenza come servizio".
Intervistando molte organizzazioni in diversi settori commerciali, è emerso chiaramente che ci sono molti altri potenziali clienti oltre alle "big tech". Le loro esigenze sono diverse e quindi la Product roadmap sarà adattata nel tempo per soddisfare questa domanda, concentrandosi sul rendere più facile l'integrazione e la comprensione del complesso ecosistema di informazioni di Wikimedia (attraverso elementi come i segnali di credibilità e i sottoinsiemi di informazioni - vedi sempre la roadmap).
As stated in the original press release, Google and the Internet Archive are the first to receive paid and free access (respectively) but we have not publicized the subsequent customers (paid or free) who have signed up to the service. Maintaining a public and comprehensive list of paying and free/trial customers would look like advertising or promotion of those customers. It would also introduce a new privacy (and potentially security) problem: In the same way that it would be inappropriate to make a public list of "all individuals who have used the Wikidata Query Service this month" (for example), making a public list of all organizations who have used this service goes against our privacy culture. Nonetheless, we do intend to be making "use case" blog posts, which will describe how some users (either general categories or individual cases with their permission) are benefiting from the service in the real world. No one is required to publish whether, or how, they read or reuse Wikimedia content. This is consistent with that practice.
In base alla dichiarazione del Board di Wikimedia Foundation, la Fondazione sarà informata in anticipo di tutti gli accordi che si prevede generino entrate superiori a 250.000 dollari USA all'anno, concedendo sufficiente tempo per poter sollevare eventuali obiezioni. Questo è coerente con la modalità con cui la Wikimedia Foundation gestisce le grandi donazioni da aziende. Come organizzazione con sede negli Stati Uniti, non è legalmente permesso fare affari con organizzazioni con sede in alcuni paesi proscritti, la cui lista è determinata dall'Office of Foreign Assets Control.
Cosa c'è nei contratti?
I contratti con i clienti includeranno tipicamente termini che regolano la durata dell'impegno, il tipo di supporto al cliente, il tempo di attività previsto, il costo, i meccanismi di risoluzione delle controversie, le assicurazioni sull'attribuzione appropriata al contesto, le informazioni di licenza e le restrizioni sul riutilizzo dell'API per creare un business concorrente (pur affermando la sottostante licenza di cultura libera del contenuto). Come scritto nei nostri principi, il contratto non concederà contenuti esclusivi, accesso esclusivo, dati privati o di utenti o alcun tipo di influenza editoriale; inoltre, non includerà restrizioni su come il contenuto può essere usato, poiché contrarie alle licenze copyleft con cui sono pubblicati i contenuti.