Wikimedia Enterprise/FAQ
Wikimedia Enterprise | |
---|---|
enterprise.wikimedia.com | |
Beschreibung | |
Technical | |
Im Folgenden gibt es eine Reihe von kurzen Antworten auf die (vermutlich) häufigsten Fragen. Für mehr Details siehe den „Community-Essay“, die Prinzipien und die technische Dokumentation. Das Projekt trug früher den Arbeitstitel „Okapi“.
Allgemeines
Worum geht's
Wikimedia Enterprise ist in erster Linie eine API (also eine Schnittschnelle) für Wikimedia-Inhalte, die für die besonderen Bedürfnisse (in punkto hohes Volumen, hohe Geschwindigkeit, hohe Zuverlässigkeit) von sehr großen Organisationen ausgelegt sind, die wiederum Wikimedia-Inhalte in ihren kommerziellen Diensten verwenden. Dieser Dienst wird mittels einer vertraglichen Garantie (einem sogenannten „Service Level Agreement“, SLA) mit zahlende Kunden vereinbart.
The service include the content of all language editions of all Wikimedia sister projects except Wikimedia Commons and Wikidata. Including Wikidata information is high a priority on the development roadmap. You can learn more about the development progress via the monthly technical updates on the project's MediaWiki.org homepage.
Specifically, the API service is provided in three products:
- Snapshot: Retrieve an entire Wikimedia project, updated daily
- On-Demand: Retrieve any article from any Wikimedia project at anytime
- Realtime: Stream real-time updates from any Wikimedia project
Wird mich das als Autor / Autorin oder Bot-Betreibender betreffen
Nein. Dieser Dienst ändert nichts am Bisherigen für Autorinnen und Autor (egal ob Mensch oder Bot). Alle bereits bestehenden APIs bestehen fort.
Wird die Enterprise-API die derzeit verfügbaren Daten-Dumps und APIs betreffen
The system of freely-provided database dumps and APIs remains in place and continues to be supported. They are not being removed or restricted and will continue to receive support and development. Part of the reason the Enterprise API is being built separately is in order not to disrupt the existing ecosystems.
In fact, the existing API ecosystem is currently being revamped under the "API Gateway" initiative. Until now, the APIs and services provided for re-use of Wikimedia content had to be able to support the needs of individuals and also extremely large companies such as search engines.
This resulted in a practical example of The tragedy of the commons – where making a single service equally available to all, allowed the largest to dominate, which reduced the quality of the service for everyone else. The existence of the Enterprise API, designed for the needs of the larger users, will allow the new API Gateway to be built for individuals and with restrictions against the larger commercial users (e.g. rate limits).
Wieso heißt der Dienst „Enterprise“
Die API und das Projekt, das Team und die API wurden zuvor „Okapi“ genannt; dies war ein vorläufiger Arbeitsliste, der verwendet wurde, bis ein endgültiger offizieller Name festgelegt wurde. Ein Okapi ist ein niedliches Säugetier aus Afrika, das zufälligerweise die Buchstaben a-p-i in seinem Namen enthält. Der Name „Wikimedia Enterprise“ (und „Enterprise API“) soll deutlich machen, wer die vorgesehenen Nutzer des Dienstes sind: große Unternehmen. Wichtige Kriterien für die Auswahl dieses Namens waren, dass er nicht impliziert, dass der Inhalt der API kommerziell oder exklusiv ist, oder dass die bestehenden APIs verändert werden. Der Begriff „Enterprise API“ taucht auch in der Movement-Strategie auf und ist somit konsistent mit der bisherigen Verwendung innerhalb Wikimedias. Schließlich war es auch wichtig, einen Namen zu finden, der bestehenden Namen von Wikimedia-Websites, -Gruppen, -Organisationen, -Projekten und -Teams ähnelt.
Das Projekt und die API sollten nicht mit der MediaWiki Stakeholders group oder der Enterprise MediaWiki Conference verwechselt werden - die erste ist eine unabhängige Wikimedia-User Group, die sich für die Belange von MediaWiki-Benutzenden außerhalb der Wikimedia Foundation einschließlich kommerzieller Unternehmen einsetzt, das letztere ist eine Konferenzreihe für diese Community.
Wird das die Wikimedia-Inhalte direkt betreffen
Nein. Die API ermöglicht den schnellen Zugriff und die Weiternutzung von Wikimedia-Inhalten in großem Umfang. Die API hat keine technische oder inhaltliche Kontrolle über die Inhalte in Wikimedia-Projekten. Natürlich ist es den Wikimedia-Weiternutzern im Einklang mit den Lizenzen erlaubt, abgeleitete Werke von den Inhalten zu erstellen.
Durch den Zugriff auf Wikimedia-Inhalte über diese neue sogenannte „Single-Ingestion-Methode“ und durch die Unterzeichnung eines vertraglichen SLA dafür, werden wir in der Lage sein, sicherzustellen, dass große Weiternutzer konsistenter und genauer mit der Autorennennung und der Copyright-Lizenzierung für Wikimedia-Inhalte sind. Durch die bessere Sichtbarkeit von Urhebern und Lizenzen in der Weiterverwendung gehen wir davon aus, dass weniger Vandalismus in anderen Diensten „wiederveröffentlicht“ wird, was wiederum Wikimedia zu Gute kommt: Es stärkt unserer Ruf, verlässliche Inhalte anzubieten, und es verringert den Aufwand für Communitymitglieder, die sich der Bekämpfung von Vandalismus widmen. Im Laufe der Zeit hofft das Wikimedia Enterprise-Team, Mechanismen zu entwickeln, die Weiternutzern helfen, die Wahrscheinlichkeit zu verringern, dass sie Vandalismus in ihren Produkt zeigen. Wenn diese Arbeit zu einer besseren Erkennung von Vandalismus führt, teilen wir natürlich alle Erkenntnisse, Erfahrungen und den ggfs. entwickelten Code mit den Communitys, um Tools und Prozesse zu verbessern und damit die Konsistenz unserer Inhalte zu erhöhen.
Längerfristig hofft das Wikimedia-Enterprise-Team auch, Wege zu zu finden, mit denen neue Informationen (z. B. „Mikro-Edits“) ihren Weg über die Produkte der API-Kunden wieder zurück in die Wikimedia-Projekte fließen können. Auch dies steht im Einklang mit der Empfehlung „Verbesserung der Benutzungserfahrung“, die im Kontext der APIs von „...möglichen Datenrückgaben" spricht. Sollte es dazu kommen, wird es auf jeden Fall einen angemessene „Community-Consultation“ geben, um sicherzustellen, dass solche Beiträge tatsächlich von den Communitys wohlwollen aufgenommen werden, als auch den Bedürfnisse und Regeln der Wikimedia-Kultur, -Datenschutz, Nutzungsbedingungen, etc. entspricht.
Werden durch Wikimedia Enterpriese keine Fehler oder Vandalismus mehr in Suchmaschinenergebnissen auftauchen?
Es würde helfen.
By making a more consistent Wikimedia content-ingestion process for third-party organisations who operate at high scale and high speed, it will reduce the likelihood that they display vandalism and/or reduce the duration that it is displayed. The API feeds will not include exclusive vandalism detection features unavailable to the public, but it will enable existing signals to be more accessible to our reusers (such as ORES scores and the frequency with which an article is currently receiving edits). This will enable Enterprise's customers to have more tools at their disposal in order to make decisions for what to display and when.
Übereinstimmend mit dem Prinzip der freien kulturellen Arbeit kontrolliert die Wikimedia Foundation nicht, in welchen Kontext und in Kombination mit welchen anderen Datensätzen Weiternutzer den Inhalt der Wikimedia-Projekte verwenden. Wenn dir ein Fall auffällt in dem der Inhalt in unangemessener Weise verwendet wird, bieten die Betreiber eine Möglichkeit das zu melden. Google beispielsweise bietet dafür eine Feebackoption und die verlinkte Seite enthält dazu "Erklärungen".
Was ist die Verbindung zur Movement-Strategie
In den Empfehlungen des Movement Strategy-Prozesses „Verbesserung der Nachhaltigkeit unserer Bewegung“ und „Verbesserung der Benutzungserfahrung“ heißt es entsprechend: „Durch Partnerschaften und erhaltene Einnahmen neue Möglichkeiten für sowohl die Generierung von Einnahmen als auch für die Verbreitung von freiem Wissen untersuchen, zum Beispiel ... Aufbau von APIs auf Unternehmensebene“ und „Die Wikimedia API-Suite umfassender, zuverlässiger, sicherer und schneller machen, in Zusammenarbeit mit Großbenutzenden.... und die Einfachheit der Zuordnung und Überprüfbarkeit für Nachnutzende von Inhalten zu verbessern.“
Gleichzeitig trägt die Verbesserung unserer API erheblich dazu bei, uns unserer strategischen Ausrichtung und unserer Vision zu nähern, vor allem, im Bereich dessen, was als „Knowledge as a Service“ und „Knowledge Equity“ beschrieben wird. In den Worten der strategischen Empfehlung heißt es, „die Wikimedia-API-Suite umfassender, zuverlässiger, sicherer und schneller zu machen, in Partnerschaft mit Großnutzenden, wo dies mit unserer Mission und unseren Prinzipien übereinstimmt“, sowie "die Benutzungserfahrung sowohl unserer direkten als auch indirekten Benutzenden zu verbessern, die Reichweite und Entdeckbarkeit unserer Inhalte und das Potenzial für Datenrückflüsse zu erhöhen und das Bewusstsein für und die Einfachheit der Zuordnung und Überprüfbarkeit für Nachnutzende von Inhalten zu verbessern."
On top of the two aforementioned recommendations which Enterprise is explicitly connected to, it also has a role to play in several of the Strategy Initiatives. These include: "3. Increased awareness about the Wikimedia Movement", "36. Identify the impact of Wikimedia projects & content" and "misinformation", and "45. Adaptive policies". Viele der Strategieempfehlungen implizieren eine Steigerung der Einnahmen im gesamten Wikimedia-Netzwerk: Es ist eine ehrgeizige und letztlich teure Strategie, die umzusetzen ist. Daher ermöglicht uns der Aufbau der Enterprise API über die nächsten Jahre, eine neue Einnahmequelle zu entwickeln, die dazu beitragen kann, den Rest dieser Empfehlungen nachhaltig zu unterstützen (und damit tatsächlich umzusetzen).
Wir erkennen an und wissen, dass diese diese API-spezifischen Empfehlungen in der allgemeinen Priorisierung der strategischen Empfehlungen durch die Communitys sehr weit unten auf der Liste standen. Wir erkennen an und verstehen es absolut, dass diese konkreten Empfehlungen nicht von allgemeinem Interesse sein würden. Das ist eine Projektinitiative, die sich nicht direkt auf die Autorenschaft auswirkt. Allerdings, das wollen wir hier nur deutlich machen, ist das eine Empfehlung, die ausschließlich von der Wikimedia Foundation übernommen werden kann. Das bedeutet, dass die WMF dieses Projekt sofort und unabhängig von allen anderen Strategieaktivitäten in Angriff nehmen kann, ohne die übrigen Aktivitäten zu unterbrechen, von ihnen abzulenken oder ihnen ihre Priorität zu nehmen.
Wo wurde das vorher schon mal diskutiert
Die Wikimedia Foundation bietet bereits seit kurz nach ihrer Gründung kostenpflichtige Datendienste an, die Feeds bereitstellen, damit Dritte ihre eigenen lokalen Datenbanken hosten können. Die Einrichtung dieses Dienstes führte zu der anfänglichen Einstellung von Brion Vibber und wurde in den ersten Jahren zum Aufbau der Wikimedia Foundation genutzt. Der Dienst wurde im Jahr 2010 für neue Kunden geschlossen und schließlich im Jahr 2014 stillgelegt, hauptsächlich aufgrund mangelnder Wartung.
2015 und erneut 2016 wurde die Neuauflage solcher groß angelegter Datendienste auf Wikimedia-l diskutiert. Die Idee wurde von zwei Arbeitsgruppen während der Phase 2 des Movement-Strategie-Prozesses geäußert, und die Arbeit an der Verbesserung der API-Nutzung durch Drittanbietern wurde zweimal in den endgültigen strategischen Empfehlungen genannt (1, 2). Der Beginn der Arbeit am Enterprise-API-Projekt wurde auf Wikimedia-l Mitte 2020 besprochen.
Note: This FAQ was published in March 2021. At that time a Wikimedia blogpost was published, notices were placed in various mailinglists and on wiki, and many mainstream media stories covered it–most notably in WIRED. This resulted in significantly more community discussion on this talkpage, on central discussion hubs on many wikis, and in social media. A comprehensive list of independent media which wrote stories about this topic is published at Wikimedia Enterprise#Press. In October 2021 a WMF Press Release announcing the product is commercially available, and a report by the Open Future institute were published. This was followed in June 2022 with another Press Release announcing the project's first customers and the self-signup system. A new "news" page for the project has been created at https://enterprise.wikimedia.com/news/ and all future announcements from the project will be published there.
Finanzielles
Geht’s hier darum, dass “Big Tech endlich mal zahlen soll!1!“ bzw., dass Wikipedia „verkauft“ wird
Nein. Alle Wikimedia-Inhalte sind auch weiterhin unter freien Lizenz verfügbar und können auch weiterhin von allen für jeden Zweck genutzt werden. Das wird und kann nicht geändert werden. Der Enterprise-API-Dienst ist eine neue Methode, diese Inhalte in einem Umfang und mit einer Geschwindigkeit bereitzustellen, die speziell auf die Bedürfnisse großer kommerzieller Organisationen zugeschnitten ist, die Wikimedia-Inhalte bereits kommerziell nutzen. Die Enterprise-API verkauft den Zugang zu diesem Dienst, aber sie hindert niemanden (einschließlich dieser möglichen Kunden) daran, die bestehenden kostenfreien Zugriffswege zu nutzen.
Viele Regierungen und Berufszweige (z.B. im Bereich des Journalismus) auf der ganzen Welt diskutieren derzeit, wie sie ein finanziell nachhaltiges Modell aufbauen können, während sie mit „Big Tech“ arbeiten. Der Aufbau der Wikimedia-Enterprise-API schafft eine Möglichkeit für jene kommerziellen Organisationen, die Geschäftsmodelle aus der Nutzung frei verfügbarer Wikimedia-Inhalte aufgebaut haben, auch in die Wikimedia-Bewegung auf zuverlässige und kontinuierliche Weise finanzielles zurückzugeben.
Kann die Community auf die Enterprise-API zugreifen ohne bezahlen zu müssen
Ja. Für den Massenzugriff („bulk access“) wird eine Kopie der API-Ausgabe über den [$WMDumps öffentlichen Datenbank-Dump-Service] bereitgestellt, der vierzehntäglich aktualisiert wird. Dies ist die gleiche Frequenz, die andere XML-Dumps bereits bieten.
Daily dumps + hourly diffs are provided via the Data Services portal, available to anyone with a Wikimedia cloud services account.
A "trial" version of the live service is also available via the product's website at no cost. This version is primarily designed to allow potential commercial customers to investigate the service and therefore it has a restricted maximum rate/usage. Nonetheless, it is allowed (and indeed encouraged!) for Wikimedians to register and use this service for themselves too. People with a mission-relevant use-case for the paid version of the service that is not addressed by the above, or by other Wikimedia services, can be provided with ongoing free access.
Wie wird das eingenommene Geld ausgegeben
Die strategische Ausrichtung, die wir bis 2030 erreichen wollen, erfordert neben anderen Zielen eine groß angelegte Expansion in weniger unterstützte Sprachen auf der ganzen Welt, und dies erfordert ein signifikantes Wachstum an Einnahmen. Neben der Deckung der Kosten für das API-Projekt selbst werden alle von Enterprise-Kunden generierten Mittel zur Unterstützung der Wikimedia-Mission verwendet. Dies umfasst Investitionen in die Wikimedia-Projekte, die Communitys, die Wikimedia-Organisationen und -Gruppen sowie das Wikimedia Endowment (Stiftungskapital). In diesen frühen Tagen ist es schwierig vorherzusagen, wann Wikimedia Enterprise tatsächlich rentabel sein wird, und es ist noch schwieriger genau vorherzusagen, wie viel Gewinn in den nächsten Jahren im Rahmen dieses Projektes erwirtschaftet wird. Sobald wir ein besseres Bild davon haben, kann das Board of Trustees der Wikimedia Foundation planen (und entscheiden), wie es die Gewinne aus der API investieren möchte. Das ist aber mindestens noch ein Jahr entfernt.
In these early days, it is difficult to predict when Wikimedia Enterprise will reach profitability and even more difficult to accurately predict how much profit it will produce over the next few years. Once we have a more clear picture of timing and profitability, the Board of Trustees can plan for how they want to invest the profits to support the mission. That is likely to be at least a year away.
Wie viel Geld kommt da raus
The annual financial reports are collated here, beginning in 2022 - the project's first year of operation. This information is also included within the scope of the overarching Wikimedia Foundation annual financial reports. Though not a legal requirement, the publishing of the LLC's financial information separately, and in greater granularity, from the overarching WMF report allows greater transparency of financial operations for this specific project.
Es überrascht sicherlich nicht, dass dies eine der wichtigsten Fragen aus der Perspektive des Geschäftsmodells ist, und es aber auch gleichzeitig unmöglich ist, das im Voraus zu beantworten. Es wurden umfangreiche Untersuchungen durchgeführt, um herauszufinden, was die potenziellen Kunden der Enterprise API brauchen und wollen, was die Produktentwicklung und damit auch die Schätzungen der möglichen Einnahmen im Laufe der Zeit beeinflusst hat. Eines ist klar: Dies wird nicht unsere Notwendigkeit ersetzen, uns weiterhin durch Spenden unserer Leserinnen und Lesern zu finanzieren. Vielmehr erwarten wir, dass der überwiegende Teil unserer Finanzierung weiterhin aus Spenden stammen wird. In Übereinstimmung mit dem Wikimedia-Enterprise-Prinzip der „Ehrlichkeit und Transparenz“ (Honesty and Transparency) werden wir die Gesamteinnahmen und -ausgaben, separiert von denen der Wikimedia Foundation im Allgemeinen, mindestens jährlich veröffentlichen. Wir werden auch ein periodisch aktualisiertes Verzeichnis der aktuellen kommerziellen Kunden veröffentlichen, deren Vertragssumme über dem Betrag liegt, bei dem finanzielle Zuwendungen an die Wikimedia Foundation eine Mitteilung an das Board of Trustees erfordern.
In accordance with the Wikimedia Enterprise operating principle of honesty and transparency we will publish overall revenue and expenses, differentiated from those of the Wikimedia Foundation in general, at least annually. Furthermore, as per the Wikimedia Foundation Board's statement, it will be notified in advance of all agreements expected to generate revenue in excess of $250,000 USD annually, allowing time for any concerns to be raised. This is consistent with how the Wikimedia Foundation treats large corporate donations.
As per the project's financial goals that were initially defined during the development-phase, the 2021-22 Annual Plan predicts "$10.2 million in contractual revenue and approximately $3.6 million in expense for Wikimedia Enterprise...".
Wird das das bisherige Spendenmodell beeinflussen
Nein, die Wikimedia Foundation wird weiterhin den größten Teil ihrer Unterstützung von Leserinnen und Lesern erhalten. Wir glauben, dass das wichtig ist, damit Wikipedia unabhängig bleiben kann. Die Finanzierung Wikimedias durch Millionen von Spenden aus der Leserschaft in Höhe von durchschnittlich 15 Dollar hält uns in der Spur, im Interesse der allgemeinen Öffentlichkeit zu arbeiten. Die Einnahmen von Wikimedia Enterprise werden unsere bisherigen Spenden ergänzen, aber nicht in den Hintergrund drängen. Die Enterprise-API ist eher eine Möglichkeit für kommerzielle Nutzer, die bereits von der Wiederverwendung von Wikimedia-Inhalten profitieren, ebenfalls zu den Projekten beizutragen.
Technisches
Ist die API open source?
Yo, hier ist sie: https://github.com/wikimedia/OKAPI
The specific purpose of this API's code, and this service, is to be useful to very large commercial organizations and their unique infrastructural, legal, and metadata requirements. Those organizations are unique not just in the sense of sheer scale but also unique relative to each other: with their own mutually-incompatible way of dealing with similar problems. Given that one of the stated principles of the project is "no exclusivity" of the API – either by contract, or by features – we need to ensure that no user (free or paid) should be unintentionally excluded from being able to use it. Therefore, it was considered preferable to publish stable versions. This ensures that no one builds upon, or has expectations for, code that is not yet fit for everyone's purposes.
Meanwhile, all of the development work itself is tracked as per Wikimedia standard practice publicly and “live” on phabricator.
Wieso benutzt ihr eine extern arbeitende Cloud-Infrastruktur / AWS
Eine Notwendigkeit des Wikimedia-Enterprise-Projektes ist es, schnell Prototypen zu erstellen und Lösungen zu entwickeln, die auf die Bedürfnisse der Kunden der API passen und skalieren können. Damit wir das erreichen, haben wir das Projekt so ausgelegt, dass es schnelle Iterationsprozesse gibt, als auch eine infrastrukturelle Trennung von kritischen Wikimedia-Projekten; ebenso haben wir die Nutzung von nachgelagerten Service Level Agreements (SLAs) optimiert. Zum Start dieses Projektes stellen uns externe Cloud-Dienste diese Möglichkeiten (am besten) zur Verfügung. Während es natürlich viele Vorteile gibt, einen externen Cloud-Dienst für unseren Anwendungsfall zu nutzen, sind wir uns bewusst, dass es auch grundlegende Bedenken dabei gibt, gerade im Vergleich zu den praktizierten Prinzipien und der Kultur der Wikimedia Foundation. Die Bedürfnisse der möglichen Kunden der Enterprise-API sind wichtig für das Erreichen unserer Mission, Wissen für alle Menschen verfügbar zu machen. Die Verwendung der derzeit vorhandenen Ressourcen der Wikimedia Foundation zur Entwicklung dieser API würde jedoch im Endeffekt dazu führen, dass die Hardwareanforderungen einiger der weltweit größten Unternehmen über Spendengeldern subventioniert werden.
Die Wikimedia Enterprise API wird auf Amazon Web Services (AWS) gehostet - ein sehr häufig genutzter Dienst für derartige Zwecke. Nichtsdestotrotz ist die API weder vertraglich noch technisch oder finanziell an die Nutzung der AWS-Infrastruktur gebunden. Wir speichern öffentlich zugängliche Wikimedia-Inhalte, allgemeine Logging-Daten und ein Minimum an Nutzungsdaten auf AWS. Wir arbeiten daran, unseren Kunden „Service Level Agreements“ (SLA) mit ähnlichen Garantien wie die von Amazon anzubieten. Wir haben derzeit keine entsprechenden Informationen zur Uptime der bestehenden Infrastruktur der Wikimedia Foundation. Dies ist jedoch etwas, woran wir mit dem Wikimedia Site Reliability Engineering-Team arbeiten.
In der Zwischenzeit schauen wir uns uns nach Alternativen zu AWS um (und sind jederzeit offen für Ideen, die zu unserem Anwendungsfall passen könnten), und sobald dieses Projekt etablierter ist und wir sicher wissen, wie die Anforderungen an die Infrastruktur tatsächlich aussehen. Unabhängig von der Enterprise-API bleibt die WMF-Hosting-Infrastruktur vollständig unabhängig und unbeeinflusst.
Wieso hat die Enterprise-Webseite eine .com-TLD?
Die Startseite des Dienstes ist enterprise.wikimedia.com und nicht .org wie bei anderen von der Wikimedia Foundation betriebenen Webseiten, und zwar aus folgenden Gründen:
- Datenschutz und der Sicherheit. DNS-Domains fungieren als technische Grenzen für Datenschutz und Sicherheit. Da Wikimedia Enterprise auf einer separaten Infrastruktur mit eigenen Richtlinien und Kontrollen betrieben wird, ist es sicherer, keine dieser technischen Grenzen zu verwischen, indem Wikimedia Enterprise auf einer Domain wie "wikimedia.org" gehostet wird, auf der die Wikimedia Foundation bestehende Sites betreibt. Die Wikimedia Foundation betreibt keine anderen Sites innerhalb von "wikimedia.com", so dass dies eine klar definierte Grenze darstellt.
- Authentizität. Gemeinnützige Organisationen können gewinnorientierte Projekte natürlich auch auf einer .org-Domain hosten. Das Wikimedia-Enterprise-Team war jedoch der Meinung, dass es ehrlicher und transparenter ist, dass die Webseite eine .com-TLD tragen sollte, da es sich hier nun mal um ein gewinnorientiertes Projekt handelt.
Wie betrifft das Wikidata und den Wikidata-Query-Service
Die Wikimedia Enterprise API wird keine direkten Auswirkungen auf Wikidata oder den Wikidata Query Service (WDQS) haben. Während der WDQS ein wichtiger Dienst für große Wikidata-Nutzer ist, um ihre „Wissensgraphen“ zu erstellen, konzentrieren sich die Ziele der Enterprise API derzeit auf das Streaming von Inhalten in nahezu Echtzeit, was wiederum ein anderes Angebot als der WDQS ist. Im Moment bietet die Enterprise API nur Daten aus den „Text“-Wikimedia-Projekten an. Einige Informationen, die Unternehmen derzeit über das WDQS beziehen, können auch über die Enterprise-API bezogen werden, was im besten Falle die Nutzung des WDQS-Dienstes verringern könnte.
Wieso schaffen die Unternehmen solche Schnittstellen nicht selber
Alle zu Anfang in Betracht kommenden Kunden der Enterprise API verwenden bereits in unterschiedlichem Maße Wikimedia-Inhalte in ihren Produkten und Dienstleistungen. Unabhängig voneinander investieren diese Unternehmen bereits in die Weiternutzung, Umstrukturierung und Standardisierung der Wikimedia-Inhalte -- je nach ihren Bedürfnissen. Was sie jedoch intern nicht tun können, ist, die Geschwindigkeit, Konsistenz und Zuverlässigkeit der Art und Weise, wie die bisherigen Wikimedia-Dienste diese Inhalte bereitstellen, zu gewährleisten. Das ist etwas, was nur die Wikimedia Foundation bieten kann. Darüber hinaus schafft die Enterprise API durch die Bereitstellung eines Produkts, das für alle verfügbar ist, gleiche Wettbewerbsbedingungen auch für kleinere Unternehmen, die Wikimedia-Inhalte in ihren Diensten nutzen möchten, aber nicht über die internen Ressourcen ihrer größeren Konkurrenten verfügen, um die notwendigen Datenumwandlungen und -anpassungen durchzuführen.
What are Credibility Signals
This is the name for a feature of the API dataset. It helps to make the contextual information that Wikimedia editors use to make their editorial decisions more understandable within an API feed. For a full essay documenting the nature and purpose of this, see its dedicated documentation page.
When reviewing edit histories of articles editors will often take note of many factors. These include as whether an article has: suddenly received a lot of new edits; been recently edited by several newly-created accounts or by different ‘anonymous’ editors; had frequent edits being reverted; had its protection status or quality rating changed; or suddenly received more pageviews than normal. Credibility Signals is the turning of this contextual information and into data points in the API which third-party reusers can apply to make their own decisions about how to treat new revisions – in real time. For example: if an article is identified as being related to “breaking news” some reusers may wish to respond to this “signal” by updating their copy as rapidly as possible while others may wish to temporarily pause their updates.
This feature is not filters, rankings, or value judgements of “good vs. bad edits”. Nor is it an AI making decisions about content accuracy, truth or quality. A full list of fields can be drawn from in the creation of any given “signal” is listed at https://www.mediawiki.org/w/api.php In advancing the strategic goal of "Knowledge as a service", we hope that Credibility Signals will both expand the number of third parties which incorporate real-time information from Wikimedia, lower the barrier to entry of doing so, and decrease the instances in which vandalism etc. proliferates and in turn engender trust in Wikimedia content and the movement’s work.
What is Breaking News
Just like "Credibility signals", this is the name for a a feature of the API. It identifies new and likely "newsworthy" events as they are being written about across Wikipedia language editions at any given moment. These events are then marked with a boolean field, allowing API users to easily identify this kind of content within their copy of the dataset. For a full essay documenting the nature and purpose of this, and how you can access it yourself, see its dedicated documentation page.
Consistent with the Wikimedia Enterprise principles (in particular that of "no exclusive content") the information this API feature is built upon is already public information that Wikimedia editors are already commonly using in their content moderation workflows – for example "does this article have a sudden increase in the number of pageviews, or of unique editors?", "was this article recently created/moved and have a 'current event' template?". The feature turns that kind of information into a feed of articles which API users can treat differently, if they wish. For example to re-index these articles more rapidly, or to pause re-indexing entirely until the content becomes more stable. This feature does not imply a change of Wikipedia editorial policy: most particularly regarding notability, reliable sources – summarised in the English Wikipedia policy "NOTNEWS".
What is Structured Contents
Within the Enterprise API suite, Structured Contents refers to the features making Wikimedia data more machine readable: these efforts are both focussed on pre-parsing Wikipedia snippets as well as connecting the different projects closer together. The Structured Contents endpoint (beta) has been released in September 2023 to the On-demand API, as a means to both facilitate more frequent updates as well as improve transparency in the development process. This endpoint includes pre-parsed Wikipedia abstracts, main images, descriptions, infoboxes and sections. To access this structured information in bulk the Structured Contents Snapshot endpoint (beta) in some languages was released to testing partners, and a public version made available on Hugging Face. Features will be continued to be added to this endpoint, see the Mediawiki Updates page.
Rechtliches
Wieso wird die API durch eine Tochtergesellschaft betrieben
Die Wikimedia Foundation hat eine „Gesellschaft mit beschränkter Haftung“ (limited liability company) mit einem Mitglied gegründet, und diese LLC wird Verträge mit den Kunden der Enterprise API unterzeichnen. Die LLC-Struktur trennt die Wikimedia Foundation von Verbindlichkeiten, die durch den Dienst entstehen. Dies ist ein ziemlich üblicher, standardisierter Weg, wenn eine Non-Profit-Organisation eine gewinnorientierte Aktivität betreiben möchte. Das hilft uns sowohl beim Risikomanagement als auch bei Sicherstellung der Transparenz. Dennoch ist die Foundation nach US-Recht verpflichtet, die Einnahmen und Ausgaben dieser LLC in den jährlichen Steuererklärungen offenzulegen (die geprüften Finanzberichte findest du hier). Die LLC untersteht den Strukturen der Wikimedia Foundation, ihre Mitarbeitenden sind weiterhin Mitarbeitende der Wikimedia Foundation und unterliegen letztendlich der Aufsicht des Board of Trustees der Wikimedia Foundation. Die rechtliche Registrierung der LLC kann bei der [$SoD State of Delaware, Division of Corporations] gefunden werden, Entity name: Wikimedia, LLC, File number: 7828447.
You can view the contracts which form the legal relationship between the Wikimedia Foundation and this LLC at the "Wikimedia Enterprise" page on the WMF Governance Wiki. These are:
- "LLC operating agreement" which formally establishes the LLC and the WMF as its sole member
- "Inter-company license agreement" which discusses the right of the LLC to use Wikimedia trademarks etc.
- "Cost-sharing agreement" which discusses how the LLC's revenues and expenses are accounted for with the WMF
The LLC's legal registration can be found at the State of Delaware, Division of Corporations, Entity name: Wikimedia, LLC, File number: 7828447. In the United States, Establishing a legal entity in the State of Delaware is common because the body of corporate law in Delaware is well-developed and easily understood. Using the LLC to operate Wikimedia Enterprise will help insulate the Wikimedia Foundation from exposure. The clarity of Delaware corporate law furthers that objective and also reduces legal costs in both the short and long term. As a non-profit, the LLC being registered in the state of Delaware creates no difference in our United States federal tax liability, or financial transparency in tax reporting requirements, than being registered in any other state.
The assessment of appropriate tax treatment of the LLC activities has been coordinated with the Wikimedia Foundation auditors KPMG.
Wer sind die „Kunden“
Die Enterprise-API wurde zunächst für die Bedürfnisse eines sehr kleinen Kreises von Tech-Unternehmen entworfen, die zu den größten und finanzstärksten Unternehmen der Welt gehören und gemeinhin als „Big Tech“ bezeichnet werden. Das heißt aber nicht, das die API auf diese Unternehmen beschränkt ist; im Gegenteil, jedes Unternehmen kann Kunde dieser API werden. Da es keine Exklusivverträge und keine exklusiven Inhalte geben wird, wird die Entwicklung dieses Produkts auch dazu beitragen, kleineren Unternehmen die Möglichkeit zu geben, von der Nutzung von Wikimedia-Inhalten in ihren Produkten und Dienstleistungen zu profitieren.
By interviewing many organisations across many commercial sectors, it became clear that there are many more potential customers than just "big tech". Their needs are different and so the product roadmap will be adjusted over time to meet this demand – focusing on making it easier to integrate and understand Wikimedia's complex ecosystem of information (through things like credibility signals and subsets of information – see roadmap).
As stated in the original press release, Google and the Internet Archive are the first to receive paid and free access (respectively) but we have not publicized the subsequent customers (paid or free) who have signed up to the service. Maintaining a public and comprehensive list of paying and free/trial customers would look like advertising or promotion of those customers. It would also introduce a new privacy (and potentially security) problem: In the same way that it would be inappropriate to make a public list of "all individuals who have used the Wikidata Query Service this month" (for example), making a public list of all organizations who have used this service goes against our privacy culture. Nonetheless, we do intend to be making "use case" blog posts, which will describe how some users (either general categories or individual cases with their permission) are benefiting from the service in the real world. No one is required to publish whether, or how, they read or reuse Wikimedia content. This is consistent with that practice.
Wir werden eine Liste aktueller, zahlender Kunden veröffentlichen und regelmäßig berichten, wenn die Vertragsvergütungen dem festgelegten Betrag liegt, bei dem finanzielle Zuwendungen an die Wikimedia Foundation eine Benachrichtigung an das Board of Trustees erfordern (und diese Liste in regelmäßigen Abständen aktualisiert wird). Der Wikimedia Foundation, als Organisation mit Sitz in den USA, ist es rechtlich nicht erlaubt, mit Organisationen und Unternehmen mit Sitz in bestimmten (ergo verbotenen) Ländern Geschäfte zu machen, wie vom Office of Foreign Assets Control festgelegt.
Was steht in den Verträgen
Kundenverträge enthalten in der Regel Bedingungen, die die Dauer des Auftrags, die Art des Kundensupports und die erwartete Betriebszeit, die Kosten, Prozesse zur Beilegung von Streitigkeiten, Zusicherungen zu kontextangemessenen Urheberschafts- und Lizenzierungsinformationen sowie Beschränkungen für die Wiederverwendung der API zur Schaffung von Konkurrenzprodukten (bei gleichzeitiger Einhaltung der CC-Lizenzierung der Inhalte) regeln. Wie bereits in den Prinzipien beschrieben, wird der Vertrag keine exklusiven Inhalte, keinen exklusiven Zugang, keine privaten/Nutzerdaten oder redaktionelle Einflussnahme gewähren; er wird keine Einschränkungen enthalten, wie die Inhalte verwendet werden können, die im Widerspruch zu den Lizenzen der Inhalte selbst stehen.