Wikimedia Enterprise

This page is a translated version of the page Wikimedia Enterprise and the translation is 36% complete.
Outdated translations are marked like this.

Dalam rekomendasi Strategi Gerakan untuk meningkatkan keberlanjutan gerakan kita dan meningkatkan pengalaman pengguna ada sejumlah rekomendasi untuk: "Menelusuri kesempatan-kesempatan baru untuk menghasilkan pendapatan dan penyebaran pengetahuan bebas melalui kerjasama dan pendapatan—sebagai contoh...Membangun API tingkat korporasi," dan "Membuat API Wikimedia lebih komprehensif, handal, aman, dan cepat, bekerjasama dengan pengguna skala besar.... dan meningkatkan kesadaran dari dan kemudahan atribusi dan keabsahan untuk pengguna ulang konten."

Wikimedia Enterprise
Wikimedia Enterprise logo.svg
Building new opportunities for both revenue generation and free knowledge dissemination through partnerships and earned income.
enterprise.wikimedia.com
ProjectMain pagePrinciples
FAQ & Essay (March 2021)
TechnicalMediaWikiUpdatesPhabricatorGit
API Documentation

Wikimedia Enterprise adalah sebuah proyek lintas departemen dari Yayasan Wikimedia. Tujuan dari proyek ini adalah untuk membangun layanan untuk pengguna ulang pencari laba yang menggunakan konten Wikimedia. Proyek ini sebelumnya dikenal sebagai "Okapi".

Fokusnya adalah organisasi-organisasi yang ingin menggunakan ulang konten Wikimedia dalam konteks lain, menyediakan layanan data dalam skala besar, sehingga mereka menjadi lebih cepat dan lebih komprehensif, handal, dan aman. Wikimedia Enterprise bertujuan untuk meningkatkan pengalaman pengguna untuk pengguna Wikimedia melebihi dari situs web kami; Meningkatkan jangkauan dan penelesuran konten; dan meningkatkan kesadaran dan kemudahan atribusi dan keabsahan oleh organisasi-organisasi yang menggunakan ulang konten Wikimedia melalui layanan swadaya.


Ada sebuah halangan sangat tinggi untuk menggunakan data Wikimedia, diluar dari penggunaan umum seperti membaca atau menyunting. Ini dikarenakan kontennya sukar bagi mesin untuk dipecah dan dipahami, yang mempengaruhi bagaimana jauhnya jangkauan data Wikimedia diluar dari ekosistem kami, dan skala dampak yang muncul.

Sudah diketahui bahwa ada sejumlah perusahaan besar menggunakan data dari proyek-proyek kita. Perusahaan-perusahaan tersebut sadar bahwa jika tidak ada proyek Wikimedia, mereka tidak dapat menyediakan pengalaman yang kaya atau handal ke pengguna mereka. Ada perasaan yang hinggap dalam komunitas bahwa perusahaan-perusahaan tersebut seharusnya berinvestasi ulang dalam komunitas Wikimedia sebagai imbal balik dari manfaat yang mereka dapatkan dari konten dan sumber daya yang digunakan.

Ini melahirkan sebuah ide untuk mengembangkan sebuah langkah baru yang lebih berkelanjutan dan menyediakan hubungan yang lebih jelas antara Wikimedia dan pengguna korporasi. Manfaat finansial untik Wikimedia kemungkinan besar hanya datang dari sebagian kecil pengguna pencari laba berskala besar, dan akan umpan balik ke gerakan Wikimedia.

Pada saat ide ini dikembangkan, menjadi jelas bahwa ada sebuah tanggung jawab untuk mendemokratisasi data kita untik organisasi-organisasi yang tidak mengambil sumber daya dari pengguna besar tersebut, untuk memastikan bahwa kami dapat berdiri kokoh dan membantu mengembangkan internet yang sehat tanpa meningkatkan monopoli. Manfaat dari layanan macam itu tidak hanya untuk perusahaan rintisan atau alternatif untuk raksasa internet, namun juga untuk universitas dan peneliti-peneliti universitas; arsip-arsip dan pengarsipnya; juga gerakan Wikimedia secara luas.

Screenshot Wikimedia Enterprise homepage.png

Ikhtisar

Fokus Wikimedia Enterprise ada pada bisnis-bisnis yang menggunakan ulang konten kami, pada skala besar-seperti, integrasi dengan grafik pengetahuan, pencari, asisten suara, peta, pelaporan berita, perkakas komunitas, aplikasi pihak ketiga, dan studi penelitian skala penuh. Menyebarkan set data Wikimedia untuk pada konten tidak terstruktur akan memungkinkan semua pengguna ulang konten untuk memenuhi persyaratan individual mereka dengan juga memudahkan kita untuk membangun perkakas baru dan layanan baru di masa depan, tersedia untuk semua. Pengguna ulang dari konten kami menginginkan tiga komponen kritis:

- Frekuensi:Kumpulan konten proyek-proyek Wikimedia secara teraktur - Kehandalan: Dapat dihandalkan, infrastruktur yang mudah diakses - Kualitas: sebuah "revisi terakhir terbaik"

Mengedepankan kasus penggunaan yang spesifik memungkinkan tim API Wikimedia untuk berfokus pada relawan, tim, dan organisasi yang menginginkan akses (dan, yang terpenting, berinteraksi dengan) set data kita. Ini termasuk dari sebagian besar perkakas penyuntingan komunitas yang dimana di luar lingkup dari proyek ini. Untuk informasi lebih lanjut mengenai peningkatan dari API Wikimedia yang sudah ada lihat halaman proyek inisiatif "API Gateway".

Tujuan Program:

  • Konten: Buat lebih banyak konten gerakan kita tersedia dalam format yang dapat dibaca mesin, tersedia secara bebas untuk semua peneliti dan pengguna ulang.
  • Beban sumber daya: Kurangi kebutuhan bagi pengguna yang melakukan pengambilan situs berintensitas tinggi menurut frekuensi tertinggi dan volume tertinggi, yang menargetkan peladen-peladen produksi kita.
  • Penggalangan dana:Beri sebuah langkah yang lebih jelas dan konsisten bagi pengguna ulang terbesar untuk berinvestasi ulang dari manfaat yang didapat kembali ke gerakan, daripada membuat sumbangan pada waktu tertentu yang memiliki ukuran bervariasi.

Komunitas

Hubungi tim jika anda ingin melakukan pembicaraan mengenai proyek ini dengan komunitas anda.

Past public meetings:

...and also at the EMWCon Spring 2021 conference (video); March Strategic Wikimedia Affiliates Network (SWAN) meeting; the May 2021 Wikimedia Clinic; and at Wikimania 2021.

Ada sejumlah paragraf pengantar dari sebuah esai Komunitas yang lebih detil.

Esai lengkap mencakup topik-topik sebagai berikut

Libre and Gratis are the two meanings of “free,” commonly phrased as free as in speech, or free as in beer.

Wikimedia projects are, have always been, and will always remain libre. The principles of free cultural works mean that anyone can use Wikimedia without restriction, including commercially. As a movement, we embrace this. It is why we reject ‘non-commercial’ licenses, as they would limit the kinds of reuse possible. And it is why we consider commercial reuse an important means of distributing knowledge to audiences.

Equally, Wikimedia projects are, have always been, and will always remain gratis. The ability to freely access the knowledge available across all Wikimedia projects has always been core to the mission of the Foundation and the movement. We provide this access not only to individuals visiting our websites but also programmatically to machines so that our content can be repurposed in other environments. The full corpus of Wikimedia content always has been, and will continue to be, made available for reuse in various forms (including but not limited to database dumps, APIs, and scraping) at no cost.

As a result, our content is often repurposed by for-profit organizations that rely on it to support their business models, and which consequently earn revenue from it. Outside of voluntary corporate donations to the Wikimedia Foundation, the movement has never received benefits from any of this revenue through return investment. In acknowledgement of this, under the heading of Increase the sustainability of our movement the Movement Strategy process asked the Wikimedia Foundation to explore, among other things, “enterprise-level APIs...models for enterprise-scale for-profit reusers, taking care to avoid revenue dependencies or other undue external influence in product design and development.” Furthermore, under the heading Improve User Experience, a further recommendation stated, "Make the Wikimedia API suite more comprehensive, reliable, secure, and fast, in partnership with large scale users where that aligns with our mission and principles, to improve the user experience of both our direct and indirect users, increase the reach and discoverability of our content and the potential for data returns, and improve awareness of and ease of attribution and verifiability for content reusers."

The Enterprise project team is developing a new resource aimed at for-profit content reusers, who have product, service, and system requirements that go beyond what we freely provide. Use of this offering will not be required for for-profit content reuse; companies can continue to use the current tools available at no cost. All Enterprise API revenue will unequivocally be used to support the Wikimedia mission—for example, to fund Wikimedia programs or help grow the Wikimedia Endowment.

This project represents a new kind of activity at the Foundation. The project is at a very early stage that should be considered a learning period. We will have successes, we will make mistakes, and we will need to adapt our strategies. The team is committed to listening, engaging, and where possible, integrating the feedback we get on our work. This document is organic and is reflective of the team's current thinking; we are attempting to document as much work as possible in the open. Up until now, our work has been shaped by a series of initial interviews with community members, Wikimedia Foundation Board and staff, researchers, and reusers.

...lanjutkan membaca sisa dari esai Komunitas. Lihat pula FAQ dan Prinsip-prinsip.

Dikarenakan dari sifat proyek ini, keputusan utama diserahkan sepenuhnya pada Yayasan Wikimedia. Kami mencari masukan komunitas, khususnya pada komunitas teknis dan mereka yang terlibat pada proses strategi, sepanjang durasi hidup proyek. Umpan balik teknis telah didapat dari kolega di Yayasan Wikimedia, rekan industri dan penelitian, rekan teknis dalam gerakan, dan dengan komunitas teknis yang lebih luas melalui Phabricator. Masukan mengenai sisi pembiayaan pengembangan akan mengikuti alur yang sama. Kami akan terus mencari masukan melalui wawancara penelitian dan grup fokus, dan juga umpan balik di Meta per prinsip kami.

Teknis

For full information about the product work, seethe documentation homepage on MediaWiki.org and the API documentation subpage.
Over time, the "product" being offered will grow and improve. We are still defining the exact nomenclature for API endpoints and documentation, but these are the main products that our team is currently building. This information is accurate as of Version 1.0.

Structured Content API

High-volume reusers that use an infrastructure reliant on the EventStream platform depend on services like RESTBase to pull HTML from page titles and current revisions to update their products. High-volume reusers have requested a reliable means to gather this data, as well as structures other than HTML when incorporating our content into their KGs and products.

Wikimedia Enterprise Structured Content API, at release, will contain:

  • A commercial schema
  • SLA

Firehose API

High-volume reusers currently rely heavily on the changes that are pushed from our community to update their products in real time, using EventStream APIs to access such changes. High-volume reusers are interested in a service that will allow them to filter the changes they receive to limit their processing, guarantee stable HTTP connections to ensure no data loss, and supply a more useful schema to limit the number of api calls they need to make per event.

Enterprise Firehose API, at release, will contain:

  • Filtering of events by Project or Revision Namespace
  • Guaranteed connections
  • Commercially useful schema similar* to those that we are building in our Structured Content API and Bulk API
  • SLA

*We are still in the process of mapping out the technical specifications to determine the limitations of schema in event platforms and will post here when we have finalized our design.

Bulk API

For high volume reusers that currently rely on the Wikimedia Dumps to access our information, we have created a solution to ingest Wikimedia content in near real time without excessive API calls (Structured Content API) or maintaining hooks into our infrastructure (Firehose).

Enterprise Bulk API, at release, will contain:

  • 24-hour JSON*, Wikitext, or HTML compressed dumps of "text-based" Wikimedia projects
  • A hourly update file with revision changes of "text-based" Wikimedia projects
  • SLA

*JSON dumps will contain the same schema per page as the Structured Content API.

Akses

To obtain access to the Enterprise API datasets, there are three methods: *Paid **Realtime API (Batch and Streaming) Through the dedicated Enterprise API product website at https://enterprise.wikimedia.com/ *Free **Snapshot API An update of the Enterprise API data is provided for all every two weeks at https://dumps.wikimedia.org/other/enterprise_html/ **Snapshot API + Realtime (Batch) Via Wikitech:Portal:Data Services, available to anyone with a Wikimedia cloud services account.

Tim

Additional contract work provided by: Speed & Function are providing engineering support; Boldr provide customer support services; Vuurr are assisting our sales process; and Super Natural Design are the designers of the project website.

The board of the LLC overseeing the project are from Wikimedia Foundation leadership, representing their Wikimedia Foundation staff roles. This includes the Chief Advancement Officer Lisa Seitz-Gruwell; General Counsel Amanda Keton; Chief Technical Officer [position currently vacant], and Lane Becker who serves as the LLC's president. Ultimately, the LLC is subject to the governance of the Wikimedia Foundation Board of Trustees as described at the Wikimedia Foundation Board Statement on Wikimedia Enterprise revenue principles.

Documents covering the legal relationship of the LLC to the Wikimedia Foundation are published on the Governance Wiki under "Category:Wikimedia Enterprise". Specifically, these are the operating, cost-sharing, and inter-company licensing agreements.The LLC's legal registration can be found at the State of Delaware, Division of Corporations, Entity name: Wikimedia, LLC, File number: 7828447.

See also: FAQ § Legal

Lihat pula

  • API:Main page – the central listing of all Wikimedia APIs.
  • Wikitech: Data Services portal – A list of community-facing services that allow for direct access to databases and dumps, as well as web interfaces for querying and programmatic access to data stores.
  • Enterprise hub – a page for those interested in using the MediaWiki software in corporate contexts.