Wikimedia Enterprise/th

This page is a translated version of the page Wikimedia Enterprise and the translation is 3% complete.
Outdated translations are marked like this.

Next public meeting: Friday October 22 @ 1500 UTC on Zoom.

Wikimedia Enterprise
enterprise.wikimedia.com
ProjectMain pagePrinciples
Essay & FAQ (March 2021)
TechnicalMediaWikiPhabricator
GitAPI Documentation

Wikimedia Enterprise is a new cross-departmental project of the Wikimedia Foundation. The goal of the project is to build services for large-scale for-profit reusers of Wikimedia content. The project was previously known as "Okapi".

The focus is on organizations that want to repurpose Wikimedia content in other contexts, providing data services at a large scale, so that they are faster and more comprehensive, reliable, and secure. Wikimedia Enterprise aims to improve the user experience of Wikimedia's readers beyond our own websites; increase the reach and discoverability of the content; and improve awareness and ease of attribution and verifiability by the organizations that reuse Wikimedia content the most—through self-funding services.

Contact the team if you would like to arrange a conversation about this project with your community, at a time and meeting software platform of your choice.

slides
Presentation at the EMWCon Spring 2021 conference

Past public meetings:

...and also at the March Strategic Wikimedia Affiliates Network (SWAN) meeting; the May 2021 Wikimedia Clinic; and at Wikimania 2021. In March 2021 the project was also featured in WIRED.


There is a very high barrier to entry for using Wikimedia data, outside of the common use cases of reading or editing. This is because the content is hard for machines to segment and understand, which in turn affects how far Wikimedia data reaches beyond our own ecosystem, and the scale of impact it can have.

In the Movement Strategy recommendations to increase the sustainability of our movement and improve user experience there are the recommendations to, respectively: "Explore new opportunities for both revenue generation and free knowledge dissemination through partnerships and earned income—for example...Building enterprise-level APIs," and "Make the Wikimedia API suite more comprehensive, reliable, secure and fast, in partnership with large scale users.... and improve awareness of and ease of attribution and verifiability for content reusers."

It is well known that a few massive companies use our projects' data. Those companies recognize that without the Wikimedia projects, they would not be able to provide as rich or reliable an experience to their own users. There has long been a feeling among community members that these companies should do more to reinvest in the Wikimedia communities for the benefits they gain from the content and resources they use.

This led to the idea of developing a new approach that is more sustainable in the long term and provides a much clearer relationship between Wikimedia and enterprise users. Most financial benefit for Wikimedia would likely only come from a very small handful of heavy for-profit users, and would feed back into the Wikimedia movement.

As this idea developed, it became clear there is a responsibility to democratize our data for organizations that do not possess the resources of these largest users, to ensure we are leveling the playing field and helping to foster a healthy internet without reinforcing monopolies. The benefits of such a service shouldn't just be for startups or alternatives to the internet giants, but also for universities and university researchers; archives and archivists; along with the wider Wikimedia movement.

Wikimedia Enterprise timeline (2020-21).png

ภาพรวม

Wikipedia Enterprise มุ่งความสนใจไปที่ธุรกิจซึ่งนำเนื้อหาของเราไปใช้ซ้ำในขนาดใหญ่ ไม่ว่าจะเป็นการนำไปผสมผสานกับ "Knowledge graph", การค้นหา, ผู้ช่วยคำสั่งเสียง, แผนที่, ข่าว, Community tools, แอปพลิเคชันบุคคลที่สาม และงานวิจัย การเสริมฐานข้อมูลของวิกิมีเดียด้วยการจัดโครงสร้างเนื้อหาที่ไร้โครงสร้างจะทำให้ผู้ที่นำเนื้อหาไปใช้ซ้ำสามารถตอบสนองต่อความต้องการของตนได้ และในขณะเดียวกันก็จัดเตรียมเราต่อการสร้างสรรค์อุปกรณ์และบริการใหม่ ๆ ในอนาคตที่ทุกคนสามารถเข้าถึงได้ ผู้ที่นำเนื้อหาของเราไปใช้ซ้ำกำลังมองหาส่วนประกอบสำคัญสามอย่าง

  • ความถี่: การเก็บภาพสถานะปัจจุบันของโครงการวิกิมีเดียเป็นประจำ
  • ความเชื่อถือได้: โครงสร้างพื้นฐานที่พึ่งพาและเข้าถึงได้
  • คุณภาพ: “การปรับปรุงใหม่ครั้งสุดท้ายที่ดีที่สุด”

Emphasizing a self-funding set of specific use cases allows the Wikimedia API team to focus on volunteers, teams, and organizations looking to access (and, most importantly, interact with) our data sets. This includes the majority of community editing tools, which will be out of scope for this project. For more information on improvements to the existing Wikimedia APIs see the project page on the "API Gateway" initiative.

Program Goals:

  • Content: Make more of our movement's content available in consistent machine-readable formats, freely available for all researchers and re-users.
  • Resource-load: Reduce the need for high-intensity site-scraping by the highest-frequency and highest-volume reusers, which currently target our production servers.
  • Fundraising: Provide a clearer and more consistent way for the largest re-users to reinvest derived benefits back to the movement, instead of making occasional altruistic donations that vary in size.

Community

These are the introduction paragraphs for a much more detailed Community essay.

The full essay covers the following topics

เสรีภาพและโดยไม่เสียค่าใช้จ่ายคือสองนัยของคำว่า “เสรี” ซึ่งพบได้ทั่วไปอย่างเสรีภาพในการพูด แต่ยังหมายถึงฟรีแบบไม่ต้องเสียเงินอีกด้วย

โครงการวิกิมีเดียจะเป็นโครงการในนัยอันหมายถึงเสรีภาพ อย่างที่เป็นตลอดมา และจะเป็นอย่างนั้นตลอดไป ซึ่งเป็นหลักสำคัญแห่งวัฒนธรรมการทำงานเสรี แปลได้ว่าไม่ว่าผู้ใดก็สามารถใช้วิกิมีเดียได้อย่างไร้ข้อจำกัด รวมถึงการใช้งานในเชิงพานิชย์ ในฐานะของการเป็นขบวนการ เราต้องยอมรับในจุดนี้ นั่นคือเหตุผลว่าเพราะเหตุใดเราจึงไม่สามารถรับงานซึ่งมีสัญญาอนุญาตแบบ "ไม่ใช้เพื่อการค้า" มาใช้งานในโครงการได้ เนื่องจากสัญญาอนุญาตเช่นนี้จะจำกัดการนำเนื้อหาไปใช้ใหม่ และด้วยเหตุนี้เราจึงถือได้ว่าการใช้ซ้ำในเชิงพาณิชย์เป็นอีกวิธีการหนึ่งที่สำคัญในการกระจายความรู้ไปยังผู้เยี่ยมชม

ความเท่าเทียมจากการเข้าถึงได้ไม่ว่าจะโดยผู้ใด เป็นอีกหนึ่งนัยของคำว่าเสรี โครงการวิกิมีเดียจะดำรงความ "ไม่เสียค่าใช้จ่าย" ความสามารถในการเข้าถึงองค์ความรู้จากทั่วทั้งโครงการวิกิมีเดียนั้นนับว่าเป็นแก่นหลักแห่งพันธกิจของมูลนิธิและขบวนการ เราให้การเข้าถึงไม่เพียงเฉพาะผู้เข้าชมที่เป็นบุคคล แต่ยังต้อนรับเครื่องจักรโปรแกรมอื่นเพื่อนำเนื้อหาไปใช้ตามวัตถุประสงค์ที่ต้องการในสภาพแวดล้อมอื่นด้วย คลังข้อมูลเนื้อหาทั้งหมดของวิกิมีเดียจะยังคงพร้อมสำหรับการนำไปใช้งานต่อในหลายรูปแบบ (ซึ่งรวมถึงแต่ไม่จำกัดเพียงดัมป์ฐานข้อมูล เอพีไอ หรือการแยก) โดยไม่เสียค่าใช้จ่ายอย่างที่เป็นมา และจะเป็นเช่นนั้นตลอดไป

ดังผลลัพธ์ เนื้อหาของเรามักถูกนำไปใช้ซ้ำโดยองค์กรที่แสวงหาผลกำไรซึ่งใช้งานเพื่อรองรับแบบแผนการดำเนินธุรกิจ และกอบโกยรายได้จากการทำเช่นนี้ อันนอกเหนือจากการบริจาคขององค์กรโดยสมัครใจให้กับมูลนิธิวิกิมีเดีย ขบวนการไม่เคยได้รับผลประโยชน์จากรายได้ขององค์กรจากการให้บริการโดยขบวนการคืนแต่อย่างใด ในการรับทราบถึงปัญหานี้ ภายใต้หัวเรื่องแห่ง "ยกระดับความยั่งยืนของขบวนการ" หนึ่งในกระบวนการของยุทธศาสตร์ขบวนการซึ่งมีความว่าให้มูลนิธิวิกิมีเดียค้นหาหนทาง เช่น "เอพีไอในระดับเอ็นเตอร์ไพรส์สำหรับการใช้งานเชิงพาณิชย์ของผู้ใช้ซ้ำโดยองค์กรที่แสวงหาผลกำไร กำกับดูแลเพื่อหลีกเลี่ยงการพึ่งพารายได้หรืออิทธิพลภายนอกอื่น ๆ ที่ไม่เหมาะสมในการออกแบบและพัฒนาผลิตภัณฑ์" นอกจากนี้ ภายใต้หัวข้อ "ปรับปรุงประสบการณ์ของผู้ใช้" ได้ที่คำแนะนำเพิ่มที่ระบุไว้ว่า "ทำให้เอพีไอวิกิมีเดียมีความครอบคลุม รวดเร็ว และปลอดภัยมากขึ้น ในการสร้างพันธมิตรกับผู้ใช้ระดับใหญ่ซึ่งยังคงอยู่ในพันธกิจและแนวคิดหลักของเรา เพื่อปรับปรุงประสบการณ์ของทั้งผู้ใช้โดยตรงและโดยอ้อม เพิ่มขีดจำกัดของการค้นพบเนื้อหาของเราและศักยภาพในการเพิ่มเติมความรู้จากตนเองของผู้ใช้กลับเข้ามา และปรับปรุงความตระหนักรู้ในและความง่ายของการอ้างอิงแหล่งที่มาและการพิสูจน์ยืนยันได้นำหรับผู้นำเนื้อหาไปใช้ซ้ำ"

The Enterprise project team is developing a new resource aimed at for-profit content reusers, who have product, service, and system requirements that go beyond what we freely provide. Use of this offering will not be required for for-profit content reuse; companies can continue to use the current tools available at no cost. All Enterprise API revenue will unequivocally be used to support the Wikimedia mission—for example, to fund Wikimedia programs or help grow the Wikimedia Endowment.

This project represents a new kind of activity at the Foundation. The project is at a very early stage that should be considered a learning period. We will have successes, we will make mistakes, and we will need to adapt our strategies. The team is committed to listening, engaging, and where possible, integrating the feedback we get on our work. This document is organic and is reflective of the team's current thinking; we are attempting to document as much work as possible in the open. Up until now, our work has been shaped by a series of initial interviews with community members, Wikimedia Foundation Board and staff, researchers, and reusers.

...continue to read the rest of the Community essay. See also the FAQ and Principles.

Given the nature of the project, primary decision making for it will rest with the Wikimedia Foundation. We are seeking community input, in particular from the technical community and those who have been involved in the strategy process, throughout the lifetime of the project. Technical feedback has been gathered from colleagues at the Wikimedia Foundation, industry and research partners, technical partners across the movement, and with the broader technical communities via Phabricator. Input into the funding development side of the project will follow a similar pattern. We will continue gathering input via research interviews and focus groups, as well feedback here on Meta as per our principles.

Technical

For full information about the product work, see
the documentation homepage on MediaWiki.org
.

Over time, the "product" being offered will grow and improve.

The Q4 2021 release (May/June 2021) of the Enterprise APIs proposes the following:

Type Name Compare To What is it? What’s New?
Realtime Enterprise Activity "Firehose" API EventStream HTTP API A stable, push HTTP stream of real time activity across “text-based” WMF Projects
  • Push changes to client with stable connection
  • Filter by Project and Page-Type
  • Be Notified of suspected vandalism in real time
  • Machine Readable and Consistent JSON schema
  • Guaranteed uptime, no rate-limiting
Enterprise Structured Content API Restbase APIs Recent, machine readable content from all “text-based” WMF Projects
  • Machine Readable and Consistent JSON schema
  • Guaranteed uptime, no rate-limiting
Bulk Enterprise Bulk Content API Wikimedia Dumps Recent, compressed WMF data exports for bulk content ingestion
  • Machine Readable and Consistent JSON schema
  • Daily “Entire Corpus” exports
  • Hourly “Activity” exports
  • Guaranteed delivery
  • Historical Downloads

Access

To obtain access to the Enterprise API datasets, there are three methods: *Paid **Bulk and Real-time. Through the dedicated Enterprise API product website, when it is launched. *Free **Bulk. A fortnightly update of the Enterprise API data will be provided for all at https://dumps.wikimedia.org/ **Daily+Hourly diffs. Via Wikitech:Portal:Data Services, available to anyone with a Wikimedia cloud services account.

 
A screenshot from the alpha dashboard (when the project was nicknamed "Okapi") where users can download and save daily exports of HTML from "text-based" Wikimedia projects

Team

Additionally, Speed & Function are providing contracted engineers. At this early stage in the project, we are not yet sure of the long-term engineering needs and we wish to thoroughly assess the project's ability to become self-sustaining. This way we don't excessively disrupt other WMF projects or divert resources.

The board of the LLC overseeing the project are from Wikimedia Foundation leadership, representing their WMF staff roles: Lisa Seitz-Gruwell Chief Advancement Officer; Tony Sebro, Deputy General Counsel; and Lane Becker. Ultimately, the LLC is subject to the governance of the Wikimedia Foundation Board of Trustees.

The LLC's legal registration can be found at the State of Delaware, Division of Corporations, Entity name: Wikimedia, LLC, File number: 7828447.

See also: FAQ § Legal

See also

  • API:Main page – the central listing of all Wikimedia APIs.
  • Wikitech: Data Services portal – A list of community-facing services that allow for direct access to databases and dumps, as well as web interfaces for querying and programmatic access to data stores.
  • Enterprise hub – a page for those interested in using the MediaWiki software in corporate contexts.