Wikimedia Blog/Drafts/Wikipedia Will Soon Talk To You

Title ideasEdit

  • Wikipedia Will Soon Talk To You (in Swedish: Wikipedia kommer snart att kunna tala med dig)
  • ...

SummaryEdit

A brief, one-paragraph summary of the post's content, about 20-80 words. On the blog, this will be shown in the chronological list of posts or in the featured post carousel on top, next to a "Read more" link.

The development of Wikispeech, a new MediaWiki extension, has started. In 2017, Wikipedia should be able to talk to you. The project will bring together existing language resources and develop a functioning text-to-speech solution for Swedish, English and Arabic. The Swedish Post and Telecom Agency is financing the work done by Wikimedia Sverige, the Royal Institute of Technology (KTH), and Södermalms Talteknologiservice AB.

  • ...

Body in EnglishEdit

 
The new official logotype for Wikispeech. Image by ElioQoshi, CC0.

Wikispeech, a so called speech synthesis, aims to make all the information available on Wikipedia accessible for anyone that faces reading difficulties, whether that is due to vision impairment, dyslexia, they never had an opportunity to learn literacy, or any other number of reasons.

Everyone should be able to take advantage of the information on Wikipedia. Only offering written text is really limiting for millions of people and this project we hope will be part of the solution to realize the grand vision of providing free knowledge for all people of the world.

The development of a text-to-speech MediaWiki extension was carefully investigated and planed during a pilot study in Autumn 2015. Development requirements and existing solutions that could be integrated were identified at this stage.

Just like everything else that the Wikimedia movement creates, the entire software will be freely licensed alongside the speech data and documentation. As such, people will be able to use Wikispeech on other wikis run by other organizations. Moreover, different parts of the synthesizer can also easily be reused by other text-to-speech projects, so that even more people with limited reading abilities will have an easier life.

The hope is that Wikispeech will be used in many different services, and that the communities improving the software and lexicon will be very diverse.

Many of those most in need of information do not have easy access to a personal computer, have limited knowledge of how computers and smartphones work, and/or lack access to the high quality commercial tools that are available. To reach these people the aim is a MediaWiki extension. Even though an extension is much more difficult to develop than an independent external tool we hope that it will be easier to find for Wikipedia's users and there will be no need to download any software as it is an Internet-based solution. Another benefit is that a MediaWiki extensions should be simpler to include in other extensions developed by other teams, such as reading aloud of subtitles in videos shown on Wikipedia, in Kiwix (the offline Wikipedia) etc.

At the end of the project, our goal is to have Wikispeech available in Swedish and English, along with having a working prototype in Arabic (to show that it works in a right-to-left language). Long-term, we hope that Wikispeech will be available in all languages.

It will be possible through crowdsourcing to improve Wikispeech. You may, for example, help develop the pronunciation dictionary used by the program to make it sound more correct (the pronunciation of each word is described by the International Phonetic Alphabet). In this way, the speech synthesizer is constantly improved and annoying errors can be corrected by the user. The project team is not aware of any similar solutions and believe that this might actually be a world's first. Wikispeech will also use a very flexible structure, where different parts of the synthesizer (dictionaries, voice, etc.) easily can be connected. The goal is that a newly developed solution that has been missing simply can be plugged into the framework.

We want the value of Wikipedia to increase among the people who have the least resources and are most vulnerable. A speech synthesis has a very great value in many of the world's poorer countries where the education level is low. For commercial entities, these are not markets that are a priority, and here Wikispeech can help to fill the gaps.

The Swedish Post and Telecom Agency is financing the work that Wikimedia Sverige (project owner) and the project partners Södermalms Talteknologiservice AB (STTS) and the Royal Institute of Technology (KTH) are doing in the project. In total the project has a budget of around 300,000 USD. Furthermore, a number of other organizations and research teams have offered to support the project in different ways (not the least after being reported about in more than sixty news articles world wide).

To make things as transparent as possible and to make it easier for volunteers to help out, to show their support or for them to raise a note of caution all the planned development have been added to Phabricator. We invite you to get involved and please endorse the project!

...

John Andersson, Wikimedia Sverige

Body in SwedishEdit

 
Den nya officiella logotypen för Wikispeech. Bild av ElioQoshi, CC0.

Utvecklingen av Wikispeech har dragit igång och under 2017 är planen att Wikipedia ska kunna tala med dig.

Wikispeech, en s.k. talsyntes, syftar främst till att göra all den information som finns på Wikipedia tillgänglig för alla de som av någon anledning har svårt att läsa. Exempelvis på grund av att personen har en synnedsättning, har dyslexi eller aldrig fått gå i skolan och lära sig att läsa.

Alla ska kunna ta del av informationen på Wikipedia. Att endast erbjuda skriven text begränsar användningen för alltför många människor. Åtskilliga miljoner människor. Det här projektet är tänkt att vara en del av lösningen att förverkliga visionen om att nå ut med fri kunskap till alla världens människor.

Utvecklingen av ett talsyntes-tillägg för MediaWiki har noggrant utretts under en förstudie hösten 2015. Då identifierades vilka existerande delar som fanns och kunde integreras såväl som det som ännu saknades och behöver utvecklas.

Precis som allt annat som Wikimedia-rörelsen skapar kommer all mjukvara att vara fritt licensierad och likaså all taldata och dokumentation. Wikispeech kommer därmed även att kunna användas på andra wikis som drivs andra organisationer. Delar av talsyntesen kan även enkelt komma att användas av andra talsyntes-projekt så att ännu fler personer som inte kan läsa får ett enklare liv.

Vi hoppas att Wikispeech ska användas i många olika tjänster och att den gemenskap som utvecklar mjukvara och lexikonet kommer att ha en stor bredd.

Många av de som har störst behov av information har inte tillgång till en egen dator (utan använder ex. internetcaféer) och/eller har begränsad kunskap hur datorer och smartphones fungerar. Inte heller har de tillgång till de välfungerande kommersiella verktyg som finns, på grund av kostnaderna. Även om ett MediaWiki-tillägg är mycket svårare att utveckla än ett fristående externt verktyg är det lättare att hitta igen för Wikipedias användare och ingen nedladdning krävs då det är en internetbaserad lösning. Ett MediaWiki-tillägg kan dock även enklare komma att inkluderas i tillägg utvecklade av andra grupper, exempelvis för uppläsning av undertexter i videos som används på Wikipedia, iKiwix (offlineversionen av Wikipedia) m.m.

I slutet av projektet är målet att Wikispeech skall fungera på svenska och engelska, samt ha en fungerande prototyp på arabiska (för att visa att det fungerar på ett höger-till-vänster-språk). Kommersiella talsynteser fungerar endast på en fåtal av Wikipedias 294 språkversioner. Målet med Wikispeech är att det med tiden skall finnas på alla språk. Som allt annat Wikimedia-relaterat kommer det att vara möjligt att genom crowdsourcing förbättra Wikispeech. Den intresserade kan exempelvis utveckla det lexikon som programmet använder för att uttala orden så att det låter rätt (uttalet för varje ord beskrivs genom Internationella fonetiska alfabetet). På så sätt blir talsyntesen hela tiden bättre och irriterande fel kan åtgärdas av användaren. Projektgruppen känner inte till någon liknande lösning och tror att detta är första gången det görs. Wikispeech kommer även att ha en väldigt flexibel struktur där olika delar av talsyntesen (lexikon, röst m.m.) enkelt kan kopplas samman. När exempelvis en forskargrupp utvecklat en del som saknats för ett språk så kan det enkelt kopplas in.

Förhoppningen är att Wikipedia skall få ett ökat värde bland de personer som har minst resurser och är mest utsatta. En talsyntes har ett väldigt stort värde i många av världens fattiga länder där utbildningsgraden är låg. För kommersiella aktörer är det dock inte prioriterade marknader och här kan Wikispeech hjälpa till att täppa igen luckorna.

Post- och telestyrelsen finansierar det arbete som Wikimedia Sverige (projektägare) och projektparterna Södermalms Talteknologiservice AB (STTS) och Kungliga Tekniska Högskolan (KTH) gör i projektet. Totalt har projektet en budget på ca. 300 000 USD. Därtill har flera olika organisationer och forskargrupper (inte minst efter att projektet blivit omskrivet i över sextio stycken tidningsartiklar) erbjudit sig att på olika sätt hjälpa till med att förbättra mjukvaran.

För att göra det hela så transparent som möjligt och underlätta för volontärer att hjälpa till, komma med glada tillrop eller höja ett varningens finger så finns all planerad utveckling inlagd på Phabricator. Vi hoppas att du vill engagera dig, och stöd gärna projektet!

...

John Andersson, Wikimedia Sverige

NotesEdit