WissensWert 2011/02-Open Science durch mehr öffentlich verfügbare Genotypisierungen

02 - Open (Citizen) Science durch mehr öffentlich verfügbare Genotypisierungen


Das Projekt edit

Titel der Idee in 140 Zeichen edit

Open (Citizen) Science durch mehr öffentlich verfügbare Genotypisierungen

Drei Tags (Schlagworte), die die Schwerpunkte der Idee beschreiben edit

Genetik, Open Science, Open Data

Kurzbeschreibung der Idee und deren Beitrag zur Förderung Freien Wissens edit

"Direct To Consumer"-Genotypisierungen erzeugen günstige aber wertvolle Einblicke in Genome. Solche Typisierungen kann man von Firmen wie 23andMe erstellen lassen, die Ergebnisse sind in der Regel für die Öffentlichkeit aber nicht zugänglich. Wir haben kürzlich das Projekt openSNP gestartet. Ziel es ist so viele Typisierungen und medizinisch relevante Daten wie möglich der Öffentlichkeit zur Verfügung zu stellen.

Mit solchen freien Daten hilft man Wissenschaftlern weltweit und ermöglicht es einfach Citizen Science zu betreiben. Mit dem Funding durch Wikimedia können wir Menschen beteiligen, die sonst mangels finanzieller Mittel keine Typisierungen anfertigen lassen können.

Beteiligte Organisationen oder Personen edit

Als offene Gruppe aus aktuell vier Personen (Philipp Bayer, Fabian Zimmer, Helge Rausch, Bastian Greshake)

Ziele und Zielgruppe des Projektes edit

Welches Ziel soll mit der Idee erreicht werden? edit

Dass (Citizen) Scientists mehr frei verfügbare Genotypisierungsdatensätze für ihre Arbeit zur Verfügung haben.

Momentan lagern fast alle Datensätze ausschliesslich auf den Servern der Firmen, die sie erstellt haben. Nur wenige Leute wissen überhaupt, dass sie die Rohdaten selbst herunterladen könnten. Wissenschaftler, die gerne mit diesen Daten arbeiten wollen, haben leider keine Chance sie zu erreichen und zu nutzen. Viele Menschen die diese Möglichkeiten kennen und nutzen sind auch bereit ihre Daten mit anderen zu teilen um der Wissenschaft zu helfen.

OpenSNP enthält nach nur 20 Tagen seit dem Start des Projekts bereits 35 offene, CC Zero lizenzierte Genotypisierungen. Aber natürlich wollen wir, dass diese Zahl noch weiter ansteigt. Mit dem Geld von Wikimedia könnten wir zwischen 25 und 50 neue Genotypisierungen ermöglichen, gerade für die Menschen die sich gerne einbringen wollen, aber denen es an finanziellen Mitteln fehlt. Diese Daten können dann – mit informierter Einwilligung – öffentlich zugänglich gemacht werden und ermöglichen es so weitere neue Einblicke in das menschliche Genom zu bekommen.

Wie lässt sich messen, ob dieses Ziel erreicht wird? edit

Der Erfolg lässt sich zum einen direkt an der Anzahl der auf opensnp.org hochgeladenen Genotypisierungen messen. Zum anderen wird man sehen können ob in Zukunft wissenschaftliche Veröffentlichungen erscheinen, die sich auf solche freien Datensätze beziehen.

Zielgruppe des Projektes edit

Zum einen natürlich Laien, die an ihrer genetischen Zusammensetzung interessiert sind und gerne Open Science/Open Data unterstützen wollen. Zum anderen natürlich Wissenschaftler und engagierte Citizen Scientists, die die Daten für ihre Arbeit verwenden können.

Wie wird die Zielgruppe erreicht? edit

Die Zielgruppe lässt sich über eine gut vernetzte Blogosphäre – zum Thema Wissenschaft/Genetik im Allgemeinen und zum Thema Direct To Consumer-Gentests im Speziellen – gut erreichen. Dort stehen wir bereits mit vielen der Hauptakteure, die zu einem guten Teil auch selbst im wissenschaftlichen Betrieb aktiv sind, im Kontakt.

Genauso lässt sich die Zielgruppe über Social Networks und die verschiedenen Medien der wachsenden DIYBiology-Bewegung erreichen.

Lässt sich die Idee auch von anderen Zielgruppen, Orten, Projekten nutzen? Wenn ja, wie und von wem? edit

Puh, spontan haben wir dazu keine Idee. Aber ist das nicht der Reiz von offenen Dingen? Sie können von jedem, der eine cleverere Idee hat, remixed werden?

Umsetzung und Nachhaltigkeit des Projektes edit

Welche Tools, Technologien oder Hilfsmittel werden für die Umsetzung benötigt edit

Keine zusätzlichen – www.opensnp.org ist bereits fertig programmiert und wird von Wissenschaftlern und DTC-Kunden genutzt.

Wird die Idee weiterleben, nachdem die Förderphase beendet ist? Wie nachhaltig ist das Projekt? edit

Auch ohne unsere Förderung für Genotypisierungen wird opensnp.org weiterbestehen und so jedem Interessierten zur Verfügung stehen, genauso wie die so gewonnen Datensätze.

Alle im Rahmen der Idee erstellten Inhalte stehen unter einer Freien Lizenz. Wie wird diese Lizenzierung umgesetzt, welche Lizenzen werden verwendet? edit

Die Genotypisierungen werden unter CC0 veröffentlicht, jeder Benutzer erklärt sich durch das Hochladen der Daten damit einverstanden. openSNP selbst ist veröffentlicht unter CC-BY-SA 3.0 (Quellcode hier www.github.com/gedankenstuecke/snpr).

Lässt sich das Projekt innerhalb von sechs Monaten umsetzen? Wenn nein, welche Meilensteine werden in dieser Zeit abgeschlossen sein? edit

Sicherlich – 50 Menschen, die sich genotypisieren lassen möchten, kann man innerhalb sechs Monaten problemlos finden.

Erwartest du Unterstützung (über die beantragten Mittel hinaus) von Wikimedia Deutschland während der Umsetzung deiner Idee? Wenn ja, in welcher Form? edit

Nein, wird nicht erwartet.

Hast du Erfahrungen in ähnlichen Projekten? Wenn ja, welche? edit

Wofür würdest du die 2.000 Euro aus dem Publikumspreis einsetzen? (2 Sätze genügen) edit

Wir würden damit so viele Genotypisierungen wie möglich finanzieren und unser Beitrag war ja vorher schon auf keine feste Summe gemünzt. Denn obwohl wir uns über eine große Summe freuen würden, so können auch kleinere Datensätze aus weniger Individuen in der Community bereits benutzt werden.

Wie hast du von diesem Wettbewerb erfahren? edit

Twitter, Freunde oder Bekannte

Über den Einreicher edit

Name des Einreichers edit

Bastian Greshake

Blog, Website, Wiki edit

blog: www.scilogs.de/wblogs/blog/bierologie
twitter: http://twitter.com/#!/gedankenstuecke
quellcode: http://github.com/gedankenstuecke/

Drei Sätze über den Einreicher edit

Ich komme aus dem Bereich der Bioinformatik und bin aktuell Masterstudent für Ökologie und Evolution in Frankfurt/Main und irgendwie an Humangenetik interessiert. Genauso wie an den Themen Open Access/Open Data/Open Science. Und irgendwie wird man das ja schon kombinieren können.

Budget und Projektplan edit

Wie viel wird die Umsetzung deiner Idee in etwa kosten? edit

5.000,00 €

Höhe der gewünschten Förderung edit

5.000,00 €

Publikumspreis edit

Stimme hier für den Publikumspreis und wähle dein Lieblingsprojekt!

Abschlussbericht edit

Verfasst von Bastian Greshake im Juli 2012 (auch im Wikimedia-Blog).

Seit ein paar Jahren kann man nicht nur Bücher und Musik über das Web kaufen, sondern auch Gentests. Auf Bestellung gibt es eine Teströhre für die Speichelprobe nach Hause. Diese geht dann zurück an den Anbieter und ein paar Wochen später gibt es die Testergebnisse elektronisch nach Hause geliefert. Über 150.000 Menschen haben bereits solche Direct-To-Consumer (DTC) Gentests machen lassen. Die dabei gewonnenen Daten klären nicht nur über Krankheitsrisiken und Medikamentenverträglichkeiten auf, sondern können auch in der Forschung weiter verwendet werden.

Standardmäßig sind die Ergebnisse dieser Tests jedoch nicht für die Allgemeinheit zugänglich. Kunden von Direct-To-Consumer-Gentests können den entsprechenden Firmen zwar Zugang zu ihren Ergebnissen für die Forschung gewähren, eine freie Veröffentlichung ist in der Regel aber nicht vorgesehen. Ende September schalteten wir deshalb openSNP online. Als Webplattform bietet es Kunden solcher Gentests die Möglichkeit ihre Test-Ergebnisse zusammen mit genetisch bedingten Eigenschaften wie Größe, Augen-/Haarfarbe etc. über die freie Creative Commons Zero-Lizenz kostenlos der Allgemeinheit zur Verfügung zu stellen.

Zum Zeitpunkt der Bewerbung für den WissensWert-Wettbewerb war das openSNP-Projekt noch relativ jung und mit 35 Datensätzen auch nicht sonderlich umfangreich, geschweige denn erfolgreich. Unsere Idee war es mit den WissensWert-Fördermitteln jenen Leuten einen Gentest zu ermöglichen, die zum einen natürlich bereit sind ihre Ergebnisse (auf Wunsch unter Pseudonym) zu veröffentlichen und zum anderen in den meisten Studien bislang unterrepräsentiert sind; denn bis dato stammen die meisten menschlichen Gendaten von männlichen, weißen, gebildeten und wohlhabenden Europäern & US-Amerikanern.

Von Mitte Februar bis Ende März konnten sich daher Interessierte um eine Genotypisierung bei uns bewerben. Neben dem Geschlecht, Herkunft und eventuell vorhandenen genetisch bedingten Krankheiten war uns auch wichtig, dass die erfolgreichen Bewerber verstanden hatten, welche potentiellen Risiken eine freie Veröffentlichung von Gendaten haben kann. Daher enthielt das Bewerbungsformular sechs Ja/Nein-Fragen zu den Risiken.

Unsere Skepsis, ob sich überhaupt genug Bewerber finden würden, stellte sich dabei schnell als unbegründet dar: Innerhalb der ersten 48 Stunden bewarben sich über 200 Personen und schlussendlich hatten wir weit über 400 Bewerbungen aus aller Welt. Nicht nur durch die schiere Anzahl der Einreichungen, sondern auch durch die durchgehend spannenden Bewerbungen selbst war die Auswahl nicht einfach. Schlussendlich konnten wir uns auf 22 Teilnehmer einigen. Diese wurden zwischen April und Anfang Juni durch 23andMe, einen der kommerziellen Anbieter für solche DTC Tests, genotypisiert.

Bislang unterrepräsentierte Gruppen sind unter unseren Teilnehmern recht gut vertreten: 36% der Teilnehmer gaben ihr chromosomales Geschlecht als XX (weiblich) an und nur 9 der Teilnehmer stammen aus Europa; dagegen 8 aus Afrika, je 2 aus Ost-Asien und Polynesien und ein Teilnehmer stammt aus dem mittleren Osten. Mittlerweile haben die meisten Teilnehmer ihre Ergebnisse bereits erhalten und ein Teil hat seine Daten auch schon ins Netz gestellt. Die WissensWert-Förderung ist für uns damit ein voller Erfolg gewesen.

Unser Datenbestand konnte aber nicht nur unmittelbar durch die WissensWert-Förderung gesteigert werden, sondern auch mittelbar: Durch die damit verbundene Medienaufmerksamkeit konnte der Bekanntheitsgrad von openSNP auch über Deutschland hinaus gesteigert werden und mittlerweile führen wir über 200 frei erhältliche Datensätze, zusammen mit entsprechenden Annotationen genetisch bedingter Eigenschaften. Seit dem Beginn des WissensWert-Projekts haben wir darüber hinaus auch Unterstützung für neue Datentypen und eine erweiterte API eingebaut. Gleichzeitig nutzen die ersten (Hobby-)Forscher die frei verfügbaren Daten bereits für ihre Forschung.

Wer wissen möchte, was sonst noch seit dem Start des Projekts bei uns passiert ist, und auf dem laufenden bleiben möchte, wird im openSNP-Blog fündig. Wir haben auch schon ein nächstes Projekt, um die Anzahl der frei verfügbaren Daten weiter zu erhöhen, im Kopf.