Forschergeist
Horizonte für Bildung und Forschung
https://forschergeist.de


FG037 Freies Wissen und Open Data

Die Kultur frei verfügbaren Wissens und offener Daten verändert die Welt

Die freie Verfügbarkeit und Nutzbarkeit von (öffentlichen) Daten ist immer noch ein Desiderat. Auch wenn die „Befreiung“ von Daten in jüngerer Zeit Fortschritte gemacht hat, tun sich gerade hierzulande immer noch große Widerstände auf. Im „Global Open Data Index“ befindet sich Deutschland nur auf Platz 26. Es gibt also noch viel zu tun, auch und gerade im Bereich von Wissenschaft und Forschung.

Wir sprechen deshalb in dieser Folge mit Pavel Richter, der lange Zeit Geschäftsführer von „Wikimedia Deutschland“ war und heute in gleicher Funktion bei „Open Knowledge International“ tätig ist. Dort setzt er sich dafür ein, offenes Wissen zu erzeugen und zivilgesellschaftliche Akteure bei der Nutzung und Verbreitung zu unterstützen.

https://forschergeist.de/podcast/fg037-freies-wissen-und-open-data/
Veröffentlicht am: 8. November 2016
Dauer: 1:53:22


Kapitel

  1. Intro 00:00:00.000
  2. Vorstellung 00:00:43.318
  3. Community in der Wikipedia 00:14:00.532
  4. Wikidata und AI 00:24:36.064
  5. OpenStreetMap 00:37:34.145
  6. Freie Lizenzen 00:42:35.137
  7. Open Data als Forschungsmaterial 00:50:12.087
  8. Open Knowledge International 01:03:07.408
  9. Nationale Initiativen 01:22:16.347
  10. Open Data und Bildung 01:31:09.840
  11. Zukunftspotential offenener Daten 01:37:25.484
  12. Ausklang 01:51:59.580

Transkript

Tim Pritlove
0:00:43
Pavel Richter
0:01:24
Tim Pritlove
0:01:26
Pavel Richter
0:01:30
Tim Pritlove
0:01:31
Pavel Richter
0:01:32
Tim Pritlove
0:01:35
Pavel Richter
0:01:38
Tim Pritlove
0:01:41
Pavel Richter
0:01:44
Tim Pritlove
0:01:54
Pavel Richter
0:01:59
Tim Pritlove
0:01:59
Pavel Richter
0:02:06
Tim Pritlove
0:03:07
Pavel Richter
0:03:10
Tim Pritlove
0:03:42
Pavel Richter
0:03:43
Tim Pritlove
0:05:05
Pavel Richter
0:05:07
Tim Pritlove
0:05:30
Pavel Richter
0:05:37
Tim Pritlove
0:05:41
Pavel Richter
0:05:42
Tim Pritlove
0:06:38
Pavel Richter
0:07:17
Tim Pritlove
0:08:26
Pavel Richter
0:08:28
Tim Pritlove
0:09:23
Pavel Richter
0:09:25
Tim Pritlove
0:10:02
Pavel Richter
0:10:21
Tim Pritlove
0:11:54
Pavel Richter
0:11:56
Tim Pritlove
0:13:07
Pavel Richter
0:13:09
Tim Pritlove
0:13:18
Pavel Richter
0:13:19
Tim Pritlove
0:13:26
Pavel Richter
0:13:41
Tim Pritlove
0:13:54
Pavel Richter
0:15:05

Also zum ersten finde ich es völlig normal, dass solche Projekte sehr unterschiedlich sind, wenn sie aus unterschiedlichen kulturellen Kontexten kommen. Niemand würde ja sagen, würde ja dem deutschen Film vorwerfen, nicht so zu sein wie der amerikanische Film. Nein das ist ja ein Alleinstellungsmerkmal, dass der deutsche Film halt der deutsche Film ist und nicht der amerikanische Film. Und warum soll dann nicht die deutsche Wikipedia die deutsche Wikipedia sein. Also insofern das ist grundsätzlich erst mal kein Problem, dass sie scheinbar nicht so inkludistisch ist, wie die englischsprachige. Ich würde die Grundthese erst mal anzweifeln, dass sie das nicht ist, aber das ist vielleicht eine Spezialdiskussion. Der Community-Aspekt ach das ist ein … ich finde das ein wahnsinnig … also erst mal muss man unterscheiden, dass es nicht die Wikipedia-Community gibt. Es gibt so ein paar Schätzzahlen, die offiziellen liegen glaube ich so, dass es ungefähr 500 sehr aktive Wikipedianer aktuell gibt in Deutschland oder in der deutschsprachigen Wikipedia. Ich halte diese Zahl für viel zu hoch gegriffen. Ich glaube der Core der Menschen, die tatsächlich dieses Projekt als Projekt aufrechterhalten und die Strukturen auch ausverhandeln, liegt unter 100, und zwar wahrscheinlich deutlich unter 100. Ist einfach ein Erfahrungswert aus 12 Jahren, die ich teils dabei war und teils beobachtet habe. Während meiner Zeit als Geschäftsführer von Wikimedia Deutschland war ich deutlich mehr Beobachter als Teilnehmer dieser Community. Dann gibt es aber, deswegen sage ich, es gibt nicht diese eine Community, das sind die Menschen, die das Projekt als Projekt aufrechterhalten. Das ist aber noch deutlich .. und andere Menschen, als die die beitragen zur Wikipedia. Es gibt tatsächlich Menschen, die sich für das Projekt an sich gar nicht so großartig interessieren, die aber sich um ihren Fachbereich kümmern. Die ihre Artikel schreiben, die also für den Content, würde man heutzutage sagen, sorgen. Ohne dass sie sich für den Aspekt des eigentlichen Projektes, der internen Strukturen von Wikipedia tatsächlich ernsthaft interessiert. Und diese Zahl ist natürlich viel größer und hat eine viel höhere Fluktuation. Da kommen Menschen, die wollen halt über ein bestimmtes Thema schreiben, die tun das und dann gehen sie auch wieder. Und in den allermeisten Fällen, würde ich auch sagen, ist das eine problemlose Erfahrung. Es gibt natürlich auch jede Menge Situationen, wo das dann ein schmerzhafterer Prozess war bedauerlicherweise. Aber in den allermeisten Fällen sind die Menschen, die beitragen wollen, die tragen bei und beteiligen sich aber nicht weiter. Und dann gibt es diejenigen, die dieses Projekt vorantreiben als Projekt mit seinen internen Strukturen und auch seinen internen Problemen.

Tim Pritlove
0:17:58
Pavel Richter
0:18:24
Tim Pritlove
0:18:31
Pavel Richter
0:18:31
Tim Pritlove
0:19:51
Pavel Richter
0:19:53

Und auch eine gewisse Diversität, die in der Wikipedia nie gegeben war bisher. Also das sind weiße mittelalte Männer, die die Wikipedia schreiben. Das ist leider so. Aber das Thema Diversität ist noch was anderes, jetzt geht es erst mal um die schiere Anzahl und die nimmt kontinuierlich ab. Und es gibt immer wieder Versuche von Wikimedia Deutschland, von der Wikimedia Foundation, aber auch andere interessierte Gruppen, die Anzahl der Autorinnen und Autoren zu erhöhen. Und was macht man denn, wenn jetzt plötzlich in diese Community 100-150-200 Leute reinkommen und einfach quasi das Versprechen, das die Wikipedia ihnen gegeben hat, nämlich wir sind die Enzyklopädie, an der jeder mitarbeiten kann, plötzlich einfordern. Das ist schwierig, denn die Wikipedia hat ein recht komplexes Regelwerk und die Wikipedia hat vor allem sehr viel kulturelles Kapital und soziales Kapital, haben die Teilnehmer aufgebaut. Und wenn ich jetzt neu dazukomme fehlt mir dieses Kapital und ich werde nicht so ernst genommen und mir wird nicht so zugehört. Wie Leuten, die schon seit vielen Jahren dabei sind. Und dann gibt es sicherlich so eine Form, vielleicht ist das gar nicht so untypisch für Online-Communitys im Allgemeinen, dieses bewahren wollen. Also ich stelle in der deutschsprachigen Wikipedia als Beobachter aktuell fest, dass es tatsächlich eine Angst vor diesem Neuen gibt oder eine Angst davor, sich weiter zu entwickeln. Weil das was wir jetzt haben ja auch sehr gut funktioniert hat und auch immer noch sehr gut funktioniert. Vielleicht liegt die Zukunft deswegen gar nicht darin, dass man Menschen in die Wikipedia bringt und dazu bringt, an einer Enzyklopädie mitzuarbeiten, sondern vielleicht müssen wir die Menschen wo ganz anders abholen, um ihr Wissen abzufragen und aufzubereiten. Vielleicht ist das Zeitalter … oder vielleicht brauchen wir neben dem Enzyklopädie-Projekt noch was anderes. Und da gibt es ja hier in Deutschland etwas, was hier entwickelt wurde, nämlich Wikidata. Das ist tatsächlich das seit der Gründung der Wikipedia einzige Projekt, das erfolgreich es geschafft hat, sich zu etablieren als ein nach den Grundprinzipien der Wikipedia funktionierendes Projekt zur Strukturierung und Sammlung von Wissen. Das in dem Fall nicht enzyklopädisch ist, es geht hier um Daten, um strukturierte Daten, aber es ist enorm erfolgreich. 12.000 Community-Member weltweit, die also sich aktiv daran beteiligen. Und ich glaube, wir müssen, wenn wir dann auch außerhalb von Deutschland gucken, wenn wir uns anschauen, dass es jede Menge Bereiche und Kulturen in dieser Welt gibt, die überhaupt kein Verständnis für das Konzept der Enzyklopädie haben, weil es eben nicht … die Enzyklopädie ist ein Projekt der Aufklärung, es gibt keine Enzyklopädie ohne Aufklärung. Es gibt aber sehr viele Gegenden in dieser Welt, in der Aufklärung keine kulturelle Verwurzlung hat. Und das ist jetzt weder gut noch schlecht, aber es bedeutet, dass wir auch hier andere Zugänge finden müssen, wie wir Menschen dazu bringen können, ihr Wissen zu teilen und ihr Wissen aufzubereiten und verfügbar zu machen. Und ich glaube, dass die Idee einer gemeinschaftlich geschriebenen Enzyklopädie da tatsächlich an ihre Grenzen stößt. Und dass wir eine Diversität auch in diesen Projekten brauchen, die es uns erlauben, andere Zugänge zu finden und andere Angebote zu machen, hey hier kannst du was machen. Quora ist mein Lieblingsbeispiel dafür. Quora diese Seite im Internet, wo man eine Frage stellen kann und andere Menschen beantworten diese Frage und wiederum andere Menschen bewerten diese Antwort und die am besten bewertet Antwort kann ich mir anschauen. Ein enorm erfolgreiches Projekt. Ist im Grunde genommen nichts anderes, als dass was die Wikipedia auch mal sein wollte. Nämlich es ist ein riesiger Wissensschatz. Nicht ganz so gut strukturiert wie eine Enzyklopädie, aber die Daten sind erst mal da. Das Wissen ist in der Datenbank von Quora. Und ich bin sehr gespannt, was in den nächsten Jahren mit diesem Wissensschatz, der dort angesammelt wurde, gemacht wird. Aber hier wird eben ein menschliches Bedürfnis aufgegriffen, nämlich Fragen zu beantworten. Ich stelle dir eine Frage und du beantwortest sie und das ist ganz natürlich. Und niemandem wird gesagt, hey willst du nicht eine Enzyklopädie mitschreiben. Was nämlich unter uns auch sehr einschüchternd sein kann. Wer bin ich eigentlich, dass ich an einer Enzyklopädie mitschreibe. Eine der häufigsten Antworten, wenn wir gefragt haben, warum arbeitest du nicht in der Wikipedia mit, und eine insbesondere von Frauen häufig zu hörende Antwort ist, ich sehe nicht, dass ich jetzt dazu beitragen kann zu einer Enzyklopädie. Weil das kann auch einschüchternd sein. Vielleicht ist das für diejenigen, die jetzt in der Wikipedia mitarbeiten, das sind Menschen, die sagen, ja klar Enzyklopädie schreiben wir mit. Aber es gibt eben ganz viele, die diesen robusten Ansatz nicht haben und die müssen wir ganz anders kriegen.

Tim Pritlove
0:24:37

Ja man merkt, dass die Wikipedia extrem gereift ist. Ich erinnere mich immer noch mit Freude, es wurde mal an einem Tag ich glaube der 10.000 Artikel des französischen Schwesterprojekts, also der französischen Wikipedia, bejubelt. Da war alles noch ganz am Anfang und ich glaube die Deutsche war da so bei 100.000 Seiten, also auch gar kein Vergleich mehr. Und die französische Wikipedia hat dann diesen Tag mit dem schönen Satz bejubelt, eine Birne ist eine Frucht. Und das war der erste Satz, der in dem Artikel Birne drin stand. Und es wurde sozusagen zelebriert so dieses, guck mal es reicht, wenn so eine einfache Feststellung erst mal da reinschreibt und daraus entwickelt sich dann halt ein ausführlicher Artikel, der halt irgendwie alles über Birnen erzählt, was man irgendwie nur wissen mag. Und das hat sehr schön diese Dynamik am Anfang des Projekts ausgedrückt. Und in gewisser Hinsicht könnte man vielleicht auch feststellen, Wikipedia war ein Erfolg, befindet sich in gewisser Hinsicht jetzt in so einer sich langsam weiterentwickelnden Konsolidierungsphase. Man kann auch fast sagen, das Ziel wurde erreicht. Es wird natürlich immer wieder neues Wissen geben, Dinge werden verfeinert, aber man scheint seine Struktur gefunden zu haben. Nichts desto trotz und hättest du es jetzt nicht angesprochen, hätte ich das sicherlich auch noch aufgebracht, ist dieses Wikidata-Projekt ja im Prinzip dann auch so der nächste Schritt. Dass man sagt, okay jetzt liefern wir halt nicht nur Wissen zum Nachlesen, im Sinne Menschen lesen Texte von Menschen über Dinge, was ja im Prinzip die Enzyklopädie immer leisten wollte, hin zu einem Menschen und Computer liefern Daten für Menschen und Computer. Und ist damit in gewisser Hinsicht ja noch viel moderner aufgestellt und liefert eine ganz andere Maschine, die quasi freies Wissen ja auch in eine andere Position reinbringt. Weil während man oft Wikipedia-Artikel gelesen hat, um daraus zu lernen, ist es ja nicht so, dass Roboter sich nach dem Inhalt von Wikipedia-Artikeln verhalten können, aber das sieht ja dann bei Wikidata schon wieder ganz anders aus.

Pavel Richter
0:26:53

Absolut. Wikidata ist insbesondere … also vielleicht ist Wikidata einfach die logische Fortentwicklung eines Enzyklopädie-Projektes. Eine Enzyklopädie, also ein Fließtext, der sich an Menschen richtet, die etwas lesen wollen, arbeitet mit den Mitteln des Buchdrucks im Grunde genommen in digitaler Form, ein bisschen Hypertext ist dabei, ein bisschen Verlinkung, aber im Grunde genommen reden wir hier über einen klassischen Textaufbau, dem auch die Wikipedia folgt. Wikidata ist die Referenz dafür, dass sich auch die Nutzbarmachung von Wissen und vielleicht sogar auch die Definition von Wissen dahingehend aus meiner Sicht geändert hat, dass es heutzutage wichtig ist, oder nicht nur wichtig, sondern auch überhaupt möglich ist, auch technisch möglich ist, sehr viel Wissen zu generieren und aufzubereiten in einer nachvollziehbaren Form, ohne dass es einer menschlichen Interaktion dafür bedarf. Ohne dass es eines Redakteurs bedarf. Sei das nun ein hauptamtlicher Redakteur eines Verlages oder sei das nun ein ehrenamtlicher Redakteur der Wikipedia, sondern dass Maschinen sehr viel besser geworden sind im Erstellen und im Präsentieren und im Aufbereiten von Wissen und Informationen. Wir haben noch gar nicht über Artificial Intelligence gesprochen, aber alleine mit dem, was heutzutage möglich ist, kann man eben … Computerprogramme können noch keine Enzyklopädie schreiben, aber sie können zum Beispiel Fragen beantworten. Und die meisten Menschen, die in der Wikipedia etwas suchen, wollen ja meistens eine ganz spezifische Frage beantwortet haben. Die wollen ja nicht einen gesamten Artikel zur französischen Revolution lesen, es sei denn sie sind Schüler und schreiben gerade ein Referat über die französische Revolution, aber anordnen kommen wir alle, weil wir irgendwie so eine Pappquizfrage haben, die wir beantwortet wissen wollen. Und dafür bedarf es eben auch nicht unbedingt einer Enzyklopädie, sondern dafür bedarf es idealerweise maschinenlesbaren Informationen, die dann zu Wissen zusammengesetzt werden können. In Maßen, also ich glaube nicht, dass wir zumindest heutzutage soweit sind, dass wir längere Texte strukturiert erstellen können, aber eben für diese Beantwortung von Fragen ist das was Wikidata und ähnliche Projekte machen die Grundlage, die damit zu tun hat, dass wir jetzt eben die technischen Möglichkeit haben, tatsächlich auch mit solchen strukturierten Daten menschengerecht umzugehen und Informationen und Wissen daraus zu generieren, die Bedürfnisse von Menschen befriedigen. Die Wikipedia in Schweden zum Beispiel ist genau diesen Weg gegangen. Die ist mittlerweile numerisch gesehen deutlich größer als die deutschsprachige Wikipedia, weil sie einen Großteil ihrer Artikel mit sogenannten Bots, also mit Computerprogrammen schreibt. Die strukturierte Datenbanken, unter anderem auch Wikidata, aber eben auch jede Menge andere Datenbanken durchforstet und Artikel zu Tiergattungen schreibt oder Artikel zu Pflanzen schreibt. Und das mittlerweile tatsächlich auch so, dass dort Informationen geliefert werden, die auch gesucht und gelesen werden.

Tim Pritlove
0:30:25
Pavel Richter
0:31:25

Das ist sicherlich so. Aber ich glaube, dass … also man kann sicherlich diese Art der automatisch aufbereiteten Enzyklopädien unter dem Markennamen Wikipedia ganz gut vertreiben, der Markenname funktioniert ja weltweit, also auch in Kulturen, die keinen enzyklopädischen Kontext kennen oder nicht den gleichen enzyklopädischen Kontext kennen wie wir, aber ich glaube, das ist ungefähr so wie die ersten Webseiten von Zeitungen, die ungefähr so aussehen wollten wie eine gedruckte Zeitung. Und wenn die Ergebnisse aus Wikidata so aussehen wollen wie eine echte Enzyklopädie, dann ist das glaube ich eine Brückentechnologie. Wirklich spannend wird es, wenn auf diese Information zugegriffen wird auf eine ganz natürliche Art und Weise, dass ich eine Frage bei Google eintippe und die Antwort kriege, die aus Wikidata generiert wird. Es ist ja auch kein Zufall, dass Suchmaschinen wie Google oder auch die russische Variante Yandex Geld in die Entwicklung von Wikidata gesteckt haben. Das ist natürlich für die ein enormer Schatz, nicht nur an Wissen, sondern auch die Community, die darum entsteht, ist natürlich enorm spannend und enorm interessant. Also ich glauben, dass die Nutzung von Wikidata zur automatischen Erstellung von Enzyklopädien in Märkten, in denen es diese Enzyklopädien noch nicht gibt, das ist eine Übergangstechnologie. Das sehen wir jetzt, aber ich glaube der eigentliche Wert von Wikidata wird sich erst noch zeigen, wenn auch die Anwendungen spezifischer werden und marktgenauer werden. Vielleicht werden die auch unter dem Namen Wikipedia vertrieben oder präsentiert, aber sie werden dann keine Enzyklopädie sein in unserem Sinne. Was ich überhaupt nicht schlimm finde. Ich war nie ein Freund davon zu sagen, die Aufgabe von Wikipedia im Mission Statement ist das gesamte Wissen der Menschheit allen Menschen der Welt frei zur Verfügung zu stellen. In diesem Statement kommt das Internet nicht vor und in diesem Statement kommt auch die Enzyklopädie nicht vor. Das sind beides Tools, die wir benutzen. Das eine ist ein technisches Tool und das andere ist ein kulturelles Tool. Aber wenn ich in einem Markt agiere, in dem dieses kulturelle Tool zum Beispiel nicht funktioniert, dann brauche ich ein anderes. Anstatt so zu tun, als könnte man da auch eine Enzyklopädie schreiben, wie wir sie in Deutschland schreiben oder in Frankreich oder in Spanien.

Tim Pritlove
0:33:42
Pavel Richter
0:34:33
Tim Pritlove
0:36:00
Pavel Richter
0:36:01
Tim Pritlove
0:37:13

Da kann man dann wirklich mal auf die künstliche Intelligenz hoffen, dass sie a) in der Lage ist, mir die alle zu übersetzen, so dass sozusagen der Wortsinn auch beibehalten wird oder vielleicht so weit zu gehen und zu sagen, ich habe das jetzt mal alles zusammengefasst, wie die einzelnen Sprachräume das so sehen und hier ist sozusagen der globale Konsens, den wir gerade haben. Aber da greife ich jetzt wahrscheinlich ein bisschen zu weit. Jetzt haben wir schon viel über Wikipedia gesprochen, im Kern wollten wir ja über freies Wissen sprechen. Ich möchte trotzdem aber nochmal auf einen zweiten Veteranen eingehen, der parallel entstanden ist und der auch seine ganz eigene Bedeutung und seine ganz eigene Wirkmächtigkeit entfaltet hat, aber sich einfach in einem ganz anderen Rahmen abspielt, die Rede ist von Open Streetmap, das ja wiederum in England gestartet worden ist. Ich bin mir jetzt über die Genese nicht ganz genau im Klaren, aber Karten sind da auf jeden Fall ein Thema gewesen und auch die Verfügbarkeit und die Nutzbarkeit von Karten. In Großbritannien ist es halt vor allem diese Ordnance Survey Karten, die im Prinzip eigentlich das Bild der Landschaft skizziert haben. Das war quasi so die einzige nennenswerte Quelle. Digitale Karten in dem Sinne gab es nur im Ansatz bis dahin. Google Maps ist halt gestartet und hat schon mal versucht, so ein bisschen die Verkehrssituation zusammenzutragen, aber trotzdem gab es auch dort eben den Wunsch der Datenbefreiung, kann man sagen. Also mehr noch als bei Wikipedia, wo das ja nicht so wirklich um eine Befreiung ging, weil ja am Ende mit der Wikipedia etwas ganz anderes entstanden ist. Es gab eigentlich nicht dasselbe vorher. Es gab etwas, das nannte sich Enzyklopädie. Aber wenn halt Enzyklopädien gedruckte, Brockhaus etc., neben Wikipedia liegt, ist ja gar kein Vergleich. Also der Umfang, die Tiefe, der Hypertext, der da alles mit drin ist, aber die Karten sind im Prinzip auf gleicher Augenhöhe angetreten.

Pavel Richter
0:39:16

Also zunächst mal würde ich jetzt sagen, bei Open Streetmap geht es aus meiner Sicht weniger um die Befreiung von Daten, sondern es geht um Crowdsourcen von Daten. Es geht darum, dass Daten, die mir als Nutzer nicht frei zur Verfügung stehen, und die ich auch nicht anderweitig kriegen kann, dass ich mir die eben selber erschaffe. Und das ist erst mal abstrus und dann auch gleich noch mit Geodaten anzufangen. Aber Geodaten gab es ja durchaus. Es gab die Katasterämter in Deutschland. Also es gibt jede Menge Geodaten, es gab sie auch schon lange Zeit. Sie waren aber eben nicht frei verfügbar. Navigationsgeräte an Autos gibt es auch schon sehr lange, jeweils mit extrem teurem Kartenmaterial. Aber was hier eben fehlte war freizugängliche Geodaten, die Open Streetmap dann gesammelt hat. Und das ist ja fast schon eine Hybris zu sagen, wir machen jetzt eine Karte von Deutschland und zwar eine Straßenkarte von Deutschland oder von England oder von den USA. Zeigt aber natürlich, wie großartig die Kombination aus einer Idee und der richtigen Zeit, nämlich dass die Technologie dafür vorhanden war, das GPS-Geräte billiger wurden, dass ich also plötzlich als Hobby eine Landkarte machen konnte. Und sich eine Community darum gebildet hat, die sich dem verschrieben hat, das ist glaube ich das Erfolgsrezept von Open Streetmap. Ich würde noch dazu sagen, dass Open Streetmap aber ähnlich wie Wikipedia auch nicht einfach nur bestehendes Datenmaterial nochmal erstellt hat, sondern hier insbesondere der Produktionsprozess von Wissen sich radikal verändert hat. Hier sind eben keine Vermessungsteams unterwegs, die mit aufwendigen Vermessungsinstrumentarien Straßen vermessen. Oder auch neue Straßen anlegen oder kaputte Straßen sperren oder erschließen in dem Kartenmaterial, sondern der Produktionsprozess ist einfach enorm demokratisiert worden. Heutzutage jeder mit einem Smartphone kann zu Open Streetmap beitragen und das führt aber nicht nur zu billigeren und zu kostenlosen Daten, sondern es führt auch zu deutlich besseren, weil es nämlich erlaubt, sehr viel einfacher Fehler zu korrigieren. Ich bin immer noch überrascht darüber, wie wenig Feedback-Möglichkeiten es so im Internet gibt, wenn ich auf einen Fehler gestoßen bin. Wir alle kennen das, wir lesen bei Spiegel Online irgendwas was objektiv falsch ist und es gibt keine Möglichkeit, irgendwie Bescheid zu sagen, hallo das ist falsch, ändert das. Ich könnte wahrscheinlich eine E-Mail schreiben, die aber wahrscheinlich und so weiter.

Tim Pritlove
0:42:04
Pavel Richter
0:42:04
Tim Pritlove
0:42:33
Pavel Richter
0:43:33

Ja, ja das tut es und über den wirtschaftlichen Aspekt können wir sicherlich auch noch reden. Ich glaube aber, dass die Wirkung einer offenen Lizenz zunächst mal Community-intern ist. Ich glaube, es ist der große Schatz einer offenen Lizenz, dass wenn ich etwas unter einer offenen Lizenz veröffentliche, ich von Vornherein bereit bin, zu akzeptieren, dass andere mit dem, was ich da produziert habe, frei umgehen. Und zwar zunächst mal innerhalb des Projekts, in dem ich mich bewege. Die ersten Änderungen in einem Wikipedia-Artikel sind ja innerhalb der Wikipedia. Da geht es nicht darum, dass irgendjemand den nimmt, druckt und damit Geld verdient, sondern es geht darum, dass es kein Streit in der Community darüber geben kann, dass überhaupt jemand es wagt, sich an einem Artikel, einer Information, an einem Stück Wissen von einem anderen da rumzumachen. Sondern dadurch, dass ich es unter eine freie Lizenz stelle, habe ich diese Diskussion von Vornherein ausgeschlossen. Es gibt natürlich auch in der Wikipedia Menschen, die quasi die Wikipedia, die ihren Artikel besitzen und es gibt Hauptautoren, das auf jeden Fall. Aber es gibt eben nicht diese Debatte, misch dich nicht in meinen Artikel ein. Und das hat was mit der Lizenz zu tun. Ich glaube, das ist eigentlich die wesentliche Funktion einer offenen Lizenz, dass sie Community-bildend ist. Und es ist glaube ich kein Zufall, dass sich mit Open Streetmap und Wikipedia, aber auch mit Wikidata drei sehr große Communities gebildet haben rund um jeweils eine mittlerweile mehr oder minder vergleichbare offene und freie Lizenz. Dass es dann auch noch eine Außenwirkung gibt, was die Nutzung angeht, das ist zum Beispiel bei Open Streetmap ganz sicherlich wichtiger. Ich würde mal, ohne dass ich da jetzt Statistiken kenne, vermuten, dass Open Streetmap deutlich häufiger auch kommerziell genutzt wird. Es gibt mehr und mehr Navigationssysteme, die auf Open Streetmap zurückgreifen. Es gibt mehr und mehr Webseiten, die wenn sie einen Kartendienst anbieten, nicht mehr Google Maps anbieten. Was ja für den normalen Webseitenbetreiber durchaus Geld kosten kann, sondern die sich auf Open Streetmap konzentrieren. Also die Weiternutzung, auch die kommerzielle Weiternutzung von Open Streetmap ist glaube ich weiter geschritten als die ernsthafte kommerzielle Weiternutzung der Wikipedia. Es gibt so Trittbrettfahrer, die so Book on demand Bücher bei Amazon machen mit Wikipedia-Artikeln und arme Menschen damit betrügen. Aber ansonsten glaube ich die wirtschaftliche Nutzbarmachung der Wikipedia-Inhalte gering.

Tim Pritlove
0:46:09

Zumindest in Puncto von, ich nehme die Daten und mach daraus aber was komplett neues. Ich denke, dass der wirtschaftliche Fortbildungswert von Wikipedia auch enorm ist und sich wahrscheinlich in Zahlen überhaupt gar nicht mehr ausdrücken lässt. Trotzdem also ich will da nicht so sehr darauf rumreiten, aber ich hatte schon so den Eindruck, dass Open Streetmap schon auch noch eine konkretere Antwort auf dieses Lizenzproblem war. Also Wikipedia hat mehr so einen grundsätzlichen Mangel, weil es so was halt noch gar nicht gab in dieser Form, auch nicht mit dieser Nutzbarkeit angegangen. Open Streetmap war schon auch so eine Reaktion auf die Eigenschaft bestimmter vorhandener Daten, es ist ja nicht so, dass es keine guten Karten gegeben hätte, es gab viele Karten. Da war jetzt vielleicht nicht jeder Briefkasten eingezeichnet, aber gerade das Ordance Survey Kartenmaterial muss ich ja jetzt nicht verstecken. Das war schon immer sehr ausführlich und allumfassend, zumindest was Großbritannien anging, aber es war eben nicht in dem selben Maße nutzbar. Und du hast ja schon angesprochen, auch hier mit den Katasterämtern, wenn man halt Zugriff darauf haben wollte, was der Staat quasi hier über unser Land in Form von geografischer Information weiß, war das mit Kosten verbunden, seien es Bearbeitungsgebühren oder wie sie auch immer heißen. Man konnte nicht mal eben sich von einem Bundesland beliebige Daten holen. Also abgesehen davon, dass der Kopierprozess auch teilweise sehr arkan war, waren halt immer irgendwelche Gebühren damit verbunden und auch Einschränkungen in der Nutzung. Und das war schon so ein bisschen mein Eindruck, dass eigentlich Open Streetmap diesen Gedanken der freien Verwendbarkeit und Wiederverwendbarkeit noch sehr viel mehr im Fokus hatte, als das vielleicht bei Wikipedia am Anfang im Kopf war. Und wenn die Nutzung jetzt auch so ist, dann zeigt sich das ja eigentlich auch oder?

Pavel Richter
0:48:11
Tim Pritlove
0:48:35
Pavel Richter
0:48:38
Tim Pritlove
0:50:10
Pavel Richter
0:50:38
Tim Pritlove
0:50:41
Pavel Richter
0:51:14

Die Wikipedia wird ein enormer Fundus für diese Form von Forschung sein. Nehmen wir ein tatsächliches und ein fiktives Beispiel. Das tatsächliche Beispiel ist der Artikel zur Rating-Agentur. Heutzutage weiß jeder von uns ungefähr was eine Rating-Agentur ist, das wissen wir aber eigentlich auch erst seit 2008, seit der Finanzkrise und dem Versagen der Rating-Agenturen. Der Wikipedia-Artikel zur Rating-Agentur kommt aber aus dem Jahr 2004/05, und da lässt sich wunderbar zeigen, dass das bis zur Finanzkrise ein ganz kleiner, relativ unbedeutender Artikel war, der einfach nur erklärte, was eine Rating-Agentur ist. Heute ist das ein Artikel, der sich kritisch mit den Funktionsweisen von Rating-Agenturen, ihrer politischen und wirtschaftlichen Wirkung auseinandersetzt. Weil wir einfach etwas gelernt haben über die Bedeutung von Rating-Agenturen für dein und mein Leben, wo wir früher nie gedacht hätten, dass uns ein Triple-A von irgendeiner amerikanischen Bank direkt betrifft, aber das tut es eben. Und das reflektiert sich in diesem Artikel wieder. Und das finde ich ein enorm spannenden Evolutionsprozess, den man Schritt für Schritt für Schritt verfolgen kann. Und wenn man sich das jetzt, da reden wir jetzt über acht Jahre seit der Finanzkrise, jetzt stellt man sich das mal über 50 Jahre, über 100 Jahre, über 500 Jahre vor, wie sich gesellschaftliche Diskurse in solchen Artikeln widerspiegeln und auch die Änderungen von gesellschaftlichen Diskursen widerspiegeln. So gesehen kann Wikipedia, und insbesondere die sogenannte Versionsgeschichte, die also den Zugriff auf diese historischen Entwicklungen erlaubt, so gesehen kann Wikipedia tatsächlich ein kulturelles Gedächtnis einer Gesellschaft sein, über Jahre, Jahrzehnte, wenn nicht sogar Jahrhunderte.

Tim Pritlove
0:52:52
Pavel Richter
0:53:09
Tim Pritlove
0:53:45
Pavel Richter
0:55:02

Zunächst mal hat sich das für mich persönlich tatsächlich verändert. Ich war, als kleine Brücke noch zum vorhergehenden Themenblock, ich war als Wikipedianer relativ strikt gegen Open Access. Ich habe gesagt, es geht nicht um die Verfügbarmachung der Forschungsergebnisse, dass ich sie also sehen und lesen kann, sondern es geht darum, dass ich auch mit ihnen machen kann was ich möchte. In einen Wikipedia-Artikel einarbeiten oder was auch immer. Also dass sie unter einer freien Lizenz stehen müssen. Davon bin ich ein bisschen abgerückt. Ich glaube tatsächlich, dass es bei Forschungsergebnissen, so schön es auch wäre, wenn sie alle unter einer freien Lizenz stehen, aber das hier der zentrale Aspekt tatsächlich der Zugang zu diesen Forschungsergebnissen ist, der freie Zugang zu Forschungsergebnissen. Der es also mir ermöglicht, ein Paper zu lesen, ohne dafür viel Geld bezahlen zu müssen oder es gar irgendwie hinter einer Schranke steckt. Also insofern da macht Open Access definitiv Sinn, im Sinne von, Ergebnisse präsentieren und Ergebnisse zugänglich machen. Ich glaube aber, dass sich da der Forschungs- und Wissenschaftsprozess auch dahingehend wandelt. Da stehen wir sicherlich noch relativ am Anfang, dass es eben nicht nur um das eigentliche Ergebnis geht, sondern auch die Rohdaten quasi zur Verfügung zu stellen, also das Ausgangsmaterial, die Testreihen, die erhobenen Datensätze zugänglich zu machen. Und zwar aus zwei Gründen. Zum einen zum Zwecke der Überprüfbarkeit, um tatsächlich selber nachvollziehen zu können, ob die Daten das hergeben, was das Paper sagt. Wichtiger vielleicht auch noch im gesellschaftlichen Sinne, also das ist quasi der Binnenwissenschaftsaspekt, aber im gesellschaftlichen Sinne wichtiger ist noch, dass ja wenn Daten gesammelt werden und ich darauf diese Daten erforsche, ich ja eine bestimmte Fragestellung anlege. Und dementsprechend auch was bestimmtes rauskriege. Ich kann aber auch eine andere Fragestellung an diese Daten stellen und damit ein anderes Ergebnis herausbekommen. Und diese Daten quasi als einen Rohstoff zur Verfügung zu stellen, anderen Wissenschaftlern, anderen Forschern, die eine andere Fragestellung haben. Da geht es also nicht um die Überprüfung meiner Hypothese, sondern es geht um die Nutzung meiner Daten zur Überprüfung einer anderen Hypothese. Das ist der glaube ich gesellschaftlich extrem spannende Prozess. Da stehen wir aber wirklich noch sehr am Anfang. Ich glaube der Wissenschaftsbetrieb ist sehr geprägt von der Open Access Debatte und von der Debatte nach der Rolle von Fachzeitschriften und weil es sehr viel Geld kostet, dort Paper zu veröffentlichen und sie dann hinterher wieder abzurufen. Ich glaube da ist die Wissenschaft selber noch sehr in dieser Thematik gefangen oder damit beschäftigt will ich mal sagen. Und diesen Rohdaten-, Rohmaterialaspekt und auch den Aspekt, den eigenen Forschungsprozess offen zu legen, das ist glaube etwas, wo wir noch sehr am Anfang stehen.

Tim Pritlove
0:58:02
Pavel Richter
0:58:04
Tim Pritlove
0:58:50
Pavel Richter
0:58:58
Tim Pritlove
0:59:07
Pavel Richter
0:59:09
Tim Pritlove
1:00:14
Pavel Richter
1:00:17
Tim Pritlove
1:00:17
Pavel Richter
1:00:19
Tim Pritlove
1:00:36
Pavel Richter
1:01:13

Und was wir halt hier sehen ist, dass ein zentraler, ich würde jetzt gar nicht mal sagen, eine gemeinnützige Stiftung, sondern ich würde sagen, ein zentraler Forschungsförderer einen bestimmten Ansatz sehr massiv pusht, nämlich einen Ansatz des Sharing, einen Ansatz des Rohdaten zur Verfügungstellens, weil dahinter die Überzeugung steht, dass die Probleme, die wir lösen wollen, zu groß sind, um von einem einzelnen Forscher, einem einzelnen Forscherteam gelöst zu werden. Und dass wenn ich Rohmaterialen zur Verfügung stelle, wenn ich Daten zur Verfügung stelle, Menschen damit faszinierende Dinge tun. Sie kombinieren, sie auf eine neue Art und Weise auswerten, neue Fragestellungen an sie anlegen. Und die Daten sind aber dann da, was ich mit ihnen mache, das ist dann der kreative und der neue Prozess. Und ich halte das für einen sehr guten Ansatz. Das ist natürlich sehr radikal. Das kann man sich natürlich auch dann leisten, wenn man der weltweit größte Geldgeber in diesem Bereich ist. Aber ich verstehe nicht, warum die deutsche Forschungsgesellschaft Gelder vergibt, ohne ähnliche Anforderungen zu stellen. Das sind schließlich öffentliche Mittel, die hier vergeben werden, und mindestens mal da, wo mit öffentlichen Mitteln gefördert wird, sollte die Offenheit der Default sein. Dass es natürlich Realitäten im Wissenschaftsbetrieb gibt, was die Auswertung von solchen Daten angeht und auch die eigene Karriere, die davon natürlich abhängig ist, das darf man nicht ignorieren, da muss man den Realitäten des Wissenschaftsbetriebs hier auch realistisch gegenüber treten. Aber die grundsätzliche Forderung muss aus meiner Sicht ganz klar sein, dass wenn etwas aus öffentlichen Mitteln gefördert wird, dann muss nicht nur das Ergebnis, sondern auch der Weg dorthin und das Rohmaterial, die Rohdaten frei zur Verfügung stehen.

Tim Pritlove
1:03:07
Pavel Richter
1:03:38
Tim Pritlove
1:03:50
Pavel Richter
1:03:52
Tim Pritlove
1:03:53
Pavel Richter
1:03:59
Tim Pritlove
1:04:13
Pavel Richter
1:04:16

Ja beide gleich alt. Und wurde gegründet von Rufus Pollock, der bis ich jetzt die Geschäftsführung übernommen habe, eben auch der Leiter der Organisation war. Und hat zunächst mal die Grundlagen mutgeschaffen. Insbesondere geschaffen mit einer damals noch relativ kleinen und diffusen Community, die sich mit dem Thema Open Data überhaupt beschäftigen wollte. Über die OpenDefinition.org überhaupt erst mal zu erklären, was Open Data und was Openess bedeutet. Softwaregrundlagen zu schaffen, die erlauben, Daten frei zu publizieren. CKAN ist hier das Stichwort, auf dem mittlerweile die meisten der großen Datenportale, wie Data.gov oder Data.gov.uk laufen. Ganz viel Grundlagenarbeit wurde da gemacht. Und dann ging es auch wieder parallel zur Entwicklung dieser – kann man Bewegung sagen? - dieser Community rund um das Thema Openess und Open Data ging es darum, Daten zu befreien, liberate Data. Also insbesondere von staatlichen Akteuren zu fordern, gebt die Daten frei. Sorgt dafür, dass Daten, die ihr sowieso schon habt, frei und maschinenlesbar zur Verfügung gestellt werden. Dieses Öffnen von Daten, dieses Befreien von Daten spielte eine enorme Rolle. Zum einen weil es natürlich kampagnenfähig ist, du kannst das gut erklären, und du kannst auch öffentlichen und politischen Druck ausüben, dass diese Daten frei sein sollen. Weil es aber eben auch grundsätzlich richtig ist, vom Staat zu fordern, dass wenn es keine Notwendigkeit gibt, Daten nicht offen zu halten, nicht zu öffnen, dass sie dann gefälligst offen sein sollten. Denn es ist ja nicht so, dass diese Daten nicht früher schon verfügbar waren, nur meistens eben gegen Geld, was zum Beispiel Konzernen wie Google völlig egal ist. Die zahlen dann halt ein paar hunderttausend Euro im Jahr, um Zugriff auf Katasterdaten zu bekommen oder um Zugriff auf andere Informationen. Aber es sind gerade die kleinen, die zivilgesellschaftlichen Akteure. Es sind gemeinnützige Organisationen, das sind Aktivisten und Journalisten, die eben diese finanziellen Mittel nicht haben, auf diese Daten zuzugreifen. Also Datenbefreiung war und ist auch immer noch eine ganz zentrale Forderung. Ich sehe allerdings, insbesondere seitdem ich jetzt, ich bin jetzt seit 1,5 Jahren bei Open Knowledge International, in dieser Zeit sehe ich mehr und mehr einen Paradigmenwandeln, Paradigmenwechsel wäre jetzt zu groß gesprochen, aber hier verschiebt sich gerade etwas auf eine ganz interessante Art und Weise. Nämlich dass Offenheit an sich nicht als Wert gesehen wird. Also offene Daten ändern nichts. Wenn ich einen Datensatz öffne, passiert erst mal nichts. Der ist dann erst mal da, der ist offen. Und dann hat sich aber noch nichts verbessert irgendwo, sondern ich habe einen offenen Datensatz. Und den Wandel, den ich sehe und den wir auch als Organisation aktiv vorantreiben wollen, ist, dass es vielmehr um die Nutzung und die richtige und die gute Nutzung von offenen Daten geht. Also wir können nicht jahrelang Kampagnen fahren und die Freiheit von Daten fordern und dann, wenn sie da sind, passiert nichts damit. Wir müssen also dafür sorgen, dass diese Daten genutzt werden. Und zwar genutzt werden in einer Art und Weise, die tatsächlich dazu führt, dass es Menschen besser geht. Also die eine direkte Auswirkung auf unsere Gesellschaft haben, auf Gesellschaft in der ganzen Welt haben. Weswegen wir also unsere zentrale Aufgabe als Organisation darin sehen, andere zivilgesellschaftliche Organisationen, die sich um die Umwelt kümmern, die sich um die Rechte von Minderheiten kümmern, die sich um Menschenrechte kümmern, die sich um Medizinthemen kümmern, dass wir solchen zivilgesellschaftlichen Organisationen dabei helfen, offene Daten gewinnbringend für sie sinnvoll einzusetzen. Ihnen dabei zu helfen, überhaupt zu verstehen, was Open Data ist, und dann zu schauen, wie Open Data ihnen helfen kann, tatsächlich einen positiven Impact, einen positiven Einfluss auf das Leben von Menschen zu haben. Ein konkretes Beispiel, Projekt, das wir jetzt gerade hier während des World Health Summit letzte Woche in Berlin öffentlich gemacht haben, Open Trials, Open Trials ist ein Projekt, in dem wir alle Informationen zusammentragen und verlinken und strukturieren, die weltweit zu pharmazeutischen Tests vorliegen. Also zu den Tests, die man machen muss, wenn man ein neues Medikament entwickelt.

Tim Pritlove
1:08:54
Pavel Richter
1:08:54

Für die Zulassung. Die sind weit verstreut diese Daten. Wir führen die in einer Datenbank zusammen, aber wir reichern sie eben auch noch an um Informationen, die sonst nicht vorhanden sind. Zum Beispiel, wenn ich einen solchen sogenannten Trial mache, einen solchen pharmazeutischen Test, dann muss ich die Testsubjekte, also die Patienten, die sich beteiligen, muss ich ausführlich informieren. Das passiert mit Dokumenten, die ich diesen Patienten vorher aushändige, und wir wollen diese Dokumente zur Verfügung stellen, zusammen mit dem jeweiligen Testergebnis. Wir wollen aber eben auch die zugrundeliegenden Daten, wenn wir sie denn bekommen veröffentlichen. Wir wollen also dafür sorgen, dass es sehr viel transparenter wird, woran gerade in der pharmazeutischen Industrie geforscht wird, welche Zulassungsverfahren gerade laufen und was die Ergebnisse dieser Tests sind. Das ist kein Nischenthema. Sondern beim letzten großen Ebola-Ausbruch im südlichen Afrika war es enorm wichtig für Hilfsorganisationen on the ground für Hilfsorganisationen vor Ort zu wissen, welche Medikamente zu Ebola werden jetzt gerade getestet, wer arbeitet woran? Was sind die Fragestellungen und wie kommt man in die Programme rein. Und diese Informationen frei und strukturiert zur Verfügung zu machen. Das ist eine Form von technischer Dienstleistung, die wir erbringen, indem wir eine Datenbank programmieren und eine Webseite und Crawler, die diese Daten aus den einzelnen Datenbanken der Registrierungsbehörden weltweit ausliest und bei uns einliest. Das ist also eine technische Dienstleistung, die aber eben nicht mehr nur zum Ziel hat, diese Daten irgendwie mal offen zu machen, sondern wir arbeiten mit Ben Goldacre von der Universität Oxford zusammen, wo es dann tatsächlich um die Nutzung dieser Daten geht. Um die Frage, wie kann die Forschung, wie können zivilgesellschaftliche Akteure diese Daten nutzen. Und diesen Nutzungsaspekt für uns als Organisation spielt heute eine größere Rolle als es früher der Fall war. Weil eben wir mittlerweile nicht mehr nur für die offenen Daten kämpfen müssen, sondern wir müssen auch zeigen, welche Kraft und welcher Nutzen in diesen Daten liegt.

Tim Pritlove
1:11:12
Pavel Richter
1:11:16

Ja genau. Und da kommt halt unsere Expertise als Organisation, wir stellen die als Dienstleistung zur Verfügung. Um mit Organisationen, die überhaupt keine Ahnung von Open Data haben, die vielleicht gar nicht wissen, dass Open Data für sie etwas interessantes sein kann, ihnen dabei zu helfen, das herauszufinden, ob und wie gegebenenfalls offene Daten ihnen helfen können. Global Witness ist ein schönes Beispiel dafür. Global Witness hat eine große Kampagne gestartet, da geht es um den Handel von Jade, ein weltweit hochkorrupter milliardenschwerer Markt. Und anstatt sich nur auf veröffentlichte Quellen, auf journalistische Quellen zu stützen, hat Global Witness von Anfang an großen Wert auf die Auswertung von Datenbanken, von Handelsregistern, von Bilanzen, von Antikorruptionsregistern gesetzt. Und unter anderem mit unserer Hilfe dafür gesorgt, dass hier Netzwerke plötzlich sichtbar wurden im internationalen Jadehandel. Die ohne das Wissen über die Verwendbarkeit und über die Nutzbarmachung von Open Data so nie zustande gekommen wären und so nie sichtbar geworden wären. Und Global Witness hätte vor diesem Projekt gar nicht an das Thema Open Data gedacht. Jetzt haben sie mittlerweile eigene Stellen geschaffen, sie haben also ihre eigene Expertise zum Thema Open Data aufgebaut, nachdem wir initial da mithelfen konnten, können sie das mittlerweile sehr gut alleine. Und das ist ein gutes Beispiel dafür, dass sich auch die Nutzung von Daten dahingehend demokratisiert, dass es etwas ist, was nicht mehr nur eine Spezialität von einigen wenigen ist. Gab ja ganze Berufsfelder, Data Analysts oder Data-Typisten gab es früher auch nochmal bei uns, aber dass heute der Umgang mit Daten und auch mit offenen Daten eine Grundlagenkenntnis ist. Die sehr viel mehr Berufen und Organisationen bedarf, als es früher noch der Fall war.

Tim Pritlove
1:13:20
Pavel Richter
1:14:15
Tim Pritlove
1:14:26
Pavel Richter
1:14:29
Tim Pritlove
1:14:31
Pavel Richter
1:14:36
Tim Pritlove
1:15:33
Pavel Richter
1:15:35
Tim Pritlove
1:15:36
Pavel Richter
1:16:06

Absolut. Insbesondere, es gibt ja mehrere Tools, die den Status von Open Data weltweit messen. Es gibt das Open Data Barometer von der World Wide Web Foundation. Es gibt den Global Open Data Index von uns, von Open Knowledge. Es gibt noch eine Reihe von spezialisierten Indizes, die diesen State of Openess, wie wir im Englischen sagen, also wie offen sind die Daten einer Gesellschaft, weltweit messen und auch in Ranglisten stecken. Das Interessante ist, dass es einen bestimmten Datensatz gibt, der in fast keinem Land wirklich frei zugänglich ist und das sind Firmenregister. Also Register, in denen drin steht, wem gehört eine Firma. Bei uns ist das das Handelsregister. Die Daten des Handelsregisters sind nicht frei zugänglich. Natürlich kann ich auf der Webseite etwas abrufen. Aber dass ich eine Auswertung über die Handelsregisterdaten machen kann, über alle Handelsregisterdaten in Deutschland, quasi unmöglich. Es gibt diesen Zugang nicht. Und das gilt für fast alle Gesellschaften weltweit. Das ist nicht zufällig so. Denn darin verbirgt sich eine enorme globale Sprengkraft. Nämlich es ist heutzutage so einfach, Firmen weltweit zu gründen und verschachtelte Firmenkonstrukte zu schaffen, die es quasi unmöglich machen, festzustellen, wem gehört eine Firma eigentlich wirklich? Die gehört dann immer noch einer anderen Firma, die irgendeiner anderen. Aber wer ist derjenige, der am Ende des Tages diese Firma kontrolliert? Und da steht am Ende immer ein Mensch, der das ist. Und ich glaube, hier wird schon deutlich, welche Sprengkraft in diesen Datensätzen liegen würde, wenn es uns gelingen würde, diese Daten weltweit miteinander zu vernetzen. Um plötzlich rauszufinden, dass ein Unternehmen, dass in Nassau auf den Bahamas registriert ist, das gehört einer Firma, die auf den Philippinen registriert ist und so weiter. Aber irgendwann, und das ist eben das Schöne auch an großen strukturierten Datensätzen, irgendwann komme ich ans Ende dieser Kette. Und natürlich dahinter steckt eine enorme Sprengkraft, weil es auch Firmengeflechte aufzeigen würde und Korruptionen aufzeigen würde, die wir uns heute so noch gar nicht vorstellen können.

Tim Pritlove
1:18:28
Pavel Richter
1:19:03
Tim Pritlove
1:19:52
Pavel Richter
1:20:06

Absolut. Aber dass das so nicht ist, liegt ja nicht daran, dass die Politik das nicht versteht oder sich nicht dafür interessiert. Das wäre glaube ich ein naiver Blick auf Politik. Das gibt es nicht, weil es Interessen gibt, die das verhindern. Es gibt Menschen und es gibt Gruppierungen und es gibt Mächte, das klingt jetzt fast ein bisschen verschwörungstheoretisch, aber man darf immer nicht so tun, als wenn es nur Freunde der Openess gäbe. Es gibt Menschen, die sich von dieser Art von Transparenz, auch wenn ich den Begriff eigentlich nicht mag, also von dieser Art von Offenheit, massiv bedroht fühlen, weil sie ihre Geschäfte besser machen, wenn Informationen über sie nicht verfügbar sind. Und da steckt viel Geld dahinter und viel Macht und viel auch schwarzes Geld und dunkle Macht, dass es kein Zufall ist, dass genau diese Informationen nicht frei sind. Also Wetterdaten werden wir sehr viel schneller freikriegen als Handelsregisterdaten. Dabei liegt es natürlich im Interesse der Staaten selbst, dass diese Informationen miteinander verknüpft werden, denn das sind ja Dinge, die ein einzelner staatlicher Akteur heute gar nicht mehr leisten kann. Welches deutsche Finanzamt ist denn dafür zuständig, globale Firmengeflechte aufzubereiten? Keins. Aber wenn diese Daten zur Verfügung stehen und sich journalistische, zivilgesellschaftliche Organisationen oder einfach auch nur ein paar Aktivisten damit beschäftigen, dann ist da eine Leistung plötzlich möglich, die staatliche Akteure überhaupt nicht in der Lage sind, zu erbringen. Und damit zum Beispiel ließen sich natürlich Steuervermeidungen ganz anders angehen. Die Frage, wo zahlt Apple eigentlich Steuern, wo zahlt Facebook steuern, wo zahlt McDonalds steuern? Das ist ja erst einmal einfach auch ein Informationsproblem, wir wissen das ja gar nicht. Es ist nicht so einfach rauszukriegen, weil auch diese Daten nicht frei zugänglich sind. Und dabei sollte eigentlich der Staat ein großes Interesse daran haben, diese Informationen strukturiert zugänglich zu haben, um zum Beispiel faire Steuergesetze zu verabschieden.

Tim Pritlove
1:22:17
Pavel Richter
1:22:21
Tim Pritlove
1:22:23
Pavel Richter
1:22:49
Tim Pritlove
1:23:38
Pavel Richter
1:23:43
Tim Pritlove
1:24:29
Pavel Richter
1:24:30
Tim Pritlove
1:24:43
Pavel Richter
1:24:49
Tim Pritlove
1:25:51
Pavel Richter
1:26:02
Tim Pritlove
1:26:37
Pavel Richter
1:26:40
Tim Pritlove
1:26:41
Pavel Richter
1:26:47
Tim Pritlove
1:27:39
Pavel Richter
1:27:46
Tim Pritlove
1:29:06
Pavel Richter
1:29:31
Tim Pritlove
1:31:12
Pavel Richter
1:31:56

Also wir als Organisation haben damit in Deutschland … es ist nicht unser Thema. Wir sind tatsächlich da sehr fokussiert auf Open Data als auch technische Dienstleistung. Aber nicht zuletzt aus meiner Zeit bei Wikimedia Deutschland, da habe ich durchaus eine Position zum Thema. Open Educational Ressources oder wie man auf deutsch auch sehr schön sagen kann, freie Lehr- und Lernmaterialien. Und ich halte das für … ich war am Anfang sehr skeptisch, als der zuständige Mitarbeiter bei Wikimedia Deutschland dieses Thema gepitcht hat bei mir und gesagt hat, hier damit müssen wir uns beschäftigen. Da war ich sehr kritisch, hielt das nicht für sonderlich zukunftsfähig. Hielt so ein bisschen für so ein Modethema. Alle reden jetzt über OER und so. Da habe ich meine Meinung geändert, nicht zuletzt, weil zum Beispiel das Bundesbildungsministerium da ziemlich viel Geld reinsteckt in das Thema, was für ich ein guter Indikator ist, dass dahinter tatsächlich auch ein politischer Wille steht, da tatsächlich sich auch politisch mit zu beschäftigen. Ich finde es, um auch ein bisschen zum Anfang des Gesprächs zurückzukommen, unter den Gesichtspunkten der Lernerfahrung, was mit der Wikipedia passiert ist, finde ich das in zweierlei Hinsicht ein extrem spannendes Thema. Zum einen wenn ich ein Schulbuch Verlag wäre, würde ich mir sehr sehr ernsthaft Gedanken über mein zukünftiges Geschäftsmodell machen. Also Bücher in regelmäßigen Neuauflagen in Klassensatzstärke zu Festpreisen zu verkaufen, wäre ich mir nicht so sicher, dass das allzu lange noch hält. Wenn es sich tatsächlich durchsetzt und mehr und mehr durchsetzt, Lehr- und Lernmaterialien unter freier Lizenz selber zu erarbeiten. Aber dieser Geschäftsaspekt ist der uninteressantere. Das ist das was Brockhaus erlebt hat und dann war Brockhaus eben nicht mehr da, weil das Geschäftsmodell weggebrochen ist. Das ist nicht mein Problem, das ist das Problem der Schulbuchverlage. Viel spannender finde ich den Aspekt, dass hier eigentlich ein uraltes humboldtsches Bildungsideal der Gemeinschaft der Lehrenden und Lernenden wieder aufleben wird. Was für eine Schule ist das, in der Schüler ihre Lehrmaterialien selber erarbeiten in einem Prozess. Wir alle wissen, dass wir so viel mehr lernen, als wenn wir ein Buch aufschlagen und einfach Sachen lesen. Hier geht es wieder um den Prozess der Wissensaneignung und der gleichzeitig der Prozess der Wissenserstellung ist, der Wissenssammlung ist. Und das ist das was Wikipedia als kulturelles Prinzip so toll vorlebt. Und ich glaube das ist da wo der große Wert und die große Stärke von Open Educational Ressources, freien Lehr- und Lernmaterialien liegen kann, dass hier tatsächlich Lehrerinnen und Lehrer und Schülerinnen und Schüler gemeinschaftlich an Lehrmaterialien arbeiten. Und zwar kontinuierlich. So wie die Enzyklopädie nie fertig werden wird, wird auch das Mathematikbuch der Zukunft nicht fertig sein.

Tim Pritlove
1:34:43
Pavel Richter
1:34:58

Erst mal glaube ich nicht, dass das etwas ist, was alle machen werden. Erst mal hat das natürlich auch mit Leistungsfähigkeiten zu tun und auch mit eigenen Entwicklungsständen. Ein Zweitklässler wird da sicherlich ganz andere Möglichkeiten haben als jemand, der in der 12. Klasse des Gymnasiums ist. Und wahrscheinlich wird es auch hier so sein, dass sich ähnlich wie bei der Wikipedia so eine gewisse Gruppe von Schülerinnen und Schülern und Lehrerinnen und Lehrern, die darf man in dem Zusammenhang überhaupt nicht vergessen, aber eben auch von Pädagogen von Wissenschaftlern an pädagogischen Hochschulen, dass sich dort eine Gruppe zusammenfindet, die diesen Prozess moderiert und diesen Prozess vorantreibt und dann wird es immer wieder Menschen geben, die dazu beitragen. Und sei es durch ihr pädagogisches Wissen oder sei es durch ihr Fachwissen. Wobei das Fachwissen in den meisten Schulbüchern ja gar nicht der zentrale Punkt ist, sondern hier der Schwerpunkt in Schulbüchern auf der pädagogischen Aufbereitung liegt. Ich finde die Vorstellung, dass eine Schule ein Ort ist, an dem Schüler und Lehrer gemeinsam ihren Stoff erarbeiten und gemeinsam an ihren Schulbüchern arbeiten, soll man nicht in der Schule das Lernen lernen, anstatt das Wissen zu lernen? Und ist das nicht eigentlich ein toller Lernprozess, sich dieses Wissen zu erarbeiten und ist das nicht sehr viel auch nützlicher und nutzbarer in einer Arbeitswelt, in der es nicht darauf ankommt, dass ich in meiner Ausbildung mal etwas gelernt habe, sondern in der ich tatsächlich mir ständig Wissen selber erarbeiten und anlernen und erarbeiten muss aus unterschiedlichsten Quellen. Also ich halte hier Open Educational Ressources beileibe nicht für irgendein modisches Schlagwort, sondern für etwas was das Potenzial hat, einen Bildungsprozess sehr radikal zu verändern. Unter Anleitung und unter Einbeziehung von Pädagogen, von Fachleuten, von Wissenschaftlern. Das ist also hier kein Plädoyer für „das kann ja jeder“, so wie jeder Kunst kann. Nicht jeder kann Schulbücher schreiben. Und es ist eine hohe pädagogische Kunst und da braucht man Erfahrung und Wissen und know-how, aber dieses sollte meines Erachtens eben in den Prozess gesteckt werden und weniger in das Produkt. Ein bisschen wie auch in der Wissenschaft, wo das Produkt vielleicht mehr und mehr hinter den eigentlichen Entstehungsprozess zurücktritt oder daneben mal mindestens tritt.

Tim Pritlove
1:37:25
Pavel Richter
1:38:45

Vielleicht steckt da mehr Hoffnung als Realität dahinter. Aber ich glaube, wir werden in absehbarer Zeit einen Dammbruch erleben, was die Verfügbarkeit von Daten angeht. Wir sehen das jetzt teilweise schon in bestimmten Bereichen, in denen eine Unmenge an Daten bereits vorhanden ist. Budgetdaten sind so ein gutes Beispiel. Die sind relativ offen weltweit. Und ich glaube, das wir dort Dominosteine fallen sehen. Wenn da erst mal jemand anfängt und damit Erfolg hat, wird sich dieses Open by default sehr viel schneller durchsetzen. Ist eine Frage dann, wie schnell zum Beispiel Deutschland dabei ist. Aber ich hoffe und ich sehe dort einen Dammbruch auf uns zukommen. Das wird uns Dinge ermöglichen, die wir uns heute nicht vorstellen können. Denn das ist ja das Tolle an Openess im Generellen. Dass es einfach Möglichkeitsräume öffnet und wir keine Ahnung haben, wer die mal nutzt. Sei es wirtschaftlich, sei es politisch, sei es in der Forschung, welche Konsequenzen das hat und welche Möglichkeiten sich dadurch auftun. Nebenbei durchaus auch negative Konsequenzen und negative Möglichkeiten. Man kann ja mit offenen Daten auch Schindluder treiben, man kann ja auch schlimme Dinge damit tun. Es ist ja nicht alles rosig, nur weil es offen ist. Deswegen wird also glaube ich sich der Fokus für uns, die wir uns mit dem Thema Openess und Open Data beschäftigen, von der Befreiung zur Nutzung ganz klar verschieben müssen. Und hier müssen wir wieder und wieder demonstrieren, dass Offenheit im Allgemeinen und bei Daten einen enormen gesellschaftlichen Nutzen haben kann und haben muss, das zu beweisen steht für uns quasi als nächstes an. Wir behaupten das und in einigen wenigen Bereichen können wir es schon zeigen. Aber da fehlt uns ganz sicherlich noch der große Durchbruch. Und deswegen sehe ich hier für die Zivilgesellschaft in der Pflege, Use Cases zu finden, zu zeigen, hier das kann man damit machen, das haben wir konkret bewirkt. Und da sehe ich unsere große Chance. Die Bereiche, in denen das der Fall sein wird, da bin ich ein gebranntes Kind. Ich glaube da sollten wir, die wir uns mit dem Thema Open Data oder Openess als Prinzip beschäftigen, sollten wir sehr zurückhaltend sein. Im Englischen gibt es das schöne Wort humble, also sich selber zurücknehmen und gar nicht glauben, dass wir wissen können, wo das zukünftige Potenzial von Openess und Open Data liegt, sondern das wissen zivilgesellschaftliche Akteure, das wissen Aktivisten, das wissen Journalisten, die sich mit bestimmten Themen, von LGBT-Rights zu Gesundheitsthemen. Von Menschenrechten bis zu Umweltthemen, das sind die Organisationen die viel besser als wir wissen, wo der größtmögliche Nutzen liegt und dann ist es unsere Aufgabe zu schauen, ob und wenn ja wie und welche Rolle Openess und Open Data da spielen kann. Wir sollten nicht so vermessen sein, weil wir uns mit Open Data und Openess als Prinzip, dass wir deswegen wüssten, wo die besten Anwendungsfälle sind. Da müssen wir und wir auch als Organisation, als Open Knowledge International, nehmen uns da gerade zurück und sehen uns mehr als Wissensvermittler und Dienstleister für diejenigen, die sich mit den eigentlichen Themen, die die Menschheit bewegt, besser auskennen als wir. Denn Open Data an sich erst mal verändert die Welt nicht, die Welt wird von Menschen verändert. Und wie sie dazu Openess und Open Data verwenden können, das müssen sie selber entscheiden. Mit unserer Hilfe und unserer Expertise, aber sie müssen das selber entscheiden.

Tim Pritlove
1:42:58
Pavel Richter
1:43:31

Ja wir starten gerade ein neues Projekt namens Next Geos. Ein EU-weites Projekt, wo es um die Nutzung von Geodaten geht. Und das ist ein hochakademischer Bereich, in dem wir dort tätig sind. Open Trials im Bereich der pharmazeutischen Forschung und der medizinischen Forschung. Denn ganz oft geht es ja hier auch um das Strukturieren großer Datensätze. Also um nochmal das Beispiel mit Open Trials, also der Datenbank für klinische pharmazeutische Tests, hier geht es ja nicht nur darum, dass das Aktivisten vor Ort nutzen können, sondern wenn wir zum Beispiel den gleichen Test in drei verschiedenen Datenbanken finden und zusammenführen, dann können wir eine Qualitätskontrolle machen, ob überall die gleichen Informationen drin stehen oder ob da einfach Fehler drin sind. Das heißt es geht hier um die Anreicherung, die qualitative Verbesserung von Datensätzen, was wiederum der Forschung unmittelbar zugute kommt. Wenn hier Mechanismen aufgebaut werden, die Datenqualität erhöhen und die Datenstrukturierung ermöglichen. Dann ermöglicht das bessere Forschung. Deswegen ist das also nicht nur ein reines Aktivistenthema, sondern die Aufbereitung und Präsentation und Zugänglichmachung von großen Datensätzen kann bessere Forschung ermöglichen. Man kann besseren wissenschaftlichen Zugang ermöglichen. Außerdem ermöglicht insbesondere das Zurverfügungstellen von offenen Daten, die die Grundlage von Forschung sind, führt einfach zu einer enorm deutlich verbessertes Effizienz. Warum, wenn Daten einmal vorhanden sind, warum müssen sie nochmal erhoben werden, nur weil jemand anderes von einer anderen Universität sie verwenden will. Das ist ein Gemeingut, das eigentlich frei zur Verfügung stehen sollte. Was enorme auch finanzielle Möglichkeiten für Universitäten plötzlich gibt. Diese Daten wären kaum verkäuflich, kaum wirtschaftlich nutzbar machen. Und das ist ja auch nicht die Aufgabe des Wissenschaftsbetriebs. Aber es würde durch die freie Verfügbarmachung im globalen Maßstab würde es zu enormen Einsparungen in der Erhebung von Daten führen. Weil einfach Doppelerhebungen und Dreifacherhebungen und Vierfacherhebungen nicht mehr stattfinden würden. Un der letzte Aspekt, den ich im Wissenschaftsbereich sehe, vielleicht ist das ein bisschen zu klischeehaft gedacht, wie Wissenschaft früher war, aber dass eben der Entstehungsprozess von wissenschaftlicher Forschung und Forschungsergebnissen und deren Grundlagen sehr viel transparenter werden in Zukunft, als das in der Vergangenheit der Fall war. Und diese Form von mehr Offenheit auch wiederum mehr Möglichkeiten bietet. Welche Möglichkeiten das sind und wie diese genutzt werden, das kann nur der Wissenschaftsbetrieb und die wissenschaftlichen Abläufe für sich selber ermöglichen. Auch hier gilt, dass Offenheit erst mal nur ein Enabler ist, ein Möglichmachen, ein Zurverfügungstellen. Die Nutzung ist dann eine Frage, die den wissenschaftlichen Fachdisziplinen obliegt.

Tim Pritlove
1:46:36
Pavel Richter
1:47:11
Tim Pritlove
1:48:30
Pavel Richter
1:49:14
Tim Pritlove
1:49:21
Pavel Richter
1:49:23
Tim Pritlove
1:50:10
Pavel Richter
1:50:12
Tim Pritlove
1:51:08
Pavel Richter
1:51:59
Tim Pritlove
1:51:59
Pavel Richter
1:52:18
Tim Pritlove
1:52:20