Transkript

Tim Pritlove
0:00:43

Hallo und herzlich willkommen zu Forschergeist, dem Podcast des Stifterverbands für die deutsche Wissenschaft. Mein Name ist Tim Pritlove und ich begrüße alle zur 95. Aussage unserer Gesprächsreihe, in der es heute mal etwas digitaler zugehen wird. Hatten natürlich auch hier eine Menge digitale Themen schon. Heute geht es ein bisschen ans Eingemachte, jetzt wollen wir mal so ein bisschen schauen, wie wir denn so die aktuellen Herausforderungen angehen können, die sich insbesondere durch die hohe Verfügbarkeit von Daten auf der einen Seite und dem hohen Bedarf an Datenschutz und natürlich auch Privatsphäre so ergeben. Ja und dazu begrüße ich erst mal meinen Gesprächspartner, nämlich Hendrik Ballhausen, hallo.

Hendrik Ballhausen
0:01:25

Hallo, danke für die Einladung.

Tim Pritlove
0:01:27

Ja, herzlich willkommen bei Forschergeist. Hendrik, du bist bei, ja, du bist an der Universität, der LMU, der Ludwig-Maximilian-Universität München.

Hendrik Ballhausen
0:01:40

So ist das.

Tim Pritlove
0:01:42

Im medizinischen Bereich oder?

Hendrik Ballhausen
0:01:43

Ja, das ist richtig. Ich bin eigentlich selbst gar kein Mediziner, aber auf verschlungenen Wegen bin ich da gelandet.

Tim Pritlove
0:01:50

Du bist also jetzt in der Medizin, in welcher offiziellen Bezeichnung?

Hendrik Ballhausen
0:01:57

Tagsüber, wofür ich bezahlt werde, ich leite die Forschungsverwaltung an der medizinischen Fakultät der LMU. Das heißt, sowohl für den klinischen Bereich wie auch für den vorklinischen Bereich und helfe da letztlich unserem Dekan, unserem Forschungsdekan bei allen Fragen, die die Forschung in irgendeiner Weise berühren.

Tim Pritlove
0:02:15

Aber du bist kein Mediziner?

Hendrik Ballhausen
0:02:18

Das ist richtig.

Tim Pritlove
0:02:19

Sondern?

Hendrik Ballhausen
0:02:20

Bin einer dieser klassischen Physikerallzweckwaffen, die auf verschlungenen Wegen da hingekommen sind.

Tim Pritlove
0:02:22

Aha so einer. Okay. Und wie verschlungen waren denn die Wege? Also was nimmt man denn da für eine Weg, um dann dort zu landen?

Hendrik Ballhausen
0:02:33

Ja, nicht zu Hause nachmachen. Also ich kreise eigentlich immer schon in irgendeiner Form um die Universität, die Wissenschaft. Das fing an der Schule an, da hatten wir in Hamburg ein tolles Programm von der William-Stern-Gesellschaft, die haben Schülerinnen an die Uni geholt, das war so das erste Mal, dass ich mich in diesen Mikrokosmos verliebt habe eigentlich, ja.

Tim Pritlove
0:02:56

Was ist die William-Stern-Gesellschaft?

Hendrik Ballhausen
0:02:58

Die ist benannt nach einem jüdischen Gelehrten und das ist ein Zusammenschluss von Mathematik und Psychologiestudierenden, die Schülerinnen von Hamburger Schulen zusammenholen und dann tatsächlich am Wochenende mit denen Mathe machen. Das ist eigentlich keine gute Value Proposition???, würde man heutzutage sagen, Mathe tauschen gegen Wochenende, aber mir hat das gut gefallen und ich habe zum ersten Mal gemerkt, da gibt es eben eine Welt, wo man sich mit vielen spannenden Dingen beschäftigen kann. Ja und das hat mir sehr getaugt, da bin ich dann dabei geblieben.

Tim Pritlove
0:03:30

Und dann ist es auch gleich in ein Physikstudium gemündet?

Hendrik Ballhausen
0:03:34

/lacht/ Ja, auch da wieder, erst mal kam Jugend forscht, Mathe, Informatik, spannende Sachen damals, wir haben Computergrafik gemacht, was in den 90er Jahren ganz ein heißes Thema war, überhaupt natürlich noch nicht so wie heute, wo in jedem Spiel also die 3D-Grafik perfekt ist, sondern das waren wirklich noch die Anfänge. Und dann kam die erste Krise, der neue Markt im Jahr 2001 und dann habe ich mir überlegt, vielleicht ist es doch besser, was zu studieren, was ein bisschen mehr ja Substanz hat als die Informatik. Im Rückblick völlig falsche Entscheidung, aber damals war es richtig und dann sollte es halt Physik sein, Physik ist ja auch Mathematik, ist auch Informatik, aber handfester und ja, so bin ich dann nach Heidelberg gekommen und habe dort Physik studiert.

Tim Pritlove
0:04:25

Okay.

Hendrik Ballhausen
0:04:26

Eigentlich hätte es die USA sein sollen, aber ich habe Zivildienst gemacht, da unterliegt man der Kreiswehrerfassung und der Urlaub wurde abgelehnt, um sich in den USA zu bewerben. Ich habe dann noch mal gefragt, was passiert, wenn ich trotzdem ausreise. Dann hieß es, sie werden bei der Einreise in Frankfurt verhaftet und ja, so ist es dann Heidelberg geworden. Das war im Rückblick genau richtig.

Tim Pritlove
0:04:49

Okay. Und in Heidelberg war dann das Physikstudium?

Hendrik Ballhausen
0:04:51

Heidelberg war Physik, ja.

Tim Pritlove
0:04:52

Okay.

Hendrik Ballhausen
0:04:53

So richtig, wie man es sich vorstellt, Philosophenweg.

Tim Pritlove
0:04:56

Und dann denkt man doch eigentlich viel übers Universum nach oder?

Hendrik Ballhausen
0:04:59

Ja, vor allen Dingen auch, weil wir ja bei uns die Astrophysiker hatten ein Haus weiter.

Tim Pritlove
0:05:05

Spannender Standort Heidelberg auf jeden Fall.

Hendrik Ballhausen
0:05:07

Ja, er war das klein und das ganz große ganz nah beieinander.

Tim Pritlove
0:05:13

Aber dazu kam es nicht, keine astronomische Karriere?

Hendrik Ballhausen
0:05:15

Ja, da kam dann das Wissenschaftssystem dazu und wir haben uns eigentlich überlegt so gegen Ende der Promotion, dass wir uns das doch nicht antun wollen. Das waren so ein paar Freunde und wir haben gesagt, Physik finden wir super, aber so wie Wissenschaft an der Universität gemacht wird, finden wir es nicht so super. Dann sind wir alle woanders hingegangen. Ich habe dann noch schnell VWL drauf gesattelt, Volkswirtschaft und bin dann tatsächlich ein paar Jahre ganz aus dem Universitären verschwunden.

Tim Pritlove
0:05:44

Was hat dir denn nicht gefallen daran, wie die Wissenschaft an der Universität gemacht wird?

Hendrik Ballhausen
0:05:49

Ja, dass eigentlich extrem schlaue Leute, zu denen will ich mich jetzt gar nicht zählen, aber die beobachtet man ja, also Leute, die viel besser sind als man selber, die schon unglaublich Paper geschrieben haben, unglaublich was eingeworben haben, dass die eigentlich sehr lange bitten und betteln müssen, um das tun zu dürfen, was sie eigentlich am besten können und was ja eigentlich auch der Gesellschaft am meisten nutzt. Und dass das eigentlich so als Gnade gesehen wird, da arbeiten zu dürfen unter teilweise sehr schwierigen Bedingungen. Und da haben wir gesagt, nein, den Markt wollen wir nicht noch schlechter machen, indem wir hier noch zusätzliche Arbeitskraft anbieten. Sind dann ganz bewusst weggegangen, aber ist eine schwere Entscheidung, weil man liebt das Fach ja, man möchte ja eigentlich ganz genau das machen, aber man muss ja auch ehrlich vor sich selber bleiben.

Tim Pritlove
0:06:39

Was meinst du mit wir?

Hendrik Ballhausen
0:06:40

Ja, Freunde, Freunde, mit denen man dann zusammengesessen hat und überlegt hat, tun wir uns das jetzt noch an, wollen wir jetzt noch Postdoc-Phase machen? Der eine ist dann Lehrer geworden, viele sind in die Industrie gegangen oder in die Wirtschaft. Und insofern ich kenne noch ein oder zwei, die dabei geblieben sind und ja, die sind immer noch in der Ochsentour.

Tim Pritlove
0:07:03

Okay, aber dann gab es einen Ausflug in die Wirtschaft, der dann aber dann doch wieder zur Universität zurückgeführt hat.

Hendrik Ballhausen
0:07:07

Ja, ja, ein paar Jahre was ganz anderes gemacht, dann kam Bereich Finanzen, dann kam die Bankenkrise 2008/2010. Das war die nächste große Krise. Und dann habe ich gedacht, eigentlich war es doch an der Uni am schönsten und habe dann für mich diesen goldenen Mittelweg gefunden, nicht jetzt selber primär zu forschen, aber anderen dabei zu helfen, zu forschen. Und witzigerweise war dann plötzlich alles ganz einfach. Also Forscher sein ist schwer, Forschung verwalten ist einfach.

Tim Pritlove
0:07:41

Ist das so?

Hendrik Ballhausen
0:07:41

Ja, war mein Eindruck.

Tim Pritlove
0:07:43

Okay. Hat sich das bestätigt der Eindruck?

Hendrik Ballhausen
0:07:46

/lacht/ Naja, zumindest ist man die letzten zehn Jahre sehr gut zu mir gewesen.

Tim Pritlove
0:07:52

Okay. Gut, also letzten Endes bist du dann doch in der medizinischen Fakultät der LMU gelandet und wie hieß das, Forschungsverwaltung? Nein.

Hendrik Ballhausen
0:08:05

Das ist der trockene Titel, ja Forschungsreferent würde man wahrscheinlich sagen, wenn man dem Ganzen jetzt einen Namen geben wollte. Ich weiß gar nicht, ob meine Stelle eine offizielle Bezeichnung hat.

Tim Pritlove
0:08:15

Jetzt bist du aber dann sozusagen dann doch der Informatik wieder etwas näher gekommen.

Hendrik Ballhausen
0:08:22

Ja.

Tim Pritlove
0:08:24

Ist dann so eine späte Liebe in gewisser Hinsicht?

Hendrik Ballhausen
0:08:26

Ja, ich meine, ganz damit aufgehört hat man ja nie, wenn man Nerd ist, dann lässt man das nie ganz sein. Ich meine, das ist ja auch was, was man ständig gebrauchen kann. Also das habe ich in der Physik gebraucht, das habe ich in der Industrie gebraucht, in der Wirtschaft habe ich das gebraucht und in der Medizin heute brauchen wir es natürlich auch total dringend. Und deswegen der Weg nicht weit, dass ich mich auch um dieses Thema bei uns in der Fakultät ein bisschen kümmern sollte.

Tim Pritlove
0:08:54

Ist ja auch, Medizin ist ja auch eine so der ersten Disziplinen gewesen, die sich so im universitären Bereich mit der Informatik verheiratet haben. Also ganz zu Beginn gab es halt so die reine Informatik als Studium und später kamen dann halt diese ganzen Kombinationsstudiengänge dazu. Da war es auf der einen Seite so die Wirtschaft und auf der anderen Seite die Medizin, die eigentlich da so in der ersten Reihe stand.

Hendrik Ballhausen
0:09:22

Ist immer die Frage, wen man fragt. Also in Heidelberg gab es gar keine Informatik, da gab es Mathematik und da war völlig klar, Informatik ist angewandte Mathematik. Und wir haben im gesamten Studium keinen Computer gesehen. Es lief über Beweise. Wenn man die Statistiker fragt, an der LMU gibt es eine Fakultät für Mathematik, Informatik und Statistik, wenn man die Statistiker fragt, dann ist maschinelles Lernen alles Statistik. Und als Physiker würde ich natürlich sagen, dass die Physiker die ersten waren, die nach dem Zweiten Weltkrieg die ersten Computer verwendet haben und damit nie aufgehört haben, insofern könnte man auch behaupten, dass die Physik die ersten waren.

Tim Pritlove
0:10:03

Klar, hängt alles zusammen, aber in der Medizin hat sich natürlich dann, wie auch in der Wirtschaft, eben auch schnell gezeigt, okay hier gibt es praktische Anwendungen, hier kann man der Disziplin als solcher etwas neues hinzufügen und die ganze Domäne der Medizin noch mal ganz anders anschieben, jenseits aller biologischen medizinischen Erkenntnisse. Inwiefern ist das dann jetzt ein Thema für dich geworden?

Hendrik Ballhausen
0:10:31

Ja, auf der einen Seite die eigene Forschung, also das habe ich dann halt doch nicht ganz sein lassen, so wie die Kollegen halt bis abends ihre PatientInnen haben, habe ich halt bis abends meine Aktenmappen und nach Feierabend geht es dann ans Paperschreiben. Und auf der anderen Seite aber eben auch dadurch, dass ich mich für die Fakultät um diese Thema, man darf ja nicht Digitalisierung sagen, man muss ja digitale Transformation sagen, dass ich mich darum kümmern sollte und dann merkt man ja relativ schnell, dass es schon unheimlich viel gibt und man merkt auf der anderen Seite, dass es halt noch so ein paar Themen gibt, die wenig beachtet werden. Und was halt total, wo es total viel schon gibt, das ist halt alles, was irgendwie in die Richtung geht, Daten sammeln und Daten verarbeiten im weitesten Sinne. Das machen ja die Leute auch schon wirklich, wirklich lange. Und da, wo es halt jetzt gerade groß das Thema für alle ist, was jetzt neu kommt, das ist halt künstliche Intelligenz, das ist maschinelles Lernen. Und das, was noch gar nicht so da ist, das sind die Ansätze, die fragen, ja, wie wollen wir denn eigentlich mit den Daten wirklich umgehen? Wollen wir möglichst große Datensammlungen anlegen, wem gehören die Daten? Früher war völlig klar, die Daten, die gesammelt, erhoben werden, die gehören dem Arzt, die gehören dem Universitätsklinikum. Nur irgendwann später kam dann sozusagen, ja wir sollten den Patienten zumindest um Consent bitten, um Zustimmung bitten, dass uns diese Daten gehören dürfen. Ja und heute fängt man so langsam an zu fragen, gehören die Daten vielleicht eigentlich der Patientin zunächst mal, bevor der sie hergibt oder bevor sie sie vielleicht auch gar nicht hergeben möchte? Und die spannende Frage dann eigentlich ist auch, wer behält die Hoheit über diese Daten? Wer muss auch später noch irgendeiner Verwendung zustimmen?

Tim Pritlove
0:12:34

Wenn wir über die Daten reden, was für Daten meinen wir denn jetzt? Was ist denn so eigentlich der Datenbereich, der sich heute einem entgegenstreckt?

Hendrik Ballhausen
0:12:47

Ja, also in der Medizin ist das eigentlich immer ganz ähnlich. Das sind zunächst mal Daten, die die Patientinnen und Patienten beschreiben. Die Demographics. Also wie alt ist derjenige, wo kommt der her, körperliche Eigenschaften, von Größe über Gewicht, Geschlecht, etc. pp., Herkunft. Dann sind das Daten, die das akute Ereignis betreffen, also warum ist diejenige oder derjenige jetzt im Krankenhaus? Was hat der, Diagnosen. Und dann natürlich am Ende Aufzeichnungen über die Behandlung. Man möchte ja auch letztlich lernen, ein lernendes System haben, welche Therapieentscheidungen sind die richtigen. Und dann die berühmten Endpunkte. Wird der Tumor geheilt, gibt es eine Metastase, wird der Patient entlassen, kommt der wieder nach einer Woche? Das sind dann sozusagen die spannenden Endpunkte, auf die dann auch die meisten klinischen Studien gemünzt sind. Und man muss sagen, dass im Bereich der Medizin das formalisierte Format das sind die klinischen Studien. Das sind auch, sagen wir mal, die hochwertigen Daten, die unter wissenschaftlich strengen Gesichtspunkten gesammelt werden, wo die Fragestellung im Vorhinein festgelegt ist, die Endpunkte im Vorhinein festgelegt wird, wo man dann möglichst wenig „schummeln“ kann. Denn dieses explorative Suchen in großen Datenmengen, was ja beispielsweise heutzutage in der Wirtschaft sehr gern gemacht wird, ob es jetzt um online-Marketing geht oder wenn Salesforce analysiert, was sind gute Abläufe im Unternehmen, da wird ja zunächst mal in großen Datenmengen einfach gesucht, finden wir irgendein Muster. Und in der Medizin sind wir meisten oder sollten wir strenger sein und sollten eigentlich mit einer wissenschaftlichen Forschungsfrage rangehen und dann schauen, ob wir die tatsächlich in einer idealerweise doppelt verblindeten Studie oder wie auch immer verifizieren können.

Tim Pritlove
0:14:48

An der Stelle vielleicht kurze Anmerkung, Forschergeist Nummer 56 mit dem passenden Titel, die digitale Medizin, da hatte ich mich mit Sebastian Kuhn unterhalten, der ja im Prinzip auch genau das beklagt hat, dass eigentlich sehr viele Daten da sind so oder sehr viele Daten sich im Prinzip anbieten und dass es jetzt eigentlich der nächste Schritt für die Medizin sein müsste, mit denen halt irgendetwas anzufangen, einerseits, andererseits natürlich auch Apps, zum Beispiel zur, ja gar nicht mal nur zur Diagnose, aber auch zur Diagnose oder eben auch tatsächlich zur Behandlung für bestimmte Fälle oder als Therapiemaßnahme mit einzubringen, da haben wir eine relativ breiten Bogen gespannt. Jetzt ist natürlich klar, okay das Datenmaterial ist da, es ist, sagen wir mal, ganz klar das klassischen personenbezogene Datum, was man hier vorfindet. Und ich würde meinen, in der Wahrnehmung der Leute ist es so für sie so mit das persönlichste in gewisser Hinsicht. Also auch so gefühlt sind das Daten, die einem sehr nahe sind, im wahrsten Sinne des Wortes natürlich, wenn es um den eigenen Körper, die eigene Gesundheit geht, so dass große Vorbehalte existieren in diesem ganzen Bereich. Und man sieht ja auch, dass die ganzen Digitalisierungsmaßnahmen, die im Gesundheitssystem bisher vorgenommen wurden, nicht sonderlich erfolgreich waren. Also wir haben sehr schön gesehen jetzt in der Corona-Krise, wieviele Informationen nicht vorhanden sind. Man weiß nicht, wie sind die Leute geimpft, man hat keine große Erkenntnis über die Symptome etc.. Also nicht überall, aber an vielen Stellen hätte man sich ja quasi mehr gewünscht, als letztlich da war.

Hendrik Ballhausen
0:16:49

Ja, also ich glaube, das muss man wirklich differenziert sehen. Es ist richtig, dass man häufig sich wünscht, dass mehr ginge, aber es ist natürlich auch immer die Frage, zu welchem Preis? Die Corona-Krise ist ein Beispiel, wo man natürlich sich aufgeregt hat, dass vielleicht irgendwelche Gesundheitsämter Daten jetzt nicht ideal austauschen konnten, aber es ist zugleich auch ein Paradebeispiel für etwas, was sehr gut funktioniert hat. Beispielsweise diese Corona Warn App, die war ja ein Beispiel, dass jetzt Millionen Menschen in sehr sehr kurzer Zeit sich verschaltet haben und sich gegenseitig in einem, übrigens auch dezentralen Ansatz, gewandt haben. Ein anderes Beispiel, was jetzt in der Öffentlichkeit sicherlich nicht so wahrgenommen wurde, war, dass auch in dem sogenannten Netzwerk Universitätsmedizin, das ist also ein Netzwerk, das binnen, eigentlich man muss sagen, Tagen und Wochen nach Beginn der Krise aufgesetzt wurde, wo alle deutschen Universitätskliniker zusammenarbeiten, auch Datenplattformen geschaffen wurden, dass die wirklich universitätsmedizinischen Daten sehr viel besser, sehr viel schneller als zuvor ausgetauscht werden konnten. Also da ist auch wirklich viel geschehen, was man vielleicht von außen nicht sieht und dass wir nach letztlich einem Jahr eines völlig neuen Krankheitsbildes nicht nur zur Diagnostik, wir hatten ja ganz schnell auch Schnelltests, auch zuverlässige PCR-Tests, und dass dann nach einem Jahr im Prinzip eine Prophylaxe zur Verfügung stand und auch Therapieansätze, wenn man mal andere Erkrankungen sich anguckt, das war ja eigentlich jetzt bei aller Kritik, weil uns das alle sehr betroffen hat, das war ja eigentlich auch eine totale Erfolgsgeschichte.

Tim Pritlove
0:18:44

Im medizinischen Bereich auf jeden Fall, also ganz klar. Also allein die Entwicklung der Impfstoffe stellt ja auch an sich noch mal einen technologischen Durchbruch dar. Trotzdem bei der Bewertung der Pandemie, der Lage, der richtigen Einschätzung hätte man sich halt dann doch schon oft gerne auf detailliertere Daten gestützt. Aber das ist halt genau das Problem. In dem Moment, wo man mehr Daten möchte, erzeugt man natürlich eine ganze Menge Widerstand, der teilweise vielleicht berechtigt ist, teilweise vielleicht auch unnötig ist, weil es nicht wirklich in eine Privatsphäre eingreift, aber in diesem Spannungsfeld befindet man sich ja auf jeden Fall.

Hendrik Ballhausen
0:19:24

Also du hast ja eingangs auch ganz richtige Sachen gesagt. Also Gesundheitsdaten genießen ja auch vor dem Gesetz einen besonderen Schutzstatus. Du hast gesagt, das sind mit die sensibelsten Daten, die es gibt, das ist richtig. Zusammen beispielsweise mit jetzt Daten zum Beispiel über die sexuelle Orientierung, gehören die zum privatesten, was wir haben. Andererseits beobachtet man da natürlich auch eigentlich eine große Divergenz zwischen dem, was die Gesellschaft für wichtig hält und was der einzelne für wichtig hält. Interessanterweise, wenn man mit einzelnen Menschen spricht, dann haben die in der Regel oft gar keine große Scheu, ihre Daten zu teilen, wenn man ihnen richtig erklärt, wofür die da sind und ihnen auch erklärt, was mit den Daten geschehen wird. Häufig sind diese Daten ja auch dann interessant, gerade wenn sie über eine größere Menge von Menschen erhoben werden, und zumindest dann, wenn sie anonymisiert werden können und nur eigentlich in aggregierter Form, das heißt, dass man jetzt Summen bildet, dass man nicht über den Einzelnen mehr Datensätze hat, sondern dass man nur sagen kann, so und so viele Menschen in Summe haben jetzt dieses Merkmal. Dann wird das Problem auch sehr viel kleiner sehr schnell. Andererseits und das ist ja auch das Paradoxe, an anderer Stelle geben wir diese Daten ja sehr viel bereitwilliger her. Du hast Apps erwähnt, was unsere Smartphones über uns an Bewegungsprofilen, auch Sozialprofilen, ökonomischen Profilen sammeln, indem wir einfach nur wischen und uns gar nicht durchlesen, zu was wir da zustimmen, das ist Größenordnungen mehr als das, was sozusagen nach schriftlicher Information und Unterschrift in einem Universitätsklinikum vielleicht über mich gesammelt wird. Und vor allen Dingen natürlich auch mit einem ganz anderen Interesse gesammelt und verarbeitet wird für mich, nicht gegen mich. Muss man ganz klar sagen, da kommt jetzt der Ökonom in mir durch, je mehr ich über meinen Konsumenten weiß, desto mehr kann ich ihm sozusagen, desto näher komme ich an seinen Reservationspreis ran, desto mehr Wohlfahrt kann ich ihm wegnehmen. Das ist ja oft, dass wir heutzutage beobachten, wenn wir irgendwas kaufen, dass wir uns gar nicht mehr freuen, weil das Unternehmen so geschickt war, den Preis oder die Qualität der Ware so zu setzen, dass wir gerade noch bereit sind, das zu kaufen. Und gar nicht das Gefühl haben, wir hätten jetzt irgendwie ein riesengroßen Schritt nach vorne gemacht. Und das ist in der Medizin, muss man sagen, halt wirklich anders. Zumindest in der universitären Medizin, das sind ja öffentlich-rechtliche Einrichtungen, die keinen Profit machen, die haben in der Regeln wirklich ein wissenschaftliches Interesse. Und da das die Forschenden zum großen Teil auch Ärztinnen und Ärzte sind, die haben zuallermeist auch wirklich ein Interesse, dem Patienten, der Patientin zu nutzen.

Tim Pritlove
0:22:13

Was würdest du denn jetzt formulieren, was könnten denn jetzt Ziele sein? Was ist denn wünschenswert oder was ist sogar in der Medizin klar, dass man da auf jeden Fall hin möchte, auch wenn man vielleicht noch Probleme dabei sieht, wie man diese Ziele erreichen kann?

Hendrik Ballhausen
0:22:31

Also ich glaube, wir müssen als Gesellschaft klar diese Frage politisch beantworten. Zunächst, wie stark wollen wir Datenschutz gegen wissenschaftliches, medizinisches Erkenntnisgewinninteresse abwägen? Das ist auch eine Entscheidung, die kann kein Arzt, die kann keine Ärztin, das kann kein Informatiker, das kann kein Cloudprovider beantworten. Und wenn wir dann diese Entscheidung getroffen haben oder zumindest wissen, in welche Richtung wir uns bewegen wollen, dann müssen wir eigentlich sehr schnell und möglichst auch unbürokratisch, die technischen Infrastrukturen dafür schaffen. Wir sind in Deutschland sehr gut darin, Komitees und Subkomitees zu bilden, und wenn diese Strukturen groß genug werden, dann haben die irgendwann ihr eigenes Überleben im Sinn und nicht mehr das Problem zu lösen, da müssen wir vorsichtig sein, Dass wir vielleicht uns da auch die richtigen Anleihen aus der Industrie holen, aus der Digitalwirtschaft, die ja teilweise mit sehr kleinen, sehr agilen Teams sehr viel erreichen. Gar nicht so sehr, was jetzt dahinter vielleicht das ökonomische Interesse ist, gar nicht eine Ökonomisierung der Medizindaten, aber die Abläufe, die Strukturen die müssen einfach moderner, schneller, agiler werden.

Tim Pritlove
0:23:50

Gut, aber vielleicht kannst du ja mal ein paar konkrete Beispiele nennen, wo man sozusagen gerne Daten nutzen würde und zu welchem Zweck. Nur um einfach mal so ein bisschen zu verstehen, was so die Stoßrichtung wäre.

Hendrik Ballhausen
0:24:02

Ja, also ein Klassiker ist, Klinikum A hat eine klinische Studie gemacht, die haben written informe consent von ihren Patienten, dass sie das auch auswerten dürfen, Klinikum B hat die gleiche Studie gemacht und die merken eigentlich, sie könnten viel granularer auswerten, wenn sie jetzt die Daten gegenseitig sich zeigen könnten, dürfen sie aber nicht. Das sind, die Daten müssen in Gewahrsam des Klinikums bleiben, bzw. da sind dann oft auch, sobald eine Landesgrenze in Deutschland dazwischenkommt, da sind noch mal andere Datenschutzgesetze, das sind andere Ethikkommissionen, und das wird dann sehr schwierig, und der einfache Weg ist dann, dass man dann eine Metaanalyse macht, das heißt, man nimmt sozusagen die Summe der Erkenntnisse der einen Studie und die Summe der Erkenntnisse der anderen Studie und versucht, die irgendwie zu verheiraten, aber das ist halt nicht so einfach und das ist halt auch nicht so gut, was heißt so gut, man kann oft nicht genau so viel ableiten, wie man mit den Rohdaten beider Studien addieren könnte. Das ist ein Beispiel für, um jetzt mal einen Fachausdruck zu bringen, eine sogenannte horizontale Partitionierung, also jeder hat die gleichen Daten, aber in Summe hat man mehr davon. Dann gibt es noch ein anderes Problem, das ist eigentlich viel größer, das ist die vertikale Partitionierung, das ist, wenn der eine die einen Daten hat und der andere hat die anderen Daten, also über die gleichen Leute. Beispielsweise der eine weiß, sind das Frauen oder Männer und der andere weiß, sind das Raucher oder Nichtraucher. Nichtraucherinnen und Raucherinnen. Und das wird dann schon sehr viel schwieriger, weil man kann sich überlegen, da kann man eben nicht mehr erst summieren und dann austauschen, sondern da muss man eigentlich über den einzelnen Patienten, die einzelne Patientin wissen, ist das eine Frau, ist das ein Mann, ist das ein Raucher, eine Nichtraucherin. Und dafür gibt es Verfahren, auch mathematische Verfahren, kryptografische Verfahren, aber es ist halt immer sehr sehr viel schwieriger, als die Daten in einen großen Topf zu werfen. Und deswegen kann man auch verstehen, dass der allererste Reflex, der allererste Impuls, was die Leute auch können, ist, große Datentöpfe, große Datalags, große Datensilos zu schaffen und die Juristen dann zu beschäftigen, dass die einen entsprechenden Rahmenvertrag dann darum bauen. Und so funktioniert es da zurzeit und man muss sagen, ja auch gar nicht unerfolgreich. Also es gibt ja in Deutschland die große Medizininformatikinitiative, die sich genau mit dem Thema beschäftigt, wie können wir Daten austauschen, wie können wir Daten auch harmonisieren, wie schaffen wir es, das ist ja die eigentliche digitale Transformation, wie schaffen wir es, dass an den Standorten nicht nur Daten zur Verfügung stehen, sondern eben auch strukturierte Daten.

Tim Pritlove
0:26:38

Was macht diese Medizininformatikinitiative so konkret?

Hendrik Ballhausen
0:26:42

Die haben sich verschiedene Usecases gesucht, Neurologe etc. pp., wo sie sagen, wir schauen uns jetzt bestimmte Krankheitsbilder in dem ersten Schritt an und versuchen, für diese Krankheitsbilder jetzt entsprechende Strukturen aufzubauen, dass die Leute da Daten austauschen können. Ganz konkret sieht das so aus, dass an jedem Standort ein Datenintegrationszentrum geschaffen wird und diese Datenintegrationszentren dann gemeinsame Standards verwenden, um Daten eben gemeinsam verarbeiten zu können. Das ist immer noch der Ansatz, dass Daten ausgetauscht werden und genau was du eingangs gesagt hast, da ist eben nach wie vor die Befürchtung, Daten, die ich einmal herausgegeben habe, die bekomme ich halt nicht zurück. Ich weiß nicht, was mit denen gemacht wird, vielleicht gibt es in dem Konsortium einen starken Partner und viele kleine Partner, dann ist auch immer die Frage, ist es ein gleichberechtigtes Zusammenarbeiten oder ist da eine Asymmetrie drin? Das sind so Fragen, die sich stellen, die aber in der Praxis eigentlich auch ganz gut funktionieren.

Tim Pritlove
0:27:54

Ja, aber wie überkommen die denn das Datenschutzproblem an der Stelle?

Hendrik Ballhausen
0:27:57

Über juristische Lösungen. Das heißt, da werden dann tatsächlich Rahmenverträge geschlossen und da müssen die Patienten dann eben entsprechend der Verarbeitung der Daten zustimmen. Das Wunschziel ist immer der sogenannte Broad Consent(?), das heißt, dass der Patient, die Patientin nicht nur zustimmt, dass ihre Daten jetzt für einen bestimmten Zweck verwendet werden, sondern auch beispielsweise in Form einer Datenspende sagen, ich bin einverstanden, dass meine Daten auch für zukünftige andere Forschungsfragen, die euch vielleicht in ein, zwei, fünf Jahren einfallen, auch verwendet werden dürfen.

Tim Pritlove
0:28:29

Hendrik Ballhausen
0:28:47

Das skaliert sehr gut. Also wenn man die Daten in einen Topf werfen kann, dann ist das immer das einfachste und das, was am allerbesten skaliert. Auch vor allen Dinge, was natürlich, wenn man jetzt wieder die Informatik betrachtet, die Algorithmen funktionieren am allerbesten, wenn die auf Daten lokal, also auf einem großen Datensilo, das an einem Ort ist, läuft.

Tim Pritlove
0:29:06

Okay, das ist die Skalierung aus der technischen Perspektive, aber ich meinte eher, skaliert es sozusagen insofern, als dass man sehr viel mehr solche Ansätze machen kann? Also lässt sich das im Prinzip auf den gesamten medizinischen Bereich erweitern? Dann würde ich ja sagen, sind wir schon fast fertig hier mit dem Podcast. Dann lösen wir das einfach juristisch und das war es.

Hendrik Ballhausen
0:29:25

/lacht/ Naja, manche Länder, UK, Dänemark, glaube ich, die gehen ja durchaus diese Richtung, dass die wirklich große nationale Datenbanken haben, die haben natürlich wieder andere Nachteile. Es gibt, je größer die Datenbank ist, desto größer ist natürlich auch die Zielscheibe, die man drauf malt, für beispielsweise irgendwelche Hackerangriffe, das ist natürlich immer alles im Vorwege total abgesichert, aber wie man auch an der Gesundheitskarte und anderen Systemen sieht, je größer so ein System wird, desto mehr Akteure gibt es, die in irgendeiner Form involviert sind, desto mehr Schnittstellen gibt es und desto größer wird letztlich auch die Angriffsfläche. Und insofern würde ich sagen, jain, vielleicht skaliert das in der Medizin sogar, die Frage ist, gibt es andere Ansätze, die vielleicht in den moderneren demokratischeren auch Prozess hinweisen. Du hast die Apps erwähnt, ja das wäre vielleicht auch noch mal meine Antwort auf, wem gehören die Patienten? Heutzutage, wenn die Daten am Universitätsklinikum entstehen und wir wollen ja zum Beispiel auch zunehmend an die Daten, die beispielsweise bei den Niedergelassenen entstehen, das ist ja auch ein riesiger Datenschatz, der noch in keiner Weise irgendwie gehoben ist. Und weil mal ehrlich gesagt, die Universitätskliniker sehen ja oft auch die Sonderfälle. Aber der Niedergelassene der sieht eigentlich das, was die Bevölkerung wirklich auch viel betrifft. Und du hast die Apps erwähnt, ja, und in Zukunft tragen die Leute halt die Apps bei sich und dann werden wir als Universitätsmedizin eines Tages wirklich die Leute bitten müssen, darf ich die Daten aus deiner App haben? Es ist noch nicht mal so, dass wir fragen müssen, dürfen wir die Daten, die wir von dir haben, verwenden, sondern, wirst du uns wirklich deine Daten geben? Und da kann man sich natürlich überlegen, wenn man ohnehin diesen Schritt vor sich hat, dass man auf dezentrale Daten zugreifen muss, können wir dann vielleicht heute schon lernen, auch auf dezentralen Daten zu rechnen, dass wir die gar nicht mehr austauschen müssen?

Tim Pritlove
0:31:31

Gibt ja auch entsprechende Initiativen von den Smartphone-Herstellern, vor allem Apple ist ja in diesem Gesundheitsbereich ganz weit vorne. Auch so mit der Apple Watch, hatten wir auch schon in diesem vorhin erwähnten Podcast drüber gesprochen, dass da ja massig sehr vergleichbare Daten gesammelt werden quasi, das Telefon selber überwacht ja im wahrsten Sinne des Wortes den Körper. Es gibt immer mehr Sensoriken, von Blutdruck etc., alles mögliche. Es gibt ja auch noch andere Messgeräte, die mittlerweile mit den Telefonen gekoppelt werden, bei Leuten, die da einen speziellen Bedarf haben. Das ist natürlich auch ein riesiger Datenschatz, der eigentlich nur darauf wartet, in irgendeiner Form ausgewertet zu werden. Bisher läuft das ja dann eben nur über solche meist dann universitären Studien, wo Leute dann quasi über Apps sagen können, okay ich will jetzt an dieser Studie teilnehmen und spende da quasi meine Daten mit rein, die ja dann auch mehr oder weniger automatisiert eingesammelt werden können.

Hendrik Ballhausen
0:32:37

Ja, aber Apple, ist zumindest jetzt mein Verständnis, ist ja ein Paradebeispiel dafür, dass eben genau so ein proprietärer Datenraum geschaffen wird. Apple zentralisiert ja eigentlich alle Daten, die auf irgendeinem, egal ob es die Smartwatch ist oder das iPhone oder der PowerMac oder was auch immer das ist, Apple ist ja eigentlich dafür bekannt, dass es den Benutzern eine sehr komfortable einheitliche Sicht auf ihre Daten bietet, was aber eben bedeutet, dass diese Daten eben alle zentral liegen. Und auch die allermeisten Geschäftsmodelle…

Tim Pritlove
0:33:13

Also zentral auf den Geräten liegen.

Hendrik Ballhausen
0:33:15

Zentral bei Apple liegen.

Tim Pritlove
0:33:16

Gesundheitsdaten nicht, nein.

Hendrik Ballhausen
0:33:20

Okay, gut, das weiß ich jetzt nicht.

Tim Pritlove
0:33:21

Nein, nein. Das ist halt das Modell, also die Daten verlassen eigentlich das Telefon nicht und man kann dann halt mit dem Apps an Studien teilnehmen und dann dafür sozusagen explizit die Datenspende quasi freigeben, aber ansonsten verlassen die halt das Telefon nicht. Es ist nur so, dass die Daten quasi auf den Geräten zentral gesammelt werden, also Apps, die irgendwas zu sammeln haben oder etwas anfragen möchten, wenden sich quasi über einen definierten Zugang an das Gerät und sagen, ich würde gern das auslesen dürfen bzw. ich würde gerne diese Information schreiben dürfen, weil ich die über irgendein, was weiß ich, Bluetooth gekoppeltes Sensorgerät, einsammle und dann liegen die da halt erst mal rum, aber warten ja im Prinzip darauf, auch mal sinnvoll ausgewertet zu werden.

Hendrik Ballhausen
0:34:11

Okay. Wenn du deine Smartwatch verlieren würdest und du würdest dir eine neue kaufen, dann wären da keine Daten mehr drauf.

Tim Pritlove
0:34:22

Die Daten sind in meinem eigenen Backup natürlich erhalten.

Hendrik Ballhausen
0:34:25

Das meine ich, die Daten liegen bei Apple.

Tim Pritlove
0:34:28

Ach so, in dem Moment, wo man sein Backup bei Apple macht, liegen die Daten dort.

Hendrik Ballhausen
0:34:31

Ja.

Tim Pritlove
0:34:32

Das ist richtig. Aber es gibt nicht in dem eigentlichen Sinne eine zentrale Gesundheitsdatenbank, in der man sagen kann, gib mir mal die Daten von.

Hendrik Ballhausen
0:34:41

Das Geschäftsmodell der allermeisten Apps ist ja genau das, die App ist oft kostenlos, ja, und das Unternehmen selber verdient dann daran, dass die Daten als solche weitergegeben, verkauft, genutzt werden. Ist ja heutzutage auch deswegen besonders spannend, weil gerade im Bereich des maschinellen Lernens man natürlich sehr viel Daten auch über Benutzerinnen und Benutzer verknüpfen möchte und vor allen Dingen überhaupt eigentlich auch vernünftig erst Modelle trainieren kann, wenn man Millionen von Nutzern hat. Und das beobachten wir in ganz vielen Bereichen. Dass jetzt die klinische Studie am Ende auf einer Smartwatch ausgeführt wird, das ist eigentlich, möchte ich mal behaupten, noch der absolute Ausnahmefall, das gibt natürlich jetzt erste Ärztinnen und Ärzte, die das spannend finden oder auch beispielsweise im Bereich der Sportmedizin da Bewegungsbilder auswerten. Die typische klinische Studie, sagt ja auch der Name, klinisch, findet in der Klinik, am Klinikum statt, ist meistens doch so, dass sie unter sehr kontrollierten Bedingungen stattfindet, aber natürlich zunehmend interessieren wir uns auch dafür, Leuten Wearables mit nach Hause zu geben, um die dann beispielsweise nachzuverfolgen oder eben, das kann dann auch einfach Arbeitserleichterung sein, dass die Daten nicht ständig jetzt von Study Nurses erhoben werden müssen, sondern dass die mehr oder weniger automatisiert abgerufen werden können.

Tim Pritlove
0:36:21

Blutdruck verfolgen etc.

Hendrik Ballhausen
0:36:24

Zum Beispiel, ja genau.

Tim Pritlove
0:36:25

Genau. So und jetzt muss man sich natürlich darüber Gedanken machen, wie kann man diese Ziele erreichen, die du vorhin genannt hast. Also wie kann man denn nun Daten zusammenführen, von denen eben nicht von vornherein gesagt wurde, ja die könnt ihr für alles mögliche verwenden, mir doch egal, macht doch was ihr wollt. Weil das ist ja nicht die Regel, sondern die Regel ist ja immer erst mal, da, wo keine explizite Einwilligung vorliegt, ist es halt alles erst mal wieder im Bunker. Und wenn ich das richtig verstehe, habt ihr jetzt ein Projekt gestartet mit dem schönen Namen, Federated Secure Computing, das halt informatische Methoden aufruft und sagt, hör mal, alles gar kein Problem, wir können diese Daten, ohne sie wirklich irgendjemandem zu öffnen, auch beliebigen Verarbeitungsschritten zuführen, ohne dass irgendjemandem was verraten wird. Ist das so erst mal von der Prämisse her richtig dargestellt?

Hendrik Ballhausen
0:37:29

Ja, gar kein Problem wäre schön, dann bräuchte es unser Projekt nicht, aber im Prinzip ist es genau das. Also wir wollen diesen alten Konflikt auflösen zwischen Kollaboration auf der einen Seite, Daten gemeinsam zu nutzen und Datenschutz auf der anderen Seite. Wir wollen eben erreichen, dass die Leute auf verteilten Daten so rechnen können, als wären sie an einem Ort zusammen. Dass beispielsweise auch so Dinge möglich werden wie Dynamic Consent. Dass ich also auch im Nachhinein noch bestimmen kann, was mit meinen Daten geschieht, eben weil ich sie nicht einmal herausgegeben habe, sondern indem ich eigentlich bei jeder neuen Berechnung aktiv werden muss. Und das ist vielleicht auch noch mal so ein Punkt, wer ist eigentlich aktiv und wer ist passiv in dem System? Und es würde zu wesentlich demokratischeren Datenströmen und Datenstrukturen führen, wenn eben die Konsumentinnen und Konsumenten, wenn die Patientinnen und Patienten wirklich auch zu Akteuren würden. Da gibt es ja schöne Ansätze, beispielsweise Citizen Science. Das eine Beispiel ist die Datenspende, aber es gibt noch andere Beispiele für Citizen Science, wo Leute eben beispielsweise die Rechenleistung ihres Computers zur Verfügung stellen. Und das passiert eben jedesmal wieder neu. Die Leute werden jedesmal wieder aktiv und überlegen sich ja auch, wo möchte ich mich engagieren, für was, wo sehe ich jetzt meine Daten gut verwendet? Wo sehe ich auch mein eigenes Interesse, da mitmachen zu wollen?

Tim Pritlove
0:38:52

Also Citizen Science im Sinne von, ich würde es mal jetzt ein bisschen mit der Astronomie vergleichen, man hat diese ganzen Sternenkataloge, es gibt einfach von vielen Projekten, auch neueren Missionen, die ja auch umgeschwenkt haben zu diesem vollständig geschlossenen, das ist nur für unsere Hohepriester und Superwissenschaftler, dass die Daten halt quasi mehr oder weniger der Öffentlichkeit zur Verfügung stehen, weil es ohnehin so viele Daten sind, dass niemand auf alles drauf schauen kann und man es im Prinzip beliebigen Leuten ermöglicht, da einfach ganz eigene Analysen vorzunehmen und so verstehe ich das jetzt auch, ist es so ein bisschen diese Vision, was wäre wenn, wenn all diese Daten qualifiziert herumliegen, aber naja, wie wird dann der Datenschutz dabei nicht und die Privatsphäre dabei nicht verletzt?

Hendrik Ballhausen
0:39:44

Und da gibt es eben eigentlich Verfahren, die auch… also ich bin froh, dass dieser Podcast Forschergeist heißt und nicht Erfindergeist. Wir sind wirklich nicht Erfinder von diesen Verfahren, diese Verfahren gibt es eigentlich schon richtig lange. Die gibt es so seit den 70er/80er Jahren und es ist ganz spannend, sich zu überlegen, warum die eigentlich auch nicht so wirklich bisher gezündet haben. Und das ist eigentlich so der Ansatz unseres Projektes, zu sagen, wir wollen diesen Verfahren auch mal helfen, auch in dem schwierigen Feld der Medizin Fuß zu fassen, und dort erste Showcases zu bauen, dass die wirklich auch gut funktionieren können.

Tim Pritlove
0:40:24

Es gibt ja auch gerade bei den schon angesprochenen Smartphones gibt es ja im Prinzip schon ähnliche Beispiele, die jetzt erst mal mit Medizin aber nichts zu tun haben. Verkehrsvorhersagen, man wundert sich immer, woher wissen die, dass da jetzt ein Stau ist in meiner Straße, ja, das wissen die, weil sie halt quasi alle Telefone die ganze Zeit überwachen, wie schnell sie sich denn jetzt bewegen und daran halt klare Patterns ableiten können, ah du bist hier irgendwie zu Fuß unterwegs, wahrscheinlich eher Fahrrad oder du stehst halt hier gerade mit deinem Auto im Stau, weil mal bewegst du dich mit 60km/h und dann stehst du halt wieder zwei Minuten rum. Und dann denkt man sich so, oh ja ist ja aber eigentlich genau auch super, Privatsphäre, du weißt wo ich bin etc.. Und auch dort gab es ja schon verschiedene Verschleierungsansätze, ich glaube, so ein Modell, was sich differential privacy nennt, steht da ganz weit vorne.

Hendrik Ballhausen
0:41:18

Richtig.

Tim Pritlove
0:41:20

Dass man im Prinzip sagt, naja okay, alle schicken das jetzt irgendwie einerseits halt anonymisiert so, andererseits aber auch so, dass ein vorhersagbarer Teil der Daten quasi falsch ist, also man weiß, zehn Prozent der Antworten stimmen einfach nicht und das kann man dann im Nachhinein wieder rausrechnen und kommt dann trotzdem auf das richtige Ergebnis.

Hendrik Ballhausen
0:41:42

Ja, absolut richtig, du hast da jetzt genau eines dieser Verfahren genannt oder sozusagen eine Klasse von Verfahren, differential privacy, auch in der Medizin viel verwendet. Du hast es richtig gesagt, man verrauscht die Daten bzw. man erlaubt, wenn man jetzt eine entsprechende Datenbank gebaut hat, dann erlaubt man den Wissenschaftlern eben nur bestimmte Abfragen und nicht beliebige Abfragen, ist aber auch wieder übrigens ein ganz interessantes informationstheoretisches Entscheidungsproblem, welche Anfragen man zulassen darf. Und ist gar nicht so leicht entscheidbar.

Tim Pritlove
0:42:18

Ja und vor allem bei den Beispielen, die du vorhin genannt hast, mit der vertikalen Partitionierung.

Hendrik Ballhausen
0:42:26

Da funktioniert das nicht.

Tim Pritlove
0:42:28

Genau, weil dann will man ja genau, da muss man ja exakt genau zuordnen und da darf man in dem Sinne ja auch keine falschen Daten haben, weil dann ist im Prinzip der ganze Witz schon wieder vorbei. Von daher taugt das eben für bestimmte Dinge vielleicht unter Umständen, aber auf gar keinen Fall für alle.

Hendrik Ballhausen
0:42:46

Ja, also es gibt auch da in der deutschen Medizininformatik initiative Leute, nicht uns, die haben ganz Interessante Ansätze, wo sie eben auch verrauschte Identifier zuordnen können, also auch wenn jetzt Namen ähnlich sind und auch da kann man einiges verschleiern und trotzdem noch was lernen. Aber das ist in der Tat natürlich schwierig und die spannende Frage ist natürlich auch, was ist dann sozusagen die Sekundärnutzung dieser Daten. Solange das Ganze für die Stauvorhersage verwendet wird, ist es ja fein. Sobald ich dann, wenn ich das nächste Mal eine Autoversicherung abschließen möchte, plötzlich gesagt bekomme, Ihr Tarif ist doppelt so hoch, weil Sie an der Kreuzung immer abbiegen, ohne auf sozusagen die Ampel zu warten. Obwohl das ist vielleicht sogar noch ein Beispiel, das gesellschaftlichen Nutzen bringen würde.

Tim Pritlove
0:43:33

Ist alles so bisschen Dual Use. Aber was sind denn jetzt, also wenn ich das jetzt richtig verstehe, ist ja euer Ansatz eher der, wir möchten gerne, dass man mit den richtigen Daten arbeitet, aber die darf keiner sehen.

Hendrik Ballhausen
0:43:50

Richtig, ja. Also ein anderes Verfahren, was da oft als der Goldstandard auch bezeichnet wird, das ist Secure Multiparty Computation. Also sicheres Rechnen von verschiedenen Parteien. Und wir haben in 2019 einen Pilotversuch gemacht, wo wir Patientendaten der LMU und der Charité in Berlin, also auch über Landesgrenzen hinweg, das waren Glioblastomdaten(?), also Daten von Krebspatientinnen und Krebspatienten, miteinander verrechnet haben, ohne die auszutauschen. Und das hat eigentlich super funktioniert. Das Problem dabei war, es waren damit vier Monate lang die Leute beschäftigt. Also wir hatten einen Expertenprogrammierer von der TU, der das für uns programmiert hat, der ist inzwischen auch beim Bundesamt für Sicherheit in der Informationstechnik, weil solche Leute sind immer sofort weg, die so was können. Wir hatten jeweils einen Systemadministrator an der Charité und an der LMU, wir hatten zwei große schwere Server und am Ende lief das und es lief mühsam und wenn man jetzt eine andere Analyse hätte machen wollen, dann hätte man eigentlich sozusagen wieder bei null anfangen müssen. Und in dem Moment ist uns dann auch klargeworden, das ist nicht so einfach, so problemlos, vor allen Dingen sind wir dann losgezogen und haben versucht, Leuten das zu verkaufen, also jetzt nicht als Produkt zu verkaufen, sondern Manager auch in anderen Unternehmen von dieser Idee zu überzeugen. Weil in der Industrie hat man das viel häufiger, dass man sich Daten gar nicht zeigen kann, weil es Geschäftsgeheimnisse sind, also selbst wenn man wollte. Und wir haben eigentlich immer dieselbe Antwort bekommen. Der Chef der fand das eigentlich immer super, der hat das gesehen, der hat das grundsätzliche Problem gesehen, Datenschutz versus Kollaboration. Der Chief Technology Officer, der fand das eigentlich auch immer super, der hat gesagt, hier ist unser Alleinstellungsmerkmal und neue Technologie und klasse und wollen wir mal ausprobieren und dann kam der CIO der Chief Information Officer und das waren immer die Jungs, die gesagt haben, um Gottes Willen bitte nicht. Wir haben die Skills nicht, wir haben die Leute nicht, wir verstehen das nicht, wir wollen das nicht, wir haben so was noch nie gemacht. Und die hatten dann natürlich auch die Datenschützer im Schlepptau, die auch gesagt haben, ja ist toll, aber wir verstehen das eigentlich nicht, wir haben Angst, das zu unterschreiben. Und so Datensammeln das verstehen wir, das können wir unterschreiben, da verstehen wir das Risiko, da verstehen wir die Haftung. Aber ihr bringt da so ein virtuelles Netzwerk, wo eigentlich völlig unklar ist am Ende, wer hat eigentlich die Daten, wo sind denn die, wer verarbeitet denn da eigentlich was? Das wollen wir nicht, das können wir nicht.

Tim Pritlove
0:46:23

Nachvollziehbare Einwände, möchte ich sagen. Weil ich meine, das Ganze hat ja jetzt hier auch mit Kryptographie zu tun, und Kryptographie ist komplex. Können wir vielleicht mal versuchen, so ein bisschen ein Gefühl dafür zu bekommen, was mit so einer Multiparty Computation, also Leute rechnen auf, also mehrere Leute rechnen auf denselben Daten an verschiedenen Stellen, ohne die Daten zu sehen. Also ich weiß nicht, wie ich zwei plus zwei zusammenaddieren soll, wenn zwei verschlüsselt ist.

Hendrik Ballhausen
0:46:53

Ja, da musst du mir jetzt sagen, ob ich das sozusagen hier mal in fünf Minuten darstellen darf.

Tim Pritlove
0:46:58

Gerne.

Hendrik Ballhausen
0:46:59

Aber dann wären wir schon im algorithmischen Bereich. Also wenn du zwei plus zwei rechnen willst, ist es schwierig, weil sobald, also nehmen wir mal an, die zwei kommt von dir und die andere zwei kommt von mir, und wir beide rechnen gemeinsam aus, dass das vier ist, dann weißt du hinterher, was meine Zahl war. Das funktioniert nicht. Aber wenn wir jetzt hier noch jemanden drittes am Tisch sitzen hätten und wir alle drei hätten eine Zahl im Kopf und wir wollen die Summe von diesen drei Zahlen wissen, das ginge. Und das würde so funktionieren, dass ich einen Würfel werfe. Ich würfle eine Zahl und diese Zahl die ziehe ich von meiner geheimen Zahl im Kopf ab und ich sage dir aber, was ich gewürfelt habe, das darf die dritte Person nicht wissen und du addierst das bei deiner Zahl in deinem Kopf hinzu. Dann kannst du dir vorstellen, ich habe es abgezogen, du hast es dazuaddiert dieses Würfelergebnis, da hat sich die Gesamtsumme im System nicht verändert, aber dass ich dir eine gewürfelte Zahl genannt habe, hat dir auch keine Information verraten, weil das war ja eine zufällige Zahl. Und dasselbe machst du mit der dritten Person, du würfelst ihr also auch was zu und ihr addiert und ihr subtrahiert und dann machen wir das noch ein drittes Mal im Kreis und dann kannst du dir überlegen, wenn du das jetzt auf Papier als Formeln hinschreiben würdest, dass wir hinterher alle eine neue Zahl im Kopf haben, die wir uns verraten können, weil da ist jetzt genügend Zufall, genügend Unsicherheit drin, dass wir am Ende immer noch auf dieselbe Summe kommen, also das richtige Ergebnis, aber keiner von uns weiß, welche Zahlen die anderen beiden im Kopf hatten. Da müssten sich jetzt zwei von uns zusammentun gegen den dritten, dann könnten wir es wieder ausrechnen. Das nur mal so ein ganz einfaches Beispiel für eine Summenberechnung, weil du das Beispiel gebracht hast, auf sichere Art und Weise.

Tim Pritlove
0:48:43

Aber hätten wir dann das exakte Ergebnis oder eine Approximation?

Hendrik Ballhausen
0:48:45

Nein, wir hätten das exakte Ergebnis, weil ich ja dieselbe Zahl abziehe, die du hinzuaddierst und so geht das in jedem Schritt.

Tim Pritlove
0:48:53

Aber das exakte Ergebnis wird nur dadurch erreicht, indem man diesen ganzen Prozess mehrfach durchläuft?

Hendrik Ballhausen
0:48:58

Eine Runde würde reichen. Wir würfeln einmal in der Runde und anschließend hätten wir alle eine neue Zahl im Kopf, die können wir uns hier offen auf den Tisch legen, aus der kann dann keiner mehr was lernen. Das System wird natürlich umso sicherer, je mehr Parteien dabei sind, weil dass sich zwei gegen einen verbünden, das ist noch denkbar, aber wenn wir jetzt hundert Personen wären, dann müssten sich 99 Personen gegen den hundertsten, die hundertste verbünden, um deren Zahl rauszufinden.

Tim Pritlove
0:49:28

Und ist das Bild mit dem Würfeln jetzt quasi nur eine Chiffre für Kryptographie?

Hendrik Ballhausen
0:49:33

Nein.

Tim Pritlove
0:49:34

Oder ist es eine tatsächliche Veränderung der Werte?

Hendrik Ballhausen
0:49:37

Eine tatsächliche Veränderung der Werte. Und das ist nicht nur ein Bild, sondern das ist genau der Algorithmus. Ich lasse den Computer eine Zufallszahl erzeugen und die ziehe ich bei mir ab und die Zufallszahl verrate ich dir und du addierst sie bei dir hinauf und so geht es einmal im Kreis. Genau das ist der Algorithmus.

Tim Pritlove
0:49:54

Das heißt, man stellt die Daten bereit in einem Bewusstsein, wie sie letztlich auch berechnet werden sollen, modifiziert sie entsprechend, dass sie als solche nicht mehr erkennbar ist, so dass es dann in der Summe wieder funktioniert?

Hendrik Ballhausen
0:50:07

Ja genau. Das heißt, das Protokoll gehört immer dazu. Es geht jetzt gar nicht mehr so sehr um die Daten, sondern es geht vielmehr um das Protokoll. Also der Berechnungsmodus, auf den wir uns geeinigt haben. Und da geht die Welt sehr weit auf. Also da gibt es Verfahren, die zum Beispiel dann auch, das wird dann natürlich noch mal eine Stufe komplexer, es gibt Verfahren, die zum Beispiel auch herausfinden können, ob einer von uns in dem Protokoll geschummelt hat oder ob wir uns alle an das Protokoll gehalten haben. Also es ist total interessant, es ist hardcore Mathematik, es ist hardcore Kryptographie. Ich bin kein Kryptograph, Gott sei Dank gibt es diese Verfahren ja schon, wir mussten also gar nichts erfinden, aber wir haben eben den Ansatz, zu versuchen, die so zu verpacken als Bibliotheken, als OpenSource, dass sie eben einfacher einsetzbar werden. Und die andere große Schiene, auf der wir aktiv sind, deswegen bin ich ja heute zum Beispiel auch hier, ist Awareness, wir versuchen einfach auch Bewusstsein dafür zu schaffen, dass man eben gemeinsam auf Daten rechnen kann, ohne die auszutauschen.

Tim Pritlove
0:51:11

Wie komplex kann diese Berechnung denn dann sein? Also geht das jetzt nur mit den vier Grundrechenarten oder?

Hendrik Ballhausen
0:51:20

Das ist, ja, wie soll man sagen, der Pyrrhussieg des Secure Multiparty Computation. Es hat irgendwann mal jemand mathematisch bewiesen, dass man tatsächlich jede Funktion auf sichere Weise berechnen kann. Das heißt, zumindest theoretisch könnten wir alles, was wir berechnen können, indem wir die Daten zusammenschmeißen, auch berechnen, indem wir die Daten lokal lassen. Du hast aber nach der Komplexität gefragt. Und das wissen die Leute, die sich mal so ein bisschen mit Computern und Algorithmen beschäftigt haben, spannend ist ja immer auch, wie lange laufen die Algorithmen? Ist das jetzt auch in realistischer Zeit, ist das mit realistischem Speicher zu lösen? Und da muss man sagen, da ist jetzt ein großes Problem, dass beispielsweise, wenn wir uns Bitcoin anschauen, wenn wir uns die Blockchain anschauen, das ist eigentlich so das Gegenbeispiel, bei Blockchain geht es eigentlich um Nichtverfälschbarkeit und Nachvollziehbarkeit, ist aber auch ein dezentraler Ansatz. Bei uns geht es eben darum, auch dezentral, aber eben nicht nachvollziehbar, nicht transparent. Trotzdem sind die Algorithmen, die dahinterstehen, oft sehr ähnlich und wie wir wissen von der Blockchain und von Bitcoin, solange das so ein Proof of work Sceem(?) ist, dann wird da sehr viel Energie verbraten. Und das ist bei einigen dieser Verfahren hier auch. Und insbesondere bei diesen Verfahren, die jetzt universell sein wollen, also womit man jedes Problem lösen kann, die sind extremst rechenaufwendig. Das ist in der Praxis kein Problem, also wir reden jetzt nicht darüber, dass Hochleistungsrechner ein Jahr arbeiten oder so. Sondern wir reden vielleicht darüber, dass die ein paar Minuten rechnen. Aber die rechnen halt da ein paar Sekunden oder ein paar Minuten, wo normalerweise der Rechner in einer Milliardstel Sekunde eine Summe gebildet hätte. Das heißt, schon ein millionen-, milliardenfacher Mehraufwand. Und deswegen wissen wir oft gar nicht, ob wir uns jetzt wünschen sollen, dass unsere Verfahren so weit Anwendung finden, denn wenn jetzt irgendwann wirklich Millionen, Milliarden Menschen das verwenden würden, und das wirklich global skaliert, dann hätten wir tatsächlich dasselbe Problem wie bei Bitcoin, dass wir wirklich also Energiemengen von kleinen Staaten verwenden.

Tim Pritlove
0:53:28

Naja gut, aber ich meine, wenn man jetzt Studien auswertet, dann ist das ja auch ein einmaliger Vorgang.

Hendrik Ballhausen
0:53:33

Ja, da ist das kein Problem.

Tim Pritlove
0:53:34

Und nicht so ein Bedarf, permanent Energie zu verbrauchen, nur um des Verbrauchens der Energie als solcher.

Hendrik Ballhausen
0:53:41

Nein, aber irgendwann hat mal jemand gesagt, wir schicken jetzt eine Email und es ist egal, wie groß die Bandbreite ist und plötzlich verschicken wir ein paar mehr Emails. Also das weiß man ja nicht, wo es eines Tages hingeht.

Tim Pritlove
0:53:50

Okay, gut, aber ich meine, wenn man jetzt sagt, okay, die Alternative ist, entweder man macht so eine Studienauswertung oder man macht sie halt gar nicht, und sagt, ja okay, das würde aber jetzt irgendwie zwar hunderttausendmal länger dauern, als es dauern würde, wenn man jetzt das Ganze unverschlüsselt auf den nackten Daten, ohne irgendeinen Datenschutz, ohne irgendeinen Privatsphäreschutz machen würde, dann ist das ja auch etwas, was durchaus auch skalieren kann, weil dann nur noch die Frage ist, okay dauert es eine Minute oder dauert es einen Tag, so.

Hendrik Ballhausen
0:54:25

Ja.

Tim Pritlove
0:54:26

Und wenn es einem das wert ist, das irgendwie auch an einem Tag zu berechnen, könnte man es ja machen.

Hendrik Ballhausen
0:54:29

Für eine klinische Studie ist das sowieso kein Problem, denn die dauern ja in der Regel Jahre. Und da am Ende, ob man das jetzt an einem Tag auswertet oder in einer Minute oder eine Millisekunde, das ist völlig egal, da sehen wir das Problem auch überhaupt nicht. Unser Ansatz jetzt bei dem, was wir ganz konkret programmieren, unser OpenSource-Projekt, das geht noch mal in eine dritte Richtung, das versucht eigentlich so das beste beider Welten zu haben. Weil wir haben gesehen, die Leute brauchen gar keine universellen Lösungen, sondern eigentlich 90 Prozent der Anforderungen sind eigentlich mit zehn Prozent der Algorithmen zu erschlagen. Die Leute wollen Summen berechnen, die Leute wollen eine Statistik machen, die Leute wollen Korrelationen sehen, die Leute wollen Listen vergleichen, das sind ganz einfache Sachen, die immer immer wieder kommen und deswegen ist unser Ansatz dafür schlanke effiziente Microservices zu bauen, die genau dieses eine Problem berechnen und nicht ein anderes. Aber dadurch dass wir sagen, wir lösen jetzt wirklich nur das Problem, wie können wir eine Summe berechnen oder wir lösen nur das Problem, wie können wir jetzt eine Korrelation berechnen, dann kann man das hocheffizient machen in den allermeisten Fällen und dann tritt das Problem auch gar nicht auf.

Tim Pritlove
0:55:39

Jetzt sind ja die wenigsten Wissenschaftler mit all diesen ganzen Themen vertraut, das ist nichts, wo man sich mal eben so einliest und ich höre jetzt schon so raus, das Projekt, was halt im Prinzip erst mal sagt, okay, hier gibt es irgendwie eine ganze Menge brauchbare, interessante Ansätze aus der Kryptographie, die liegen auch schon eine Weile rum, das ist irgendwie abgehangenes Zeug, wir sind bloß bisher noch nicht auf die Idee gekommen, die auch konkret in dieser Form zum Einsatz zu bringen, wir sorgen jetzt mal dafür, dass es ein paar Werkzeuge gibt oder zumindest auch eine Dienstleistung, auf die man zurückgreifen kann, um die dann zum Ansatz zu bringen. Was ist jetzt sozusagen der Inhalt eures Projektes, inwiefern sind solche Dienstleistungen, OpenSource-Lösung hast du schon angedeutet, Teil des Voranschreiten und an wen wendet ihr euch überhaupt und für wen ist es jetzt im ersten Schritt erst mal gedacht?

Hendrik Ballhausen
0:56:38

Ja, also wir wenden uns natürlich an die Medizininformatikinitiative, also wir stehen natürlich unseren Kolleginnen und Kollegen jetzt primär auch zur Verfügung, wo ja auch diese Verfahren getestet werden. Wir stehen aber auch anderen Akteuren aus, ich sage mal jetzt, ich möchte jetzt heute hier keine Namen nennen oder ich kann auch keine Namen nennen, Akteuren aus dem öffentlich-rechtlichen Sektor zur Verfügung. Gibt es ja auch viele andere spannende Fragen, die man beantworten kann, als nur mit Medizindaten, ich kann auch über Finanzdaten reden oder über Versicherungsdaten etc. pp.

Tim Pritlove
0:57:13

Aber Medizin ist jetzt erst mal der Fokus?

Hendrik Ballhausen
0:57:15

Nicht unbedingt, also den Algorithmen ist es völlig egal, wofür sie verwendet werden und auch in unserem Projekt, was ja vom Stifterverband sehr großzügig jetzt auch für die nächsten drei Jahre finanziert ist, haben wir auch den Auftrag, Domänen fern der Medizin, Showcases zu bauen. Und da gucken wir uns auch kleine und mittlere Unternehmen an, das sind ja auch typischerweise Bereiche, wo jetzt Daten fragmentiert vorliegen, und da sind wir überhaupt nicht auf die Medizin festgelegt. Auch da wieder, 90 Prozent der Probleme werden von zehn Prozent der Algorithmen erschlagen, und so was wie Statistiken, Korrelationen, Listenvergleiche braucht man überall. Und die Dienstleistung, so haben wir das noch nie formuliert, aber die Dienstleistung würde dann eben darin bestehen, dass wir interessierten Parteien, so wie wir das ja heute auch schon tun, ja zur Seite stehen würden, unser OpenSource-Projekt zu nutzen und weiterzuentwickeln. Also die bekommen dann nicht nur den Code hingeworfen, sondern die würden wir dann sicherlich auch eingangs beraten. Auch unabhängig beraten, weil das muss ja nicht unsere Lösung sein, vielleicht gibt es ja für das Problem schon ein viel besseres Framework. Aber wenn es dann unsere Lösung sein soll, dann würden wir die natürlich auch begleiten in der Umsetzung und denen helfen, einen schönen Showcase zu bauen, aus dem dann am Ende alle lernen können.

Tim Pritlove
0:58:36

Wer sollte denn jetzt hellhörig werden?

Hendrik Ballhausen
0:58:39

Alle, die eigentlich gemerkt haben, dass es toll wäre, wenn sie sich mit anderen Dateneigentümern verschalten können, zu denen sie bisher heute entweder noch kein Vertrauen haben, beispielsweise jetzt Konkurrenten, oder wo sie merken, dass sie aufgrund gesetzlicher Basis noch nicht so wirklich die Grundlage haben, um Daten gemeinsam zu verarbeiten. Also eigentlich jeder, der sich fragen kann, habe ich Daten, die im Prinzip wertvoller würden, wenn ich sie mit anderen Daten verheiraten würde. Und natürlich, wo wir uns auch unheimlich wünschen, dass sie hellhörig werden, das wären natürlich junge Gründerteams, die sagen, wir machen das jetzt zu einem Teil unserer Geschäftsidee, zu einem Teil unseres Produktes, es muss ja gar nicht das ganze Produkt sein, es kann ja nur ein Baustein sein, denn denen könnten wir auch tatsächlich auch finanziell helfen, also denen würden wir dann auch helfen, den Businesscase zu schreiben, denen würden wir helfen auch, wenn jetzt beispielsweise um diesen Code herum eine technische Lösung gebaut werden würde, denen könnten wir da auch helfen, die Patentierung zu finanzieren und ähnliches.

Tim Pritlove
0:59:38

Können wir vielleicht mal ein paar Beispiele uns noch mal ausdenken, wohin das so führen könnte, so jenseits der medizinischen Beispiele, die wir schon gehabt haben?

Hendrik Ballhausen
0:59:46

Ich bringe gerne mal so ein, zwei Beispiele, die wir auch mal gebrainstormt haben, ohne jetzt irgendwie einen konkreten Interessenten zu benennen. Man könnte sich überlegen, dass überall im Vertrieb, da gibt es häufig Vertriebe, dass die Vertriebler Selbständige sind. Das heißt, es gibt irgendwo einen großen Konzern und der hat ein Heer von Vertrieblern und die sind aber eigentlich im Prinzip alles kleine Konkurrenten untereinander. Jeder Vertriebler möchte gerne selber das neue Geschäft machen. Andererseits würden diese Vertriebler unglaublich gerne voneinander lernen, was ist eigentlich die best practice, wie machen das die anderen? Wollen sich aber gegenseitig natürlich nicht die Daten zeigen lassen. Also wieviele Minuten verbringe ich mit einem Kunden? Wieviele Verträge schreibe ich pro Zeit? Diese typischen Key Performance Indicators, wo normalerweise ein Unternehmensberater für viel Geld käme, mit denen allen einzeln spricht und dann hinterher eine Präsentation für den Vorstand macht. Das könnten diese Vertriebler jetzt auch untereinander machen, ohne eine dritte Partei zu brauchen. Und man könnte Branchenbenchmarks machen, also ein Branchenverband könnte sagen, wir wollen, auch ohne dass unsere Unternehmen, vielleicht sind es kleine Mittelständler, ohne dass die jetzt einen teuren Berater einkaufen müssen, dass die sich einfach austauschen können. Und da kann man natürlich jetzt so etwas schillerndere Beispiele bringen, dass natürlich auch so Apps wie Tinder eigentlich letztlich nichts anderes sind, als Leute dezentral irgendwie zusammenzubringen, ohne dass man sich jetzt der Peinlichkeit preisgibt, sich gegenseitig zu verraten, wen man toll findet. Also die Welt ist unglaublich weit.

Tim Pritlove
1:01:16

Ich sehe eine Revolution im Datingservice. Da braucht es natürlich dann auch Vertrauen. Weil ich meine, wenn man heute angelaufen kommt und sagt, ja alles total sicher hier, ist alles voll Kryptographie und so, gerade jetzt, wo die Welt in zunehmendem Maße merkt, wie sie mit dem ganzen Kryptogeldwahnsinn über den Tisch gezogen wird, da wird ja dann auch sehr viel Vertrauen auch gerade missbraucht und abgenutzt so, so was überhaupt noch zu glauben.

Hendrik Ballhausen
1:01:48

Wenn man so ein Projekt aufzieht, dann sollte man das Stichwort Krypto besser nicht auf der Webseite haben, sonst ist man schon mal falsch einsortiert. Wenn man Kryptographie sagt, ist es schon etwas besser. Wir sprechen eigentlich von verteiltem Rechnen und erklären den Leuten dann was wir meinen. Was natürlich auch Vertrauen schafft ist, dass wir alles OpenSource haben. Also es gibt nichts, was jetzt nur wir haben, was jemand anderes nicht hätte, der das verwenden möchte, der Code ist online, der Code ist public, der Code ist free. Es ist auch nicht so, die erste Frage, die immer kommt, müssen wir unsere Daten dann auf eure Server? Nein, wir haben noch nicht mal Server. Wir haben jetzt schon Server, aber das sind Testserver und die stellen wir kostenlos zur Verfügung und wir schreiben in die Nutzungsrichtlinien, dass natürlich niemand irgendwelche sensitiven Daten hochladen kann. Und das schafft natürlich Vertrauen. Weiter Vertrauen schafft, dass wir öffentlich-rechtlich sind und öffentlich-rechtlich finanziert sind. Wir machen keinen Profit damit. Wir haben keine Daten, wir verarbeiten keine Daten. Und wenn man dann mit den Leuten ins Gespräch kommt und insbesondere auch den Datenschützern das erklärt, dann verstehen die das in der Regel schon. Es ist allerdings natürlich wie gesagt es ist für jeden, der da irgendwie mitmacht, es ist immer eine Abkehr vom Bisherigen. Und auch für den Datenschützer, der jetzt völlig neu bewerten muss, nicht ob er etwas darf, das muss er nach wie vor bewerten, sondern auch ob er etwas kann, ob das Verfahren etwas kann, was das Verfahren verspricht. Und das sind ja oft mathematische Beweise der Sicherheit. Und andererseits man muss auch sagen, wir trauen ja auch proprietärer Software. Wir vertrauen ja proprietären Anbietern an anderer Stelle viel viel viel mehr und nutzen deren Systeme, ohne diese Frage überhaupt zu stellen. Aber sobald jemand kommt und sagt, wir machen das jetzt auf sichere Art und Weise, dann werden die Leute eigentlich erst hellhörig und fragen nach. Aber ich glaube, wir können das sehr gut erklären.

Tim Pritlove
1:03:51

Es braucht aber auf jeden Fall auch eine gewisse juristische Absicherung an der Stelle. Weil wenn man das natürlich für sich selber, da kann ich mir alles mögliche herleiten, ob das dann aber vor Gericht Bestand hat und ich nicht dann doch zu irgendetwas verdonnert werde, das ist ja noch mal die andere Frage und das Vertrauen zu eurem Projekt ist natürlich das eine, aber in dem Moment, wo dann halt wirklich ein Startup kommt und sagt, oh super Idee, das bieten wir jetzt mal hier als Dienstleistung an, greifen wir doch mal vielleicht das Beispiel mit diesen Branchenbenchmarks auf, weil das kann man ja im Prinzip eigentlich auf alles so erweitern. Wenn man jetzt also einen Branchenverband hat, der, was weiß ich, Textilindustrie oder keine Ahnung, jetzt entsprechende Zahlen, die ja auch im Interesse der eigenen Branche sind erheben möchte, und bedient sich jetzt vielleicht eines solchen Startups, was eben auf Basis eurer Ideen hier voranschreitet, wie könnte denn das Startup dann sozusagen sicherstellen, dass dieser Branchenverband da sicher ist und wie erklärt der Branchenverband das seiner Branche, dass das sicher genug ist und dort keine Geschäftsgeheimnisse verraten werden?

Hendrik Ballhausen
1:05:02

Also zunächst mal wird diese Initiative auch anwaltlich begleitet. Also wir haben da einen Anwalt, der sich da in dieses Thema sehr tief eingearbeitet hat. Du hast natürlich richtig gesagt, es ist noch nicht vor Gericht gewesen. Also es gibt meines Wissens ein einziges EuGH-Urteil zu der Sache, da ging es um, aber jetzt nicht aus Deutschland, sondern, ich glaube, es war Estland, die da sehr viel weiter im, wie nennt man das, E-Government sind, das heißt, dass die Bürger digital ihre Verwaltungsakte nutzen können. Und es hat halt noch nie ein BGH geurteilt, es hat noch nie vor dem Deutschen Amtsgericht eine Zivilklage gegeben, weil einer vom anderen was wollte daraus. Insofern das einzige, was es gibt, sin anwaltliche Gutachten und die sagen eigentlich so grundsätzlich, also der Grundtenor ist, es ist eine Verbesserung gegenüber dem Status quo datenschutzrechtlich, aber die Akteure sind meistens noch in derselben Verantwortung, die sie ohne diese Verfahren hätten. Das heißt, wo früher ein Kooperationsvertrag geschlossen werden musste, muss auch heute noch ein Kooperationsvertrag geschlossen werden. Wo man früher Terminus Technicus von einer gemeinsamen Datenverarbeitung in gemeinsamer Verantwortung gesprochen hätte, würde man auch heute noch davon sprechen, auch ohne dass die Leute gegenseitig ihre Daten sehen. Jetzt hast du nach dem Startup gefragt. Startups scheinen das Problem irgendwie weniger zu haben, die sind meistens sehr risikoaffig. Also ein Startup, das jetzt wegen einem Datenschutzskandal pleite geht, das gibt es schon, das gibt es aber auch ohne unsere Verfahren, das gibt es dann vielleicht mit unseren Verfahren ein bisschen seltener. Und der Branchenverband, letztlich ist das auch wieder Vertrauen. Das Startup muss halt vertrauenswürdig gegenüber dem Branchenverband auftreten, muss es denen erklären, muss auch die eigenen Interessen offenlegen und der Branchenverband ist dann hoffentlich gegenüber seinen Mitgliedern auch in einer Position, dass die dem trauen, dass wenn der Vorstand da etwas für gut befunden hat, dass man dem auch folgen kann. Aber da gibt es jetzt keine Deus ex Machina Lösung, sondern das ist letztlich, das sind wieder Menschen, das sind Prozesse, es sind Abstimmungen und am Ende des Tages auch dort Vertrauen.

Tim Pritlove
1:07:26

Ja bzw. muss man wahrscheinlich auch in die eigene Forschung gehen. Ich meine, man kann ja immer so den aktuellen Hypes hinterherlaufen, aber man kann vielleicht auch einfach mal schauen, okay, was sind denn eigentlich unsere tatsächlichen Bedarfe und dass der Bedarf an Datenauswertung immer da ist, auf die ein oder andere Art und Weise, haben wir ja schon festgestellt und das würde ja dann letzten Endes bedeuten, dass solche, ich finde dieses Branchenbeispiel irgendwie sehr gut, weil das ganz illustriert, okay, wir wollen für uns Daten machen, aber ihr vertraut einander eigentlich nicht, ihr wollt uns die Daten nicht rausrücken, so, trotzdem wäre es schön, wenn wir für uns alle eine Statistik haben, wie es denn eigentlich ist, weil das ja für uns auch ein politisches Argument Dritten gegenüber ist.

Hendrik Ballhausen
1:08:12

Absolut.

Tim Pritlove
1:08:13

So und deswegen könnte man dann ja auch argumentieren, okay, ihr versteht das jetzt vielleicht alles noch nicht und ihr habt da irgendwie juristische Bedenken, naja dann schafft euch doch mal die Kompetenz auch ran und macht eine Abteilung dafür, die sich damit beschäftigt und vielleicht liegt das auch noch ein paar Jahre in der Zukunft, aber im Prinzip müsstet ihr diesen Weg gehen, weil auf der anderen Seite leuchtet halt das Licht am Ende des Tunnels, was dann eben heißt, ihr könnt Auswertungen machen, die ihr derzeit einfach gar nicht machen könnt.

Hendrik Ballhausen
1:08:44

Ja oder für viel Geld, also es hat ja auch sozusagen der einzelne Betrieb hätte ja auch einen Vorteil. Also das klassische Modell ist ja eigentlich der Unternehmensberater, der einmal im Kreis zwischen diesen Firmen durchläuft und am Ende bekommt dann jeder diesen typischen Barplot, wo man dann 20 eingegraute Säulen sieht und eine Säule ist eingefärbt und dann wird einem verraten, das bist du und du kannst jetzt sehen, wie du sozusagen unter deinen Mitbewerbern stehst, aber du weißt nicht, wer sind die anderen. Auch da übrigens differential privacy wird dann immer gerundet und verrauscht bei den anderen Säulen. Die spannende Frage ist, du sagst jetzt, schafft euch die Kompetenzen. Das ist eben die Frage, wie häufig wird das denn gebraucht? Also ich würde mal sagen, von einem kleinen Mittelständler kann man das sicherlich nicht verlangen, in dem Bereich Kompetenzen zu erwerben, auch selbst von dem Branchenverband. Es ist ja schon sehr speziell. Es ist halt die Frage, ob es in Zukunft vielleicht auch Berater gibt, die sagen, es gibt auch erste Berater, also ich will jetzt hier keine Namen nennen, aber es gibt unter den großen Technologieberatern gibt es halt eine Firma, die sich damit seit ein paar Jahren schon beschäftigt und diese Verfahren auch kennt und auch ihre Klienten darüber informiert, dass man diese Verfahren nutzen kann.

Tim Pritlove
1:10:00

Ja, ich meine ja nicht, dass jetzt jeder Branchenverband jetzt ein komplettes Kompetenzzentrum aufbauen muss, sondern es reicht ja oft schon, dass man überhaupt erst mal Leute festgebunden in einer Struktur hat, die sich damit hauptamtlich beschäftigen, das zu verstehen. Also dass man einfach überhaupt erst mal so eine Vertrauensperson im eigenen Apparat hat, wo man sagen kann, hast du dir das schon mal angeschaut, ist das was für uns oder ist das nichts. Was man sich zum Beispiel bei dieser Blockchain häufiger mal wünschen würde, dass solche Kompetenzzentren existieren, um halt einfach mal zu sehen, worum es sich dabei wirklich handelt. Anstatt eben einfach immer nur dem aktuellen Hype so hinterher zu hecheln und der einzige Maßstab ist, aber alle anderen reden ja auch darüber, also muss es toll sein.

Hendrik Ballhausen
1:10:48

Da wären vermutlich die Datenschutzbeauftragten schon genau die richtigen Personen und die gibt es ja auch in vielen Strukturen schon.

Tim Pritlove
1:10:55

Das stimmt natürlich.

Hendrik Ballhausen
1:10:56

Und das sind eigentlich auch nicht die, die dafür bekannt wären, dass sie jedem Trend hinterherlaufen, sondern die eigentlich eher darauf bedacht sind, ihre Formalismen auch zu wahren. Das ist eigentlich ein guter Gedanke, ich würde mir den auch gerne mitnehmen, dass man vielleicht darauf setzt, dass diese Zusammenarbeit von den domänenspezifischen Datenschutzbeauftragten, die ja auch auf der anderen Seite ihre Daten sehr gut verstehen, und dass es dann vielleicht so Startups gäbe, die halt so branchenspezifische Lösungen anbieten, die dann wirklich einfach genug sind, am Ende des Tages muss es ja wirklich auch ein Programm sein, das läuft. Also unser OpenSource-Projekt das sind Bibliotheken, das wendet sich aber nicht an Anwender, das wendet sich wieder an Programmierer. Und wir haben uns schon sehr viel Mühe gegeben, beispielsweise auch, ohne jetzt zu technisch zu werden, wir haben unsere Bibliothek so erweitert, dass man damit auch Webseiten bauen kann. Das heißt, man muss gar nicht mehr unbedingt jetzt ein Programm bauen, da muss nicht irgendwo ein komplexer Server mit einer komplexen Anwendung laufen, sondern man kann auch einfach zwei Webseiten miteinander rechnen lassen. Das heißt, du hast deinen Browser offen, ich habe meinen Browser offen, dritte Person hat ihren Browser offen, und dann können wir genau das machen. Und dann müsste so ein Startup eigentlich nichts anderes machen als sagen, wir bauen jetzt eine schöne Webseite, irgendwie branchenspezifisch, je nachdem ob es jetzt Agrar ist oder Stahl ist, sondern irgendwie vielleicht in grün oder grau gehalten und in dem Nutzerinterface, natürlich auch entsprechende sozusagen Zugangskontrollen, und dann könnte man auch einfach Webseiten bauen, die das machen. Und das wäre dann schon viel zugänglicher als den Leuten zu sagen, ihr braucht jetzt einen total komplizierten TechStack(?), ihr braucht einen schwierigen Server mit einem bestimmten Betriebssystem, das war auch übrigens einer, wenn ich das noch sagen darf, einer unserer Ansätze, warum Federates Secure Computing, was ist die Federation darin? Wir wollen halt auch unterschiedliche Systeme zusammenbringen. Wenn man einen Branchenverband hat mit vielleicht 40 Mitgliedsunternehmen, dann werden die unterschiedliche IT-Systeme haben. Und das sehen wir zum Beispiel auch in der Medizininformatikinitiative, da gemeinsame Standars zu schaffen, hat Jahre gedauert. Das heißt, jetzt 40 Leuten zu sagen, ihr braucht dasselbe Betriebssystem und ihr braucht noch denselben Technologie Stack(?) und so weiter und so fort.

Tim Pritlove
1:13:19

Datenformate.

Hendrik Ballhausen
1:13:21

Datenformate, geht gar nicht. Deswegen eben dieser Ansatz, ihr könnt das programmieren mit was ihr wollt, wir haben Clients für alle Sprachen, es ist betriebssystemunabhängig, es läuft selbst auf meinem Android-Smartphone, ich habe es auf meinem Android-Smartphone, da läuft es ganz genauso drauf, es läuft inzwischen auch auf dem Rasperry Pie, also es können auch Schüler, Schulen können das vielleicht auch mal gerne ausprobieren. Und das ist noch eben so ein wichtiger Punkt, use what you have und verwendet weiter das, was ihr kennt. Auch damit alleine sind schon Hürden abgebaut. Und das ist letztlich das, was wir mit unserem Projekt wollen, Hürden abbauen, Hürden, abbauen, Hürden abbauen und Awareness schaffen.

Tim Pritlove
1:13:58

Und am Ende braucht es eigentlich nur noch so eine kollektive Taxonomie, in der man dann halt die tatsächlichen Daten dann so berechnet und zusammenführt, wie man sie dann eben gerne hätte, aber man muss nicht an den eigenen Datenbeständen groß was ändern.

Hendrik Ballhausen
1:14:10

Richtig.

Tim Pritlove
1:14:11

Man muss sie nur in dem Moment, wo diese Berechnungen durchgeführt werden, die Daten eingesammelt werden, entsprechend abbilden können und selber auch lokal prozessieren können.

Hendrik Ballhausen
1:14:20

Ja, richtig.

Tim Pritlove
1:14:25

Na, das klingt doch alles nach blühenden Landschaften.

Hendrik Ballhausen
1:14:30

Ja, wir hoffen, wir haben jetzt drei Jahre Zeit, dass das funktionieren kann und wir freuen uns natürlich auf und über jeden Interessenten.

Tim Pritlove
1:14:43

Also die drei Jahre, die jetzt durch die Wirkung hoch 100 Preis finanziert wurde vom Stifterverband.

Hendrik Ballhausen
1:14:49

Ganz genau. Wir würden natürlich auch versuchen, uns durch andere Drittmittelantragstellungen querzufinanzieren. Also wir sehen das jetzt schon in der Medizin natürlich, wenn es jetzt andere Drittmittelprojekte gibt, die das auch verwenden, dann sorgen wir dafür, dass da ein bisschen was zurückfließt. Gar nicht jetzt aus Profitinteresse, sondern einfach um den Topf dieses Drittmittelprojektes weiter zu stärken. Aber das allermeiste kommt im Moment vom Stifterverband und das ist auch genau das richtige Format, um eben jetzt diese Showcases darzustellen.

Tim Pritlove
1:15:25

Und wird dann die LMU die erste sein, die das auch wirklich zur Anwendung bringt?

Hendrik Ballhausen
1:15:29

Na, die LMU hat es ja schon verwandt die die Charité hat es auch verwandt und einige andere Universitäten. Tatsächlich würden wir uns jetzt ganz besonders freuen, wenn ein, zwei dieser Ideen, die wir jetzt in diesem, sage ich mal, Spannungsfeld von Public Sector, Private Sector stattfinden, funktionieren würden. Da gibt es interessante Usecases aus der Automobilindustrie, da gibt es ja zum Beispiel auch am Horizont dieses Gaia X, diese europäische Cloud-Plattform, die ja eigentlich eher ein gemeinsames Arbeiten auch an Protokollen und Formaten ist, da würde es sehr gut hineinpassen. Aber letztendlich muss ich ganz ehrlich sagen, ich würde mich im Moment am allerallerallermeisten freuen, wenn wirklich ein junges Gründerteam kommt oder ein kleiner Mittelständler, der sagt, das ist genau das, was wir gesucht haben und wir bauen jetzt eine ganz knackige, konkrete, spannende Anwendung da drum herum. Das wäre eigentlich das, was mich persönlich am meisten freuen würde.

Tim Pritlove
1:16:36

Gibt es alles auf FederatedSecure.com

Hendrik Ballhausen
1:16:40

FederatedSecure.com, das ist unsere Landingpage, gerne hinschauen oder für die Leute, die jetzt nah an den Keyboards sitzen und programmieren wollen, auf Github FDRTD, federated ist die Sammlung unserer Repositorien(?) und jederzeit gerne mitmachen, unser Projekt wächst und gedeiht natürlich auch nur mit Leuten, nicht nur die das benutzen, sondern die dann auch zurückgeben, genau das ist ja auch die Philosophie eines OpenSource-Projektes.

Tim Pritlove
1:17:09

Genau. Ja, würde ich sagen, haben wir alles zusammengefegt oder, was man hierzu sagen kann?

Hendrik Ballhausen
1:17:18

Ganz herzlichen Dank.

Tim Pritlove
1:17:19

Ja, ich habe zu danken. Ja, und ich danke auch fürs Zuhören hier bei Forschergeist. Das war die 95. Ausgabe und hier geht es bald wieder weiter. Bis dahin sage ich, tschüss und bis bald.

FG095 Federated Secure Computing

Kapitel