Schenken Sie ein Jahr Lesefreude! Mit dem DATUM-Weihnachtsabo.

Land der Daten

Das für 2022 geplante Austria Micro Data Center wird Forschern den Zugang zu öffentlichen Datenregistern ermöglichen. Datenschützer haben Bedenken, viele Wissenschaftler loben den Schritt als überfällig.

DATUM Ausgabe Oktober 2021

›Statistik-Blindflug‹, ›Elend mit den Covid-Daten‹, ›Datenwüste Österreich‹ : Auch in der 4. Welle der Corona-Pandemie fehlen Wissenschaftlern entscheidende Daten. Welche Bevöl­kerungsgruppen erkranken besonders oft ? Wie hängt das Einkommen damit zusammen ? Welche Rolle spielen Infektionen am Arbeitsplatz ? Wer sind die Ungeimpften ? Alles Fragestellungen, die man anhand bestehender Daten – etwa aus dem Impfregister, dem Hauptverband der Sozialversicherungsträger, der AGES und dem Finanzamt – eruieren könnte. Wenn nur Forscher den Zugang dazu hätten.

Noch liegen die Register aber in verschiedensten öffentlichen Institutionen verstreut, zumeist sowohl der Öffentlichkeit als auch der Forschung verschlossen. Das betrifft keineswegs nur Coronadaten. Auch Fragestellungen wie die Integration von Flüchtlingen am Arbeitsmarkt oder die ungleiche Bezahlung von Männern und Frauen ließen sich mit verknüpften personenbezogenen Daten weit besser analysieren, lassen sich ursächliche Erkenntnisse doch meist durch das Kombinieren mehrerer Datensets gewinnen.

Um der Wissenschaft besseren Zugang zu Datenregistern der öffentlichen Hand zu ermöglichen, soll mit Anfang 2022 das neue Austria Micro Data Center (AMDC) starten. Das Zentrum, mit dem viele Forscher Hoffnungen, Datenschützer aber auch Befürchtungen verbinden, wird in Wien-Simmering bei der Statistik Austria angesiedelt sein. ›In dieser Institution ist es auch sehr gut aufgehoben‹, sagt Komplexitätsforscher Stefan Thurner. Als Leiter des Complexity Science Hub Vienna hat er tagtäglich mit großen Datenmengen zu tun. Aus dem Ausland, insbesondere den skandinavischen Ländern, weiß er, dass in Österreich noch viel Luft nach oben ist – sei es beim Arbeiten mit Big Data oder eben mit personenbezogenen Mikrodaten.

Um letztere wird es beim AMDC gehen. Vor dessen Start müssen aber noch das Forschungsorganisationsgesetz und das Bundesstatistikgesetz überarbeitet werden. Ein Entwurf der Novelle war im Juli und August in Begutachtung. Mehr als hundert Stellungnahmen gingen beim Parlament ein, außerordentlich viele. Sie reichen von überschwänglichem Lob bis hin zu massiven datenschutzrechtlichen Bedenken.

Letztere kann Josef Kytir, Leiter der Direktion Bevölkerung bei der Statistik Austria und Projektverantwortlicher für das AMDC, nicht nachvollziehen. ›Na­türlich gibt es einen Interessenkonflikt zwischen Datenschutz und der Nutzung von Daten. Der beste Datenschutz wäre, wenn man gar keine Daten erhebt. Oder wenn doch, man sie für immer und ewig unter Verschluss hält.‹ Eine moderne Gesellschaft müsse aber entscheiden, ob sie Datenschutz über alles andere stellt, oder ob es noch andere wesentliche Interessen gibt.

Die gibt es, wenn es nach der tür­kis-grünen Regierung geht. Sie schrieb das AMDC schon in ihr Regierungsprogramm von Anfang 2020 – für Kytir damals durchaus überraschend. Die wichtigsten dort beschriebenen Eckpunkte finden sich auch im aktuellen Gesetzesentwurf : Kombination und Analyse von Datenbeständen, die zuvor für die Wissenschaft gesperrt waren. Anonymisierung, sodass ein Rückschluss auf Einzeldaten verunmöglicht werde. Beschränkung auf ausschließlich wissenschaftliche Zwecke. Und eine zwingend notwendige Akkreditierung für Wissenschaftler. Bloß Universitäten sowie andere Forschungseinrichtungen, die auf dem Niveau von Unis oder Hochschulen forschen, sollen Zugang erhalten. Die Forschungsergebnisse schließlich müssen im Sinne des Gemeinwohls und – da sie ja auf öffentlichen Daten beruhen – kostenfrei öffentlich zugänglich gemacht werden.

Vor potenziellem Missbrauch sollen gleich mehrere Sicherheitsmaßnahmen schützen : So sollen etwa alle Daten lediglich eingesehen und ausgewertet werden können, nicht aber abgespeichert oder kopiert. Für die gesamte Arbeit mit personenbezogenen Daten soll es einen sicheren virtuellen Raum geben. Auch muss jedes Forschungsprojekt einzeln zur Prüfung eingereicht werden. Nur, wenn das Forschungsvorhaben im öffentlichen Interesse liegt und ohne personenbezogene Daten nicht machbar wäre, wird der Zugang zu den angefragten Dateien eingeräumt – und zwar durch einen Mitarbeiter, der ausschließlich die erforderlichen Daten zur Verfügung stellt. Gegen Bezahlung seitens der forschenden Institution, versteht sich. Auch am Ende der Forschungstätigkeit, vor der Publikation der Ergebnisse, gibt es zwingend einen Check durch die Statistik-Austria-Mitarbeiter. So soll noch einmal geprüft werden, ob auch tatsächlich keine Daten auf indi­viduelle Personen zurückführbar sind.

Bei Verstößen drohen empfindliche Geldstrafen sowohl für den einzelnen Forscher als auch für den Leiter der jeweiligen wissenschaftlichen Institution. Beide wären nach der Datenschutz-Grundverordnung und entsprechenden Bundesgesetzen haftbar. Dass schlimme Datenlecks immer wieder auftreten, zeigen die irrtümlich verschickten Corona-Testdaten von zehntausenden Tirolern, die inklusive Name und Anschrift per E-Mail an Dritte verschickt wurden. ›So etwas darf einfach nicht passieren. Das ist ein Super-GAU‹, sagt Thurner. Im neuen Data Center sei ein solches Datenleck aufgrund von Datenverschlüsselung und mehreren Sicherheitschecks ausgeschlossen. Dennoch : Bedenken zum vorliegenden Gesetzesentwurf kamen etwa vom Datenschutzrat, der Datenschutzbehörde und vom Rechtsanwaltkammertag. Die Arbeiterkammer wiederum pocht darauf, die zuletzt gefährdete Finanzierung der Statistik Austria auf sichere Beine zu stellen. Der laufende Betrieb wird der Statistik Austria mit etwa einer halben Million Euro pro Jahr vom Bund abgegolten.

Von einer ›Datenschutzkatastrophe‹ spricht gar die NGO epicenter.works – Plattform Grundrechtspolitik. ›Grundsätzlich befürworten wir die gewählte Architektur des AMDC. Problematisch ist aber die Ausgestaltung, die keine ordentliche Antragsprüfung oder ernsthafte Kontrollen vorsieht‹, sagt Datenschützer Thomas Lohninger, seit Gründung 2010 bei der NGO und seit 2014 deren Geschäftsführer. Er fordert einen eigenständigen wissenschaftlichen Beirat, der Forschungsprojekte darauf prüft, ob sie im öffentlichen Interesse und die abgefragten Registerdaten nicht überschießend sind.

Die Novelle sieht auch vor, dass Forscher ihre Zugriffe auf personenbezogene Daten künftig nicht mehr lückenlos protokollieren müssen. ›Wir wollen das aktuelle Schutzniveau beibehalten‹, sagt Lohninger. Im derzeitigen Entwurf seien bereits weitreichende Protokollpflichten und intensive Prüfungen vorgesehen, entgegnet Kytir. Welche Sichtweise sich durchsetzt, wird wohl erst das finale Gesetz zeigen – dem Vernehmen nach könnte zumindest ein zusätzliches Gremium durchaus noch eingebaut werden.

Kaum verhohlenes Vorbild für das AMDC ist die dänische Statistikbehörde DST, wo es mit dem › Forskningsservice ‹ bereits seit 1988 ein sehr ähnliches System gibt – übrigens auch auf Englisch. Rund 500 neue Mikrodaten-Projekte aus der Wissenschaft werden jährlich von DST bearbeitet. Österreich hat sich von dort einiges abgeschaut, etwa das Need-to-know-Prinzip : Nur jene Daten, die unbedingt gebraucht werden, sollen bereitgestellt werden. Auch das Akkreditierungssystem ist zumindest dem Prinzip nach fast direkt aus Kopenhagen übernommen worden.

Was sich aber nicht einfach in einen Gesetzestext übernehmen lässt, ist die Kultur im Umgang mit Daten. › Vertrauen spielt eine Schlüsselrolle. Wir können eine datengetriebene Politik und Forschung nur ermöglichen, solange uns die Bevölkerung mehrheitlich vertraut ‹, sagt Nikolaj Burmeister vom Forschungsdienst des dänischen Statistikbüros DST. Dieses Vertrauen – auch in öffentliche Institutionen im Allgemeinen – sei in Dänemark besonders groß. Neben dem passenden Mindset in der Bevölkerung brauche es aber auch die richtige Kultur in Ministerien und Verwaltung. In Österreich werde nach wie vor häufig vom Totschlagargument Datenschutz Gebrauch gemacht, sagt Thurner : › Datenschutz wird mitunter vorgeschoben, um Sachen nicht zu machen, die sehr wohl machbar wären. ‹

Das rächt sich gerade jetzt in der Coronakrise. › Die Pandemie hat gezeigt, dass wir augenscheinlich in einer katastrophalen Datensituation sind ‹, sagt Thurner. Das sei frustrierend, denn man wisse genau, wo die relevanten Daten zur Pandemie produziert werden, wer sie analysiert und wo sie dann ziel- und nutzlos abgelegt werden. Das Problem : Die verschiedenen Spieler im Gesundheitssystem hätten keinerlei Anreiz zum Teilen ihrer Daten : › Weil sie Angst haben, dass sie weniger wichtig werden oder dass andere damit mehr machen können als sie selbst ‹, sagt Thurner. Die fehlende Kooperation schade dem Gemeinwohl.

Doch auch in der Gesellschaft gibt es Defizite. So beschweren sich die Bürger kaum über die vielen Datenmissbrauchs-Skandale privater Firmen, vom › Jö ‹-Bonusclub bis hin zu Facebook. › Da gibt es viel weniger Aufschrei, obwohl die Daten garantiert nicht zum Nutzen der Bürger, sondern aus kommerziellem Interesse gesammelt werden ‹, sagt Thurner. Auch wenn ihn das vermeidbare Corona-Datenleck in Tirol gewaltig stört – weil so auch Vertrauen zerstört werde.

So oder so : Eine neue Kultur in der Verwaltung und bei den Bürgern zu etablieren, wird wohl einige Jahre dauern. Fürs erste ist noch nicht einmal der AMDC-Starttermin Anfang 2022 in Stein gemeißelt. Angesichts von mehr als hundert Stellungnahmen im Begutachtungsprozess täte die Regierung gut daran, sich auch mit den kritischen Stimmen auszutauschen. Ohnehin braucht es weitere sechs Monate bis zur Aufnahme der operativen Arbeit, schließlich muss auch noch die technische Infrastruktur aufgesetzt werden. Für die akute Pandemie-Bewältigung wird das wahrscheinlich zu spät sein.

Viele andere Forschungsvorhaben aus diversen Disziplinen aber wird der bessere Datenzugang stark vereinfachen oder überhaupt erst ermöglichen. So sieht es auch WU-Ökonom Harald Oberhofer, der sich in der › Plattform Registerforschung ‹ gemeinsam mit dutzenden Forschern unterschiedlichster Disziplinen für einen offenen Datenzugang engagiert. Oberhofer schrieb 2020 mit drei Kollegen im Standard : › Wissenschafterinnen und Wissenschafter sehen zu Recht nicht ein, warum Kooperationen und Datenzugänge, die in anderen europäischen Ländern Standard sind und jährlich viele hundert Male durchgeführt werden, in Österreich ein Ding der Unmöglichkeit sein sollen. ‹ •