Große Erkenntnisse – große Illusionen?
Welche Strategien wir für eine gemeinwohlorientierte Datenpolitik brauchen
Ein Essay von Aline Blankertz
Daten sind ein immer wichtigerer Input- und Erfolgsfaktor für viele Bereiche, von Online-Plattformen über die Industrie bis zum vernetzten Zuhause. Unternehmen und Regierungen sammeln immer mehr solcher Beobachtungen über die Welt und füttern mit ihnen eine Vielzahl von Modellen, die neue Einsichten generieren sollen. Mit der steigenden Bedeutung von Daten wächst die Relevanz einer guten Datenpolitik, die die Rahmenbedingungen für eine gesellschaftlich wünschenswerte Datenerhebung und -nutzung setzt.
Um mit Daten das Gemeinwohl zu befördern, gehören zwei Elemente ganz oben auf die Agenda: Erstens ist eine breitere Öffnung von Daten so auszugestalten, dass sie nicht nur als Wirtschaftsgut genutzt werden, sondern auch, um mehr Transparenz über gesellschaftlich wichtige Prozesse zu schaffen. Zweitens bedarf es systematischer Absicherung vor Missbrauch von Daten, insbesondere in Form von Profilbildung.
Daten im Interesse des Gemeinwohls öffnen
Daten liegen zu einem großen Teil in der Kontrolle von einigen wenigen Unternehmen, die aus ihnen Wert schöpfen können. Bei Daten in öffentlicher Hand ist hingegen oft fraglich, ob Behörden sie überhaupt in ausreichendem Maße nutzen. Datenstrategien auf der ganzen Welt zielen deswegen darauf ab, nicht nur mehr Daten zu sammeln, sondern auch bestehende Daten breiter zugänglich zu machen. Hierfür gibt es eine Vielzahl an Instrumenten. Darunter der kartellrechtliche Zugang zu besonders wettbewerbsrelevanten Daten, die Öffnung von Verwaltungsdaten sowie die stärkere Ermächtigung von Individuen, personenbezogene Daten zu teilen, z. B. durch ein gestärktes Recht auf Datenportabilität und Datenspenden.

Als Ziel eines breiteren Zugangs zu Daten nennen Regierungen meist wirtschaftliches Wachstum, beispielsweise durch mehr Daten für Start-ups, oder zum Trainieren von Maschinenlernprogrammen*. Das ist zwar legitim, doch Datenpolitik primär als Wirtschaftspolitik zu verstehen, heißt, das gesellschaftliche Potenzial von Daten zu verkennen.
Daten für mehr Licht im Dunkel von gesellschaftlich relevanten Entscheidungen
Zugang zu Daten kann mehr Transparenz in Bereichen schaffen, die sonst eher unter Ausschluss der Öffentlichkeit ablaufen: Seien es (wenn auch rein menschlich gefällte) Personalentscheidungen in öffentlichen oder privaten Organisationen oder Klickdaten von großen Plattformen. In diesen und vielen weiteren Fällen ist mehr Transparenz wertvoll für eine demokratische Kontrolle gesellschaftlich relevanter Abläufe. Diskriminierende Entscheidungen in der Personalführung aufzudecken, kann nicht nur zu mehr wirtschaftlicher Effizienz, sondern vor allem auch zu mehr Gerechtigkeit führen. Wie die Seitengestaltung von Online-Plattformen deren Nutzende lenkt, ist nicht nur aus wettbewerblicher, sondern auch aus demokratischer Perspektive relevant, insbesondere im Zusammenhang mit politischen Inhalten.
Für mehr Transparenz müssen nicht – und sollten auch nicht allen alle Daten verfügbar sein. Oft reichen geschickt aggregierte, verschlüsselte oder solche Daten aus, die nur für bestimmte Zielgruppen wie autorisierte Forschende oder zivilgesellschaftliche Organisationen zugänglich sind, um eine Kontrollfunktion auszuüben. Doch unabhängig davon, wer die Daten nutzt, ist es wichtig, die damit verbundenen Risiken gering zu halten.
Datenbasierten Missbrauch verhindern
Bei jeder Sammlung, Nutzung und Öffnung von Daten gibt es gesellschaftliche Risiken, meist für diejenigen, von denen die Daten handeln. Die europäische Datenschutzgrundverordnung – die viele, aber nicht alle dieser Risiken abdeckt –, schützt dementsprechend nicht die Daten, sondern die Datensubjekte. Sie können anhand schlecht geschützter Daten identifiziert, diskriminiert oder ihrer Privatsphäre beraubt werden. Solcher Missbrauch ist sogar unabsichtlich möglich – beispielsweise, wenn ein Algorithmus menschliche Diskriminierung in Trainingsdaten fortschreibt. Bei jeder Datenverwendung bedarf es einer Analyse der möglichen Risiken sowie Maßnahmen, um die Daten dagegen abzusichern.
Missbrauch kann auch vorliegen, wenn der gesellschaftliche Schaden von bestimmten Daten ihren Nutzen überwiegt. Das wird bei dem Datennutzungsmodell deutlich, mit dem sich viele Online-Plattformen finanzieren: Die umfassende Verfolgung von Individuen über Webseiten, Apps und Geräte hinweg sowie die darauf aufbauende Profilbildung hat hohe gesellschaftliche Kosten zur Folge – in Form der verletzten Privatsphäre. Darauf nehmen die Plattformen keine Rücksicht, wenn sie diese Profildaten nutzen, um Werbung passgenauer zuzuschneiden und sich den so geschaffenen Wert als Gewinn anzueignen.
Dementsprechend sollte Datenpolitik diese Risiken systematisch eindämmen, während sie neben wirtschaftlichem Wachstum auch Transparenz über gesellschaftliche Prozesse ermöglicht. Dann können Daten einen echten Mehrwert für die Gesellschaft schaffen.
*Maschinelles Lernen:
Maschinelles Lernen ist ein Oberbegriff für die „künstliche“ Generierung von Wissen aus Erfahrung: Ein künstliches System lernt aus Beispielen und kann diese nach Beendigung der Lernphase verallgemeinern. Dazu bauen Algorithmen beim maschinellen Lernen ein statistisches Modell auf, das auf Trainingsdaten beruht.
[Quelle: Wikipedia]