Radiohörer kennen die Floskel: „Mindestens fünftausend Tote und Obdachlose bei Orkan in...“ Das mag einen Mangel an genauerer Information anzeigen. Doch in der Floskel versteckt sich noch etwas anderes: Irreführung mittels einer Wahrheit.
Nehmen wir an, bei genauerer Analyse handle es sich um fünf Tote und fünftausend Obdachlose. „Mindestens fünftausend Tote und Obdachlose...“ stimmt dann. Statt aber zu differenzieren, wirft man einfach die Toten und die Obdachlosen in einen Topf. Das ist streng genommen nicht falsch, aber trotzdem irreführend, weil die Aussage viel mehr als fünf Tote suggeriert. Eigentlich meint man mit „Tote und Obdachlose“ einfach alle vom Orkan Betroffenen. Aber „Mindestens fünftausend Betroffene...“ ist eben kein Knüller.
Pikante Rezepte
Diese Zahlenspielerei mutet vielleicht etwas gar rabulistisch an. Aber sie weist auf ein ernsthaftes Problem hin: auf statistische Eintöpfe. Betrachten wir ein anderes, diesmal halbfiktives Beispiel. In einer Stadt stellt man Waffenbesitz signifikant häufiger im muslimischen als in anderen Milieus fest. Nun erweist sich bei genauerer Analyse, dass man unter „Waffen besitzendem muslimischem Milieu“ einen Eintopf versteht, in den man nicht nur Muslime mit nachgewiesenem Waffenbesitz wirft, sondern alle des Waffenbesitzes verdächtigten Muslime sowie Nicht-Muslime mit einem Interesse am islamischen Terrorismus.
Auch hier findet eine irreführende Homogenisierung statt. Im Vergleich mit anderen Milieus schneidet der so präparierte Muslim-Eintopf unverhältnismässig schlecht ab. Eine unter Statistikern wohlbekannte Gefahr lauert generell darin, dass man in Daten-Eintöpfen Leute zusammenmischt, die eine differenzierte Analyse verdienen würden. Man beachte, um ein aktuelles Beispiel zu nennen, dass das französische Anti-Terror-Gesetz nicht von Terrorismus spricht, sondern von „Bedrohungen der öffentlichen Sicherheit und Ordnung“. Darunter kann auch das Biobauernpaar fallen, das eine Mautstelle blockierte, um gegen ein Flughafenprojekt zu protestieren. – Alles Terroristen? Man schmeckt die Schärfe im Eintopf.
Verwässerte Eintöpfe
Mit Eintöpfen lassen sich Resultate auch verwässern. Das geschieht nicht selten in der Forschung. Hiezu ein reales Beispiel. In einer Studie wurde eine neue Strahlentherapie von Tumoren vorgestellt. Sie hat schwere und moderate Nebenwirkungen, und zwar stellten die Autoren bei der neuen Therapie etwa doppelt so viele schwere Nebenwirkungen wie bei der alten fest. Das ist, trotz der guten Therapieergebnisse, ein unerfreulicher Bescheid.
Was taten die Autoren? Eintopf kochen. Sie publizierten keinen gesonderten Vergleich zwischen den schweren Nebenwirkungen von neuer und alter Therapie. Stattdessen mischten sie bei der Diskussion der Nebenwirkungen schwere und moderate zu einer Gesamtgruppe, wodurch die beiden Behandlungen als nahezu gleichwertig erschienen.
Datenprofile à discrétion
Eintöpfe sind im Zeitalter von Big Data beliebt. Je mehr riesige Datensilos zur Verfügung stehen, desto grösser der Spielraum, Datenprofile à discrétion zu basteln. Ein weiteres Beispiel. Die Agentur Reuters berichtete 2013 über eine ungewöhnliche Transaktion zwischen dem amerikanischen Verteidigungs-, Justiz- und Finanzministerium. Die Bundessteuerbehörde (Finanzministerium) hatte gewisse verdächtige „dicke Fische“ der Steuerhinterziehung im Visier. Sie benötigte dazu rechtserhebliche Evidenz. Diese wurde ihr von der Drogenvollzugsbehörde (DEA, Justizministerium) geliefert, und zwar über eine ihrer Spezialeinheiten. Diese „Special Operations Division“ (SOD) ist eine Bespitzelungsabteilung, die auch mit der Nationalen Sicherheitsbehörde (NSA, Verteidigungsministerium) kollaboriert.
Die Datenbeschaffung erfolgte in einem Kartell der Verschwiegenheit. Allerdings, argumentieren Juristen, sind Daten der nationalen Sicherheit nicht dazu gedacht, für Zwecke des Strafvollzugs gebraucht bzw. missbraucht zu werden. Die Harvard-Juraprofessorin und Ex-Bundesrichterin Nancy Gertner redete Klartext: „Es sieht so aus, als würden die NSA und die DEA gewisse Ermittlungen zusammenschwindeln.“
Unkontrollierter Informationsaustausch
Genau das trifft den neuralgischen Punkt: Die Steuerbehörde „akquieriert“ klandestin Informationen vom Militär und von der Justiz und fabriziert aus diesem geheimen Eintopf sozusagen gerichtsfertige Evidenz. „Parallelkonstruktion“ nennt sich das kollusive Manöver im Jargon. Ob das, was geschehen ist, übereinstimmt mit dem, was man als Geschehenes (angeblich parallel) konstruiert, ist tendenziell egal. Willkommen im „Information Sharing Environment“.
So nennt sich eine Initiative in den USA, welche sogenannte lokale „Fusionszentren“ des Datensammelns im ganzen Land verteilen will: Eine Umwelt des Informationsaustauschs soll aufgebaut werden. Der Name „Information Sharing Environment“ ist ein betulicher Euphemismus. Die Initiative muss als gezielter Schachzug der Grenzverwischung zwischen gesetzeskonformem staatlichem Handeln und Aktivitäten im rechtlichen Graubereich betrachtet werden.
Vermischung staatlicher und privater Daten
Während Privatunternehmen ihre Datenakkumulation hinter dem Geschäftsgeheimnis verbergen können, steht die Regierung unter dem öffentlichen Auge des Gesetzes und der Verfassung. Durch die „Fusion“ erweitert sie ihren Zugriff auf die Black Boxes der Privatfirmen, so wie sie als Gegenleistung gewissen Tätigkeiten dieser Firmen einen quasi-öffentlichen Anstrich verleiht. Das Logistik-Unternehmen FedEx zum Beispiel kooperiert mit der US-Regierung und geniesst im Gegenzug gewisse Privilegien und Immunitäten staatlicher Institutionen.
Die Fusionszentren entwickeln sich zu Attraktoren im digitalen Universum: Sie ziehen die Datenströme aus öffentlichen und privaten Datenbanken an, von Strafvollzugsbehörden, Spitälern, Steuerbehörden, Kreditinstituten, Reisebüros, Onlineshops, aus Besitzverzeichnissen, Einwandererdossiers, Autovermietungen, Postzustellungen, Gas- und Heizungsabrechnungen, Hotelreservationen, Casinobesuchen. Motto: je mehr, desto besser.
Vom TV-Konsum zum Pädophilie-Verdacht
Aus genügender Distanz betrachtet sehe ich Hillary Clinton sehr ähnlich. Das heisst, man muss nur das „genügend“ entsprechend definieren, um die Unterschiede zu übersehen. Genau das tun Daten-Eintöpfe. Sie fassen Datenprofile unter ganz bestimmen Kriterien – aus „genügender Distanz“ – zusammen und können eine wilde Kombinatorik entfesseln.
Ein alleinstehender Mann über dreissig schaut zum Beispiel viel Kabelfernsehen, kauft seine Kleider in einem Online-Shop, fährt einen Minivan – und sieht sich auf einmal der Kategorie der Fettleibigen zugeschlagen. Er wird automatisch als potenzieller Kunde von Mitteln und Therapien gegen Adipositas eingestuft. Warum? Weil irgend ein Algorithmus eine Datenkompilation durchgekämmt hat und nun „über dreissig“ „alleinstehend“, „männlich“, „Online-Kleider-Shopper“, „Minivan-Fahrer“, „Kabel-TV-Konsument“ mit „fettleibig“ korreliert. Der Algorithmus hat einfach die „genügende Distanz“, um den schlanken und sportlichen Mann in den Eintopf der Fettleibigen zu werfen.
Und ehe der Mann sich’s versieht, hat ihn – wagen wir hier eine vielleicht übertriebene Extrapolation – ein anderer Algorithmus, der Fettleibigkeit mit Pädophilie korreliert, entsprechend weiter verknüpft. Demarchen vonseiten des falsch Taxierten führen ins Dunkel der digitalen Datenhalbwelt. Mit ziemlich grosser Wahrscheinlichkeit schmoren wir alle in solchen Daten-Eintöpfen. Und wir wissen nicht, wer alles darin fischt. Die Betreiber der Grossfischereien halten sich bedeckt. Kein Wunder, denn sie machen mit Data mining ihr schnelles Geld.
Widerstand gegen Entmündigung
Es gibt ein anderes Phänomen, das uns eigentlich Unbehagen bereiten sollte. Man schaut gar nicht auf die Algorithmen und lässt sie – das ist so ihre Natur – automatisch wirken. Die Resultate, die sie uns liefern, nehmen wir ungeprüft für bare Münze, und nicht selten tritt ein datifizierter Ich-Ersatz an die Stelle unserer selbst.
Ob ich dann dickleibig bin oder nicht, ob ich Terrorist bin oder nicht, ob ich die Person E.K. bin oder nicht, spielt keine Rolle. Mein Datenprofil im Netz sagt, ich sei es. Punkt. Die Algorithmen nehmen mich nicht als Person wahr, sondern als Kategorie. Und in dem Masse, in dem wir die Hoheit über unsere Individualität an die kategorisierenden Algorithmen abtreten, riskieren wir zu verlernen, uns als Individuen zu sehen.
Es könnte aber auch sein, und es wäre sogar zu hoffen, dass sich hier und dort der Impuls zur Widerrede gegen die Gruppierungsmacht der Eintöpfe regt: Nein, so bin ich nicht; das bin ich nicht! Wir definieren unsere Individualität auf dem negativen Weg. Und wir entdecken gerade so auch wieder, welch wertvolles Gut wir eigentlich zu verteidigen haben gegen die klandestine Entmündigung, die in den statistischen Eintöpfen köchelt.