Ich liebe mich. Oder besser gesagt: Ich liebe mein Cyber-Ego. Über Jahre habe ich mein digitales Spiegelbild mit Hilfe von Facebook, Twitter, Linkedin, Amazon, eBay, Happyfactor, Parship, Hunch und einem halben Dutzend weiterer Plattformen sorgsam aufgebaut. Diesen Websites gestehe ich mehr, als ich sonst von mir preisgebe. Sie kennen zum Beispiel meine Liebe für Motorräder (Facebook). Oder dass mich Seifen grausen, die vom letzten Gebrauch noch feucht sind (Hunch). Oder dass meine einstige indische Partnerin sich darüber amüsierte, wenn ich sie aus ihrem sechs Meter langen Sari zu wickeln versuchte (Parship). Die Websites hören zu, schweigen und speichern. Sie vergessen nichts. Und sie wissen sogar mehr über mich als ich selbst.
Diese Kenntnisse haben allerdings auch ihre Tücken. Man kann Puzzle mit ihnen spielen. Man kann sie miteinander kombinieren, man kann sie nach Belieben deuten. Das Internet ist ein globaler Stammtisch, und wer sich im Datenrausch etwas allzu leutselig gibt, erhält bald einmal die Quittung dafür.
Ich beschliesse, die Probe aufs Exempel zu machen und nachzufragen, was Internetplattformen, Adresshändler, Banken und so weiter über mich gespeichert haben.
Fragen an Coop, Migros und grosse Adressbroker
Der Exkurs in die Untiefen des Datenozeans beginnt bei Coop und Migros. Bei beiden habe ich eine Kundenkarte, also weiss man hier auch, wie viele Crèmeschnitten ich im Wochendurchschnitt vertilge. Aber die Grossisten geben sich verschlossen. Die Dame am Telefon von M-Cumulus ist unfreundlich, und sie weiss nicht, wie lange man für die Zusammenstellung meiner Daten braucht. Sie werde zurückrufen, erklärt sie, was sie nicht tut. Dito bei Coop. Die Gratisnummer kündigt eine Wartezeit von einer Minute an, tatsächlich sind es 12 Minuten 50. Um mir die Zeit zu vertreiben, tippe ich in das Suchfenster auf der Supercard-Webseite «Dateneinsicht» ein, erhalte aber weder auf dieses noch auf verwandte Stichworte eine brauchbare Antwort. Endlich klickt es in der Leitung. Ich möchte alle Einträge seit dem ersten Gebrauch der Karte sehen, sage ich. Ob das gehe? Auch hier weiss man nur, dass man nicht weiss, ob das möglich ist. Die Anfrage werde weitergeleitet, man melde sich umgehend. Nein, tut man nicht.
Also helfe mir selbst und wende mich schriftlich an die beiden Grossverteiler, zusammen mit einer Ausweiskopie, wie vom Gesetz verlangt. Die Gesuche um Dateneinsicht erfolgen dabei ohne Hinweis auf meine Tätigkeit als Journalist. Ich will keinen Presse-Bonus. Am selben Tag gehen noch weitere Schreiben raus, drei an die grossen Adressbroker in der Schweiz: AZ direkt, Schober und Künzler Bachmann. Diese Unternehmen sammeln persönliche Angaben aus Quellen wie Telefonbüchern, Preisausschreiben, Firmenprospekten sowie amtlichen Meldungen und verkaufen das Datenpaket an die Werbe- und Spendenbranche. Ein vierter Brief geht an die UBS, über die ich meine Kreditkarte abrechne. Was weiss man hier von mir?
Hat man notiert, dass ich gerne in Swiss Deluxe-Hotels absteige? Und kann man mir nebenbei sagen, ob ich mich in fünf Jahren tatsächlich werde scheiden lassen? Denn Kreditkartenunternehmen können solche Entwicklungen aufgrund ihrer Kundendaten prognostizieren, wie der Yale-Professor Ian Ayres behauptet. Bei diesen vier Adressen lege ich offen, dass ich die Ergebnisse dieser Anfragen journalistisch zu verwerten gedenke.
Daten sind der wachsende Rohstoff
Im Internet gespeicherte Daten sind ein Rohstoff wie kein anderer. Anders als Öl, Kohle oder Gold kommt ihre Nutzung keinem Raubbau gleich, sie verschmutzen weder Wasser noch Luft, und – zumindest bis heute – führt ihr Abbau auch nicht zu Kriegen. Daten nehmen als einziger Rohstoff sogar zu. Gefüttert von knapp zwei Milliarden Internetnutzern, verdoppelt sich die weltweit gespeicherte Informationsmenge alle zwei Jahre. Was einmal in den Datenkanal eingespeist wurde, kommt nie mehr heraus. Das Internet hat einen Bauch, aber keinen Darm; es verdaut nicht, sondern akkumuliert ständig und wird immer adipöser.
Die Verantwortung für diese Völlerei liegt dabei bei uns, den Nutzern und Nutzerinnen. Nur allzu gerne füttern wir diesen digitalen Magen; denn wir wollen möglichst schnell auch am Social-Media-Getuschel teilnehmen, wir wollen sofort das neuste iPhone in Betrieb nehmen oder den Antrag für die neue Kreditkarte sogleich losschicken. Also tippen wir Namen und Postanschrift, E-Mail-Adressen und Telefonnummern, Alter und Bankverbindung in die Anmeldeformulare ein. Und wenn das alles erledigt ist, klicken wir als letzten Schritt sämtliche Bestimmungen über den Umgang mit unseren Daten unbesehen weg. Ermüdet und gestresst verzichten wir auf das Lesen des Kleingedruckten, aktiv unterstützt von den Unternehmen, die uns ihre Allgemeinen Geschäftsbedingungen in einer Länge von knapp 100’000 Zeichen unterbreiten (Apple iTunes) – das ist rund drei Mal so lang wie dieser Text.
Eigenartiges Verhalten der Nutzer
Wir akzeptieren zudem, dass die gesammelten Daten «weltweit weitergeleitet» und in Ländern ausgewertet werden, die «unter Umständen über keinen oder keinen gleichwertigen Schutz nach schweizerischem Recht» verfügen (Kreditkartenbestimmungen der Credit Suisse). Und ebenfalls ohne Murren geht durch, dass wir «möglicherweise» dabei beobachtet werden, wie wir mit «Werbung und Inhalten interagieren», dass «möglicherweise» unsere Standorte aufgezeichnet werden und, falls wir auf ein Inserat mit angefügter Telefonnummer reagieren, dass «gegebenenfalls» auch unsere Anrufe ausgewertet werden (Google). Ohne mit der Wimper zu zucken, erfüllen wir Big Brothers kühnste Träume.
Was zu einem eigenartigen Verhalten führt: An den meisten Briefkasten hierzulande klebt «Bitte keine Werbung!», wir lassen uns auf Robinsonlisten setzen und prozessieren gegen Überwachungskameras, wir verlangen von Google Street View verpixelte Gesichter, aber dem Internet vertrauen wir freiwillig an, was wir sonst zum Privatbereich zählen. Damit öffnen wir der systematischen Ausbeutung unserer Daten freiwillig alle Schleusen und ermöglichen es den Webfirmen, mit unserer digitalen Existenz Voodoo zu betreiben.
Das tut die Branche nur zu gerne; denn im Internet lässt sich trotz Wirtschaftskrise Geld verdienen. Viel Geld. Facebook, ursprünglich nächtliches Spielzeug für einsame Studenten, generiert heute einen jährlichen Umsatz von sechs Milliarden Dollar. Google hat kürzlich die 50-Milliarden-Marke geknackt. Die reichsten Männer der Welt tragen nicht mehr seidene Anzüge von Brioni, sondern kombinieren ausgebeulte Levis mit einem T-Shirt, auf dem «I am a CEO» steht. Sie sind jünger als wir und können nichts, ausser eine Tastatur bedienen. Aber das können sie gut.
Mit jedem Klick wird ungewollt etwas preisgegeben
Data Mining nennt sich, was die Kids tun. Data Mining bedeutet das Zerlegen, Destillieren, Neukombinieren, Vierteilen oder sonstwie geartete Ausquetschen gespeicherter Informationen. Amazon und eBay arbeiten mit Data Mining. Sie werten jeden Click auf ihren Webseiten aus und analysieren das Verhalten der Surferinnen und Surfer. Sie wollen uns noch besser kennenlernen, damit sie uns noch gezielter ein weiteres Schnäppchen verkaufen können. Die gesammelten Datenmengen sind dabei weit grösser als die Verarbeitungskapazitäten: Wir haben, also sind wir.
Kreditunternehmen nutzen Data Mining, um die Bonität der Kundschaft zu überprüfen. Informierten sie sich früher aus ähnlichen Quellen wie die Adresshändler, so ziehen sie inzwischen immer mehr das Internet zu Rate. Die in Hamburg ansässige Kreditech etwa nützt 8000 mehrheitlich im Web gefundene Indikatoren, um die Zahlungsmoral einschätzen zu können. Dazu gehören neben GPS-Lokalisationen auch die Likes auf Facebook, das Online-Shoppingverhalten sowie eine Analyse der für den Onlinekontakt verwendeten Geräte. Wer im Internet nach der grossen Liebe sucht, wird mit Data Mining konfrontiert: Online-Partnerschaftsvermittlungen stellen ihrer Kundschaft bis zu hundert Fragen, damit eine blauäugige Rothaarige später auch wirklich mit einem grünäugigen Blonden beim Kaffee sitzt.
Die Konsumindustrie profitiert vom Data Mining. Gemäss Legende sollen in den achtziger Jahren zwei Manager von Walmart erstmals tausende von Kassenbelegen auf Auffälligkeiten hin untersucht haben. Ergebnis: Sie sahen, dass jeweils am Freitagabend Bier und Windeln besonders häufig gleichzeitig zur Kasse gebracht wurden. Schluss: Offenbar schickten die Ehefrauen ihre Männer nach der Arbeit zum Einkaufen, wobei sich diese die Windelbestellung mit ein paar Bieren versüssten. Die Manager positionierten daraufhin Bier und Windeln näher beisammen, mit der Konsequenz, dass die Umsätze stiegen.
Plattformen wie Hunch.com basieren auf Data Mining. Hunch erkennt unsere Einkaufswünsche, noch bevor wir sie selbst auch nur erahnen. Basis dafür sind Fragen, mit denen wir unsere Persönlichkeit offenlegen, etwa «Ist das Leben eine Illusion?» oder «Soll sich das WC-Papier von oben oder von unten abrollen?» Je mehr Fragen wir beantworten, desto präziser das Bild. Nachdem inzwischen 80 Millionen Menschen Hunch ihr Innerstes anvertraut haben, weiss man dort, dass Pepsi-Trinker häufiger an eine mögliche Entführung durch Aliens glauben als die Kundschaft anderer Cola-Marken, oder dass Männer mit einer Vorliebe für diagonal geschnittene Sandwiches häufiger Ray-Ban-Sonnenbrillen tragen als solche, die lieber belegte Brote mit vertikaler Teilung essen. Solche Schlüsse sind zwar auf Anhieb ohne nachvollziehbaren Erkenntniswert, doch wer weiss?
Das alles ist nicht wirklich spannend, eher nervig. Aber es existieren auch andere Spielarten des Data Mining, solche, die die Welt verändern können. Auf ein interessantes Beispiel stosse ich während der Warterei auf die Antworten von Coop, UBS und Co.
Narwal gegen Orca
Am vergangenen 6. November wurde in den USA der neue Präsident gekürt. Mit Obama und Romney standen sich zwei Politiker gegenüber, die beide um die Wichtigkeit des Data Mining wussten. Um die Wähler zu beeinflussen, setzten beide Kandidaten auf eigene, speziell entwickelte Programme. Jenes von Obama hiess «Narwal», Romney nannte seines «Orca» – er verwendete damit den Namen des einzigen Tieres, das in der Hackordnung der Natur über dem Narwal steht. Trotzdem waren Obamas Leute der republikanischen Konkurrenz weit überlegen. Anhand der Ergebnisse aus 125 Millionen persönlichen Kontakten konnten sie auf den Bruchteil eines Prozentes genau voraussagen, wie ihr Kandidat abschneiden würde. Fehlten in einem bestimmten Staat Stimmen, fasste das Team nochmals nach, allein am Wahltag mit elf Millionen Anrufen. Das Data Mining war dabei ungemein präzis: Galt es einen Kriegsveteranen zu überzeugen, rief ihn auch ein Kriegsveteran an. Nichts wurde dem Zufall überlassen.
Aber nicht nur das. Mit «Narwal» liessen sich sämtliche Eventualitäten und ihr Einfluss auf die Wahlergebnisse simulieren. So wusste man um die möglichen Stimmenverschiebungen, falls einer der beiden Kandidaten einen Herzanfall erleiden sollte. Oder falls am Wahltag ein Blizzard über einen bestimmten Staat hinwegziehen würde. Man kannte die Auswirkungen einer Flutwelle in Manhattan und die Konsequenzen eines plötzlich auffliegenden Armeeskandals. Mit Hilfe von «Narwal» hatten Obamas Spezialisten tausend verschiedene Ereignisse simuliert und ihre Konsequenzen bis ins letzte Detail berechnet. Romneys Programm «Orca» konnte da nicht mithalten. Es war weit weniger umfassend und durchdacht, und das Data Mining der potenziellen Wählerschaft war so schlecht, dass jeder vierte Anruf von Romneys Helfern bei einem überzeugten Demokraten landete – womit Romney nicht nur den Wähler verärgerte, sondern auch das dringend für eigene Zwecke benötigte Geld und Engagement verschwendete. Schliesslich stürzte «Orca» auch noch ab, und zwar ausgerechnet am Wahltag. Das wars dann.
Basis des Data Mining sind Algorithmen, also Formeln mit einer klar definierten Abfolge von Schritten zur Lösung eines mathematischen Problems. Algorithmen sind die Masseinheit des 21. Jahrhunderts und die stets präsenten Schatten in unserem durchdigitalisierten Alltag. Algorithmen sind hochgeheim und haben seltsame Namen, etwa Kullback-Leibler-Divergenz, Markov-Chain-Monte-Carlo-Verfahren oder Zopfli, letzterer erschaffen von einem in Zürich tätigen Google-Programmierer. Algorithmen sind das Gegenteil von Glauben und Gebeten, entsprechend emotionslos, und sie möchten zum Beispiel Menschen mit hohen Gesundheitskosten am liebsten aus den Krankenversicherungen ausschliessen. Ihr gemeinsamer Nenner ist das Wort «mehr». Mehr von allem. Mehr Stimmen in Wahlen. Mehr Verkäufe. Mehr Wettglück. Mehr Sex (dank Facebook-App «Bang with friends»).
Dumme Algorithmen zahlen sich nicht aus, smarte schon
Die Algorithmen sind allerdings nur so gut wie ihre Programmierer. Als meine Frau nach Hawai’i reist und ich allzu lange nichts höre, beginne ich auf der Website des Flughafens von Honolulu beunruhigt nach ihrer Maschine zu suchen. Da taucht auf dem Bildschirm plötzlich ein Werbefenster auf. Inhalt: eine Auswahl von Schlüsselsafes aus dem Hause Amazon. Tatsächlich habe ich mir die Dinger kürzlich angeschaut und auch ein Exemplar gekauft, das Interesse am Thema ist entsprechend null. Doch das ignoriert Amazon und torpediert mich ausgerechnet jetzt wieder damit. Habe ich Zeit dafür? Nein. Will ich diese Dinger nochmals sehen? Nein. Werde ich künftig wieder bei Amazon einkaufen? Eher nicht.
Allerdings besteht Hoffnung auf Besserung. Zumindest Google entwickelt die Algorithmen stetig weiter und will Neuerungen noch dieses Jahr einführen. Beispiel: Bis anhin hatten wir uns ziemlich klaglos damit abgefunden, dass Anfragen nach «Pizza» mit einer kaum entwirrbaren Mischung aus Restaurantadressen, Hinweisen auf Pizza-Kuriere und Rezepten beantwortet wurden, so wird sich das nun ändern. Wenn ich um 13 Uhr von meinem Bürocomputer aus das Stichwort «Pizza» eingebe, erhalte ich als Antwort ein Online-Bestellformular und die Speisekarte von der Pizzeria ums Eck. Suche ich jedoch um 20 Uhr mit meinem Smartphone nach «Pizza», irgendwo auf der Strasse stehend, schickt mir Google eine andere Anzeige, zum Beispiel die Click-to-Call-Telefonnummer meiner Lieblingspizzeria inklusive Wegbeschreibung. Die neuen Algorithmen erkennen mich, und sie können meinen Aufenthaltsort mit der Tageszeit der Anfrage sowie der Bildschirmkapazität meines aktuellen Gerätes kombinieren. Das ist angewandte Lebenshilfe, wie wir sie uns wünschen. Und verbesserte Formeln bedeuten zusätzliche Einkünfte: Je präziser und bedürfnisgerechter Werbung platziert werden kann, desto grösser ist das Interesse der Kundschaft, desto mehr Inserate werden gebucht.
Der zweite Teil des Beitrags von Christian Schmidt erschien am 14. Mai. Er berichtet von den Antworten der angefragten Konzerne, von Möglichkeiten des Widerstands gegen verdeckte Datenschnüffelei und den Chancen, die Privatsphäre zurückzuerobern.