Freitag, 15. Juni 2018

Das Ende der Theorie! Daten, Daten, Daten...

“Big Data”, "Künstliche Intelligenz", "Machine/Deep Learning" sind Schlagworte, die das Labors der Informatiker verlassen und im Begriffschatz vieler Menschen angekommen sind. Der “Daten-Wissenschafter” Seth Stephens-Davidowitz nennt vier wesentliche Charakteristika: (1) wir haben völlig neue “Arten” von Daten zur Verfügung als in früherer Zeit (in erster Linie durch die Digitalisierung aller Lebensbereiche) und, man muss ergänzen, neue Methoden der Analyse (2) Viele dieser Daten sind "ehrlicher" als Informationen, die wir aus Umfragen erfassen. Sie stammen aus den tatsächlichen Handlungen der Menschen, nicht was sie behaupten zu tun oder sich glauben erinnern zu können, was sie getan haben. (3) Die Daten sind häufig viel fein-granularer. Wir können viel kleinere Gruppen oder gar Individuen betrachten, nicht nur grobe statistische Mittelwerte. Nicht zuletzt (4) einer der mächtigsten Aspekte: die neue Technik erlaubt es in vielen Bereichen ständig Experimente mit uns allen zu machen. 

Ein paar Beispiele: Wer antwortet auf die Frage, ob er bei Tests an der Uni geschummelt hat ehrlich? Oder: Wie oft wir Sex haben? Ob wir homosexuell sind oder eine andere (vielleicht als "extrem" wahrgenommene) sexuelle Neigung haben? Sind wir gar Rassisten oder haben extreme politische Positionen? Was haben wir im letzten Monat gegessen und wie viel Alkohol haben wir getrunken?

Antworten auf solche (Um)fragen sind in der Regel nicht sehr viel wert. Einerseits wollen wir sozial angepasst wirken und uns in einem guten Licht darstellen. Wir lügen uns sogar selbst an, um vor uns selber besser dazustehen. Aber selbst wenn wir die Wahrheit sagen wollten, kann sich niemand zuverlässig daran erinnern, was er in der letzten Woche tatsächlich gegessen oder getrunken hat. Die Folge ist, dass die Zahlen, wie viel heterosexuelle Sex Männer und Frauen haben nicht zusammenpassen, dass mehr als 50% der Menschen sich für überdurchschnittliche Autofahrer, Lehrer, Programmierer usw. halten und dass die Aussagen des Alkoholkonsums nicht mit dem Verkauf zusammenpasst. Was wir wir sagen, denken, glauben hat oft nicht viel mit dem zu tun wie wir tatsächlich handeln.

Auf politischer und wirtschaftlicher Ebene sind Fragestellungen ähnlich: wirkt eine Werbekampagne? Hat eine politische oder steuerliche Maßnahme tatsächlich die gewünschten Effekte? Nutzen die Menschen unser Produkt tatsächlich? Welche Funktionen? Droht eine Epidemie? Gibt es den Klimawandel? Ist das neue Web-Design leichter zu verwenden als das alte? All dies sind Fragen, die man mit Umfragen und anderen Methoden nur sehr schwer beurteilen kann. Auch Experteneinschätzungen sind häufig sehr fehlerhaft. 

“Big Data” erlaubt uns solche Fragen mit wesentlich größerer Zuverlässigkeit zu beantworten. “Big Data” war notwendig um die enormen Datenmengen für Klimamodelle zu handhaben und “Big Data” kann verwendet werden um zu analysieren ob eine Epidemie droht oder ob und wo es soziale Probleme gibt. Steigen etwa psychische Probleme und fürchtet man entsprechend einen Anstieg von Selbstmorden? Man könnte gezielt mit Maßnahmen dagegen steuern. Auch für uns individuell kann “Big Data” Vorteile bringen. Denken wir etwa an die Vergleichsplattformen für Produkte, Dienstleistungen oder Reisen.

"Big Data” bietet enorme Chancen unser Verhalten oder die Situation unserer Umwelt wesentlich besser einschätzen zu können. Eine bessere Politik wäre möglich, wo Maßnahmen konkreter geprüft werden können. Aus wissenschaftlicher Sicht geht Seth Stephens-Davidowitz so weit zu behaupten, dass die Soziologie nun endlich zur “harten” Wissenschaft wird. Aber nicht nur die Soziologie wird sich verändern. Wir werden neben "intelligenten" Geräten und wesentlich besseren Modellen vermutlich ein mehr an Individualisierung sehen, etwa Medizin, die sich nicht nach dem "Durchschnitt" sondern an unserer persönlichen Biologie orientiert. 

Aber es gibt auch eine andere Seite: Internet-Dienste schalten ständig neue Versionen ihrer Webseiten für kleine Nutzergruppen frei und testen ob etwa Werbung häufiger geklickt wird, oder ob die Seite besser nutzbar ist. Casinos versuchen ihren Gewinn zu optimieren, soziale Netzwerke unsere psychologische Schwäche so weit wie möglich auszureizen um uns online zu halten und möglichst viel Werbung zu klicken. (Extreme) politische Gruppierunge nutzen dieselben Mechanismen. Die Schwächsten unter uns werden dabei überproportional ausgenutzt. 



Es ist auch interessant zu beobachten, mit welcher nonchalance Datenwissenschafter Daten von Google, Facebook usw. nutzen um uns soziologisch zu untersuchen. Privatsphäre ist eine Idee der Vergangenheit geworden. Wenn wir etwas in das Suchfeld eintippen, dann weil wir etwas suchen, nicht weil wir an einem Experiment teilnehmen wollen. Kein Google- oder Facebook-Nutzer hat zugestimmt, Teil eines soziologischen Experiments zu werden, oder zur ökonomischen Optimierung eines Konzerns zu dienen. 

Nicht zuletzt dürfen wir auch einen wisseschaftstheoretischen Aspekt (erinnern wir uns an den ersten Teil zurück) nicht vergessen. “Das Ende der Theorie” ist ausgerufen. Big Data macht Prognosen, die Algorithmen benötigen keine Theorie mehr. Aber stimmen die Prognosen auch? Ohne Theorie ist dies noch schwerer zu beurteilen. Wie kommt der Algorithmus zu einer Entscheidung? Wir wissen es oft nicht. Wir wissen aber, dass diese Prognosen häufiger als wir das gerne hätten falsch sind. Wenn sie demnächst keinen Mobiltelefonvertrag oder Kredit mehr bekommen und nicht einmal der Bankangestellte ihnen erklären kann warum, dann hat "Big Data" zugeschlagen. Wenn vielleicht die Polizei oder die Steuer sie kontrolliert, und der zuständige Beamte nicht weiß warum, dann vielleicht weil "Big Data” sie für verdächtig hält und den entsprechenden Auftrag gegeben hat. Vielleicht zu recht, vielleicht aber auch nicht.

Seth Stephens-Davidowitz, everybody lies. What the Internet Can Tell Us About Who We Really Are, Bloomsbury UK (2018)

Zum Abschluss...

Es freut mich, dass Sie sich die Zeit genommen haben, mein Blog zu lesen. Natürlich sind viele Dinge, die ich hier diskutiere aus einem subjektiven Blickwinkel geschrieben. Vielleicht teilen Sie einige Ansichten auch nicht: Es würde mich jedenfalls freuen, Kommentare zu lesen...

Noch ein Zitat zum Schluß:

"Ich verhielt mich so, als wartete ein Heer von Zwergen nur darauf, meine Einsicht in das Tagesproblem, zur Urteilsfindung von Gesellschaft und Politik zu übersetzen. Und nun stellt sich heraus: Dieses Heer gibt es nicht.

Ganz im Gegenteil erweist sich das kulturelle Getriebe als selbstimmunisierend gegen Kritik und Widerlegung. Es ist dem Lernen feind und wehrt sich in kollektiver Geschlossenheit gegen Umdeutung und Innovation.", Rupert Riedl, Evolution und Erkenntnis, Piper (1985)

:-)