Big Data: Was Facebook-Likes über den Nutzer verraten

03.Oktober 2018

Algorithmen setzen Facebook-Likes und andere digitalen Spuren im Internet zueinander in Beziehung – und werten sie präzise aus.  Experimente beweisen die Treffsicherheit von Big Data.

Walter Hatak, Senior Research Analyst der Erste Asset Management, ist im EAM-Blog der Frage nachgegangen, wie weit Nutzer von Big Data-Technologien ausgenutzt werden.

100 Likes sagen mehr als 1000 Worte

Der Wissenschaftler Michael Kosinski untersuchte an der University of Cambridge im Jahr 2012 die Frage, ob die sogenannten „Likes“ auf Facebook mehr über einen Menschen aussagen, als die damit artikulierten Vorliebe. Dazu baute er mit Kollegen eine Facebook-App, die kostenlos ein Persönlichkeitsprofil erstellte, sofern der User sich bereit erklärte, einen Fragebogen auszufüllen und sein Facebookprofil zu teilen.  Anschließend suchte Kosinski nach statistischen Zusammenhängen zwischen den „Likes“ und den erhobenen Persönlichkeitsstrukturen.

Zusammenhänge werden sichtbar

Und warum sollte der Nutzer vor irgendjemandem verheimlichen, dass er eine Vorliebe für Harley Davidson hat und gerne Musik vom Wu-Tang Clan hört? Die Antwort liegt in den verblüffenden Ergebnissen: Anhand der „Likes“ war es möglich, mit einer 88prozentigen Wahrscheinlichkeit vorherzusagen, ob die Person homosexuell oder heterosexuell ist. Die Zuordnung der politischen Ansichten einer Person war mit einer Wahrscheinlichkeit von 85 Prozent möglich. Bei den eingangs angeführten Interessen könnte beispielsweise davon ausgegangen werden, dass der User heterosexuell (hört Musik vom Wu-Tang Clan) und unterdurchschnittlich intelligent (Vorliebe für Harley Davidson) ist.

Wenn der Algorithmus mehr als der Ehepartner weiß

In der anschließenden Forschungsarbeit im Jahr 2014 verglich Kosinski die Genauigkeit einer auf Facebook „Likes“ basierenden Persönlichkeitsanalyse mit Einschätzungen des näheren Umfeldes der Probanden. Die Ergebnisse sind erschreckend: ab zehn Likes kann der Computer die Persönlichkeit des Users besser beurteilen als seine Arbeitskollegen, ab 70 Likes besser als seine Freunde, ab 150 Likes besser als seine Familienmitglieder und ab 300 Likes besser als der Ehepartner! Und dabei wurde nur ein Bruchteil des digitalen Fußabdrucks, den jeder von uns täglich hinterlässt, berücksichtigt! Würde der Algorithmus beispielsweise noch um Suchabfragen, das Surfverhalten im Internet und bargeldlose Einkäufe erweitert werden, könnten noch präzisere Aussagen getroffen werden.

Hundewerbung vs. Wahlmanipulation

Zu wissen, dass jemand einen Hund besitzt und dieser Person deshalb Werbung für Hundefutter zu schicken, erscheint nicht unbedingt anstößig. Zu wissen, dass jemand schwanger ist und dieser Person Werbung für Babyflaschen und Umstandskleidung zu senden, könnte hingegen schon ein unerwünschter Eingriff in die Privatsphäre mit unerwünschten Folgen für die betroffene Person sein. Vielleicht wollte die werdende Mama ihr Glück noch geheim halten?

Förderung von Wahlverhalten

Die Manipulation des Abstimmungsverhaltens bei politischen Wahlen durch das Ausspielen von Ängsten, die dank Social Media individuell je nach Persönlichkeitsstruktur an den potentiellen Wähler adressiert werden können, ist jedenfalls nicht zu dulden. Dies stellt einen Angriff auf das Fundament unserer Demokratie dar, wenn nicht mehr Fakten und politische Programme relevant sind, sondern die perfekte Übermittlung der passenden Botschaft. In dieser Hinsicht erscheint es fast grotesk, wenn der bedeutendste ehemalige Kunde von Cambridge Analytica und zugleich Präsident der USA das Wort „fake news“ benutzt.

Meinung haben

Edward Snowden, der durch seine Enthüllungen offenbarte, wie unser digitaler Fußabdruck von staatlicher Überwachungssoftware ausgewertet wird, fasst die Konsequenzen in eindrückliche Worte: „Wer keine Angst um seine Privatsphäre hat, weil er nichts zu verbergen hat, der dürfte auch keine Angst um freie Meinungsäußerung haben, weil er nichts zu sagen hat.“

Verwendete Quellen:
Kosinski et al. (2013): “Private traits and attributes are predictable from digital records of human behavior”
Kosinski et al. (2015): „Computer-based personality judgments are more accurate than those made by humans“

Mehr zum Thema

EAM-Blog: Ungekürzte Version