Gedanken zur „Facebook-Likes verraten Persönlichkeit“-Studie

Gestern hat eine Studie aus Cambridge etwas für Aufregung gesorgt. Die Ergebnisse über die Vorhersagekraft von Facebook-Likes geisterten durch die Medien, begleitet von Begriffen wie „enthüllen“, „verraten“ und „gläserner Nutzer“. Jetzt mahnen wieder alle über Privatsphäre und die Gefahren von sozialen Netzwerken. Ich muss gestehen, ich verstehe nicht warum man sich so aufregt. Und ich erkläre auch gern warum.

Was wurde da herausgefunden?

Hier nochmal kurz eine Übersicht, was die Studie ergeben hat: Die Forscher nahmen die Facebook-Likes eines Nutzers auf Themen-, Marken-, Produktseiten o.ä., erstellten daraus Nutzermodelle und konnten mit teilweise recht hoher Wahrscheinlichkeit richtig voraussagen, ob jemand zu einer bestimmten Gruppe gehörte (Geschlecht, Religion, sexuelle Orientierung, ethnische Zugehörigkeit, Beziehungsstatus, Raucher etc.). Außerdem wiesen die aus dem Modell errechneten Werten für Persönlichkeitseigenschaften (z.B. Offenheit, Extraversion, Lebenszufriedenheit und Intelligenz) teilweise starke Zusammenhänge mit der Selbsteinschätzung der Nutzer auf.

Interessant daran war, dass die entscheidenden Likes nicht immer nur solche waren, die ziemlich offensichtlich auf die jeweilige Nutzereigenschaft hinweisen, so war zwar der „gefällt mir“-Klick für eine Gegenbewegung zu Prop 8 ein ziemlich guter Indikator für männliche Homosexualität, das gleiche traf aber auch auf „Wicked“ (das Musical) zu. Ok, vielleicht noch ein anderes Beispiel (ich bin etwas Musical-gebiased): Hello Kitty-Likes sagten ganz gut vorher, ob jemand gewissenhaft ist und curly fries (also Spiralpommes) taten dies für Intelligenz.

Das erste was man denkt (und weshalb sich glaube ich alle so aufregen) ist: „Ich klicke hier harmlos vor mich hin, achte darauf was ich von mir preisgebe und im Hintergrund können die so Dinge von mir errechnen, von denen ich gar nicht wollte dass sie jemand erfährt, z.B. meine sexuelle Orientierung oder aber meine politischen Ansichten.“

Diese Angst ist sicherlich nicht ganz unbegründet, aber schauen wir doch nochmal genauer, mit welchen Daten da gearbeitet wurde.

Was wurde in der Studie denn genau gemacht?

Die Facebook-Likes wurden aus realen Nutzungsdaten erfasst. Die Angaben zu politischer Ausrichtung, sexueller Orientierung, Geschlecht und dem Beziehungsstatus wurden ebenfalls aus den Facebook-Profilen extrahiert. Per Fragebogen wurden dann noch Persönlichkeitseigenschaften und Drogenkonsum (Alkohol, Zigaretten) abgefragt.

Was heißt das jetzt?

Konkret heißt das (an einem Beispiel aufgegriffen): Auf Basis der Facebook-Likes konnte zu 88% richtig vorhergesagt werden, ob ein männlicher Nutzer auf Facebook angegeben hatte, dass er an Männern interessiert ist (oder an Frauen). Nochmal anders: Die „richtige“ Klassifizierung orientierte sich nicht an anonym abgegeben Fragebogendaten sondern an Daten die diejenigen sowieso auf Facebook angegeben hatten. Das hat zwei Konsequenzen: Zum einen kann man jetzt sagen „das hättet ihr auch einfacher haben können, schaut doch einfach in meinem Profil nach“ zum anderen muss man auch in Frage stellen, ob auf Basis der Likes denn auch „geheime“ Eigenschaften mit genauso hoher Sicherheit vorhergesagt werden können. Denn wenn ich ohnehin schon gewisse Daten in meinem Profil preisgebe, gehe ich vielleicht auch sorgloser mit meinen Facebook-Likes um.

Also würde man sich jetzt mal anschauen, wie sich denn der Zusammenhang von Likes und den Eigenschaften verhält, die nicht aus dem Facebook-Profil ausgelesen wurden. Und hier liegen dann auch die spannenden Befunde: Ob die Nutzer rauchen, Alkohol trinken oder gar Drogen nehmen wurde per Fragebogen erfasst. Grad der letzte Aspekt ist ein „Interesse“, welches man vielleicht auf Facebook auch eher nicht unbedingt breit tritt sondern für sich behält. Hier funktioniert die Klassifizierung auf Basis der Likes schon weniger gut, aber immerhin auch noch mit 65% der Fälle.

Was bedeutet das für mich als Nutzer?

Auch wenn eine genauere Betrachtung der Vorgehensweise die Skandalträchtigkeit der Daten etwas entschärft, bleibt das Thema nach wie vor wichtig. Eigentlich hat sich nichts geändert. Denn auch ohne diese Studie ist die Vorstellung, dass nicht jeder Like-Klick zu einem Nutzerprofil beiträgt, aus welchem Interessen abgeleitet und Empfehlungen generiert werden, ein wenig naiv. Die Frage ist, welche Daten sind dabei problematisch und wie werden sie verwendet? In jedem Fall gilt: Wenn ich nicht möchte, dass „das Internet“ etwas über mich weiß, sollte ich wahrscheinlich aufhören zu liken. Und zu googlen. Und Produkte bei Amazon aufzurufen.

Kommentar verfassen