About these ads

Facebook und Schufa? Sinnvoll oder machbar?

intro

Facebook LogoHeute machte eine weitere interessante Meldung die Runde: Die Schufa möchte die Daten aus sozialen Netzwerken nutzen. Im Mittelpunkt des Interesses steht auf Grund der Penetration: Facebook. Spontan sah man viele Reaktionen im Netz. Einhelliger Tenor war zum einen, dass diese Nutzung als unverschämt zu erachten sei, aber auch zum anderen, dass es einfach Schwachsinn sei.

Insbesondere auf Twitter konnte man viele Tweets unter den Hashtag “#Schufatweet” lesen, viele humorvolle Exemplare waren Schufatweetdabei. Allerdings können sich viele nicht vorstellen, wie das technisch sinnvoll sein sollte. Da ich mit solchen Techniken hin- und wieder zu tun hatte, wollte ich mal erläutern, wie so etwas aussehen könnte. Für viele vielleicht erschreckend: Ich denke es würde nicht nur funktionieren, sondern das sogar recht “gut” (wobei ich “gut” jetzt im statistischen Sinne meine und keine Bewertung, ob man es wirklich gut finden sollte oder nicht). Zusammenfassend: Der Gedanke ist gar nicht so abwegig, ist das Datensammeln sonst der teuerste Aspekt an solchen Projekten. Und hier liefern die User diese Daten frei Haus.

Wie funktioniert so etwas?

Um so etwas zu entwickeln benötigt man erst mal erste Daten: Man muss zum Beispiel 1.000 Kunden nehmen, die bereits ausgefallen sind. Diese Daten hat die Schufa ja. Nun sucht man sich Kriterien. Diese brauchen gar nicht konkret finanziellen Zusammenhang habe. Es geht: hat der Proband ein Profilfoto, wie viel Kontakte, ist er oft online, hat er viel Konsumermarken abonniert……

Jetzt wird die bereits ausgefallen Gruppe verglichen mit einer normalen Vergleichsstichprobe:

Vergleich AusfallHaben beide Gruppen genau die gleiche Verteilung, kann man es nicht gebrauchen. Aber eine minimale Abweichung reicht bereits aus, um Trennschärfe herzustellen. In meinem Beispiel oben: 59 % aller normalen User haben ein Profilfoto, aber 60 % der Ausgefallenen.

Nun kann man diesem Merkmal allein nichts anfangen. Der Trick ist die Aggregation. Hierzu entwickelt man sogenannte “Scorecards”. Hierbei gibt es in unserem Beispiel oben einen Punkt, wenn er ein Foto hat und 0 Punkte, wenn nicht:

Scoring im Eigenbau

Es werden also 50 oder 100 Merkmale gesucht, wo die Ausfallgruppe minimale Abweichungen hat zur normalen Gruppe und je nach Unterschied Punkte verteilt. Dann geht es wie beim Psychotest der Bravo: Je nach Punkten wird eine Note zugeordnet, wie “gut” der Kunde ist.

Die Chronologie hilft dabei

Was besonders makaber ist: Ausgerechnet die Chronologie vereinfacht die Entwicklung: Die Merkmale, die ein Ausgefallener vor einem Jahr hatte sind oft trennschärfer, als aktuelle. Werte, die sonst kaum bis nicht ermittelbar sind, bietet Facebook frei Haus. Daher ist Facebook mit der exakten Chronologie wesentlich interessanter, als andere Netzwerke.

Ist das bedenklich?

Ich denke: Ja. Allerdings aus anderen Motiven, wie viele spontan annehmen. Dass die Ausfallwahrscheinlichkeit vor einer Kreditvergabe gemessen wird, ist nicht nur üblich, sondern sogar vorgeschrieben. Dass die Schufa dieses tut, finde ich nicht weiter dramatisch.

Aber: Die Schufa hat einer der größten Datenhaushalte in Deutschland. Kombiniert man dieses mit Facebook, sind wir einen Schritt näher am gläsernen Kunden. Würde das passieren, wäre der Staat auch nicht weit weg, zur Gefahrenabwehr die Daten anzuzapfen. Diese Aussicht macht mir doch erhebliche Sorgen.

About these ads
4 Kommentare

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ photo

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

Folgen

Erhalte jeden neuen Beitrag in deinen Posteingang.

Schließe dich 232 Followern an

%d Bloggern gefällt das: