Generell

How-To Analyze Everyone – Teil V: Der Algorithmus weiß besser als Du, wer zu Dir passt

heartsurfaceNoch vor wenigen Jahren war die Nutzung von Online-Partnerbörsen etwas, das man niemandem erzählt hat. Paare, die sich im Internet kennengelernt und zusammengefunden haben, dachten sich nicht selten im Nachhinein eine plausible Kennenlerngeschichte aus, um nicht zugeben zu müssen, dass ein Algorithmus für ihre Bekanntschaft verantwortlich war. Mittlerweile hat sich die Gesellschaftsfähigkeit von Singleplattformen gewandelt und sie sind ein beinahe selbstverständliches Mittel zu Partnersuche geworden. Die Auswahl an Plattformen für jedwede Art von Vorliebe ist riesig. Es gibt Datingseiten für alle Vorlieben und Typen – Singles über 50, „niveauvolle und kultivierte“ Elite-Singles, Übergewichtige, Seitensprünge, Alleinerziehende, Christen, Vegetarier, Metalfans und natürlich: Zombies.


Netzpolitik.org ist unabhängig, werbefrei und fast vollständig durch unsere Leserinnen und Leser finanziert.

Das Geschäft boomt, der Umsatz in Deutschland lag 2011 bei über 200 Millionen. Oftmals besteht eine Datingseite nicht nur aus einer kleinanzeigenähnlichen Liste an Profilen und Bildern, durch die man sich stundenlang klickt, um irgendwann eine vermeintlich sympathische Person zu finden und anzuschreiben. Viele der großen Partnerbörsen versprechen, im Vorfeld geeignete Partner auszuwählen, um eine bessere Erfolgsquote zu garantieren und den Suchenden so Verabredungen zu ersparen, die nur aus peinlich berührtem Schweigen bestehen. Doch was steckt hinter diesen Empfehlungsalgorithmen? Das wollen wir ein bisschen näher beleuchten.

Die Anfänge

Das erste rechnergestützte Datingsystem gab es bereits 1965. Lange vor Facebook wurde Operation Match von den Harvard-Studenten Jeff Tarr, Vaugh Morrill und anderen ins Leben gerufen. Sie entwarfen einen über 100 Punkte langen Fragenkatalog, den Teilnehmer für 3 Dollar ausfüllen konnten. Die Fragen waren nicht immer bierernst gemeint. Eine der Fragen war beispielsweise:

 

Your roommate gets you a blind date for the big dance. Good-looking your roommate says. When you meet your date, you are sure it’s your roommate who is blind – your date is friendly, but embarrassingly unattractive. You:

  1. Suggest going to a movie instead
  2. Monopolize your roommate’s date leaving your roommate with only one noble alternative.
  3. Dance with your date, smiling weakly, but end the evening as early as possible.
  4. Act very friendly the whole time and run the risk of getting trapped into a second date.

 

Der Abgleich und das Finden eines passenden Gegenübers durch Übertragung der Antworten auf Lochkarten und Ermittlung der Übereinstimmungen wurde dann von einem Avco 1790 Computer durchgeführt. Die Namen und Telefonnummern der passenden Dates bekamen die Teilnehmer per Post. Das Prinzip ist simpel, aber dafür auch unflexibel und durch die Auswahl der Fragen anfällig für wenig tragfähige Ergebnisse. Moderne Partnersuche im Netz funktioniert meist anders.

Der zukünftige Partner ist auch nur ein Produkt

Am Anfang die ernüchternde Nachricht: Mit Partnerbörsen verhält es sich im Prinzip wie mit Warenempfehlungen auf Amazon, die wir in einer früheren Folge untersucht haben. Nur werden nicht passende Paare von Kunden und Büchern, sondern zwischen Männern und Frauen oder Männern und Männern oder Frauen und Frauen oder * und * gesucht. Die Ziele sind auf beiden Seiten Menschen. Der Unterschied ist also, dass das Produkt beim Onlinedating der Empfehlung widersprechen kann. „Day of the Dead“ kann wenig dagegen tun, wenn ich es kaufen und schauen will – es sei denn, Amazon fände heraus, dass ich noch nicht alt genug sei. Peter, der gutaussehende Arzt auf einer Datingseite für Mediziner, kann aber beschließen, meine Kontaktanfragen zu ignorieren. Deshalb ist es notwendig, Empfehlungen gut auszuwählen, um die Nutzer nicht zu frustrieren.

Die großen Überschneidungen zwischen Datingempfehlungen und denen anderer Produkten zeigt sich auch bei der Betrachtung der Firmen, die solche Systeme anbieten. Beispielsweise die Londoner Firma RecSys, die darauf spezialisiert ist, Empfehlungssysteme zu großen Datenbeständen zu bauen. Das Schema der angebotenen Systeme – Bilddatenbanken, personalisierte Medienaggregatoren, Kaufempfehlungen und Datingsysteme – ist immer das gleiche:

recsys
via recsys.com

Doch nur wenige Anbieter geben Informationen preis, wie das Innenleben ihrer Algorithmen, also die Ermittlung der passenden Vorschläge, genau aussieht. Einen kleinen Einblick in die Funktionsweise von OkCupid gibt der Mitgründer Christian Rudder, seines Zeichens Mathematiker, in einer TED Lesson.

Drei Faktoren führen zum Glück

OkCupids System beruht darauf, dass es eine riesige Menge Fragen gibt, die beantwortet werden können. Aber es werden nicht nur die Antworten auf die Fragen zur Beurteilung genutzt, sondern die zusätzliche Einschätzung, welche Antworten man von seinem Gegenüber gerne hören würde und wie wichtig die Antwort desjenigen für einen selbst ist. Das ergibt Sinn, denn wenn ich antworte, ein zurückhaltender Mensch zu sein, kann ich mir von meiner zukünftigen besseren Hälfte trotzdem wünschen, extrovertiert zu sein, um mich aus meinem Schneckenhaus zu holen. Und dass für die meisten die Frage, ob der Partner monogam leben möchte wichtiger ist, als die, ob er Brokkoli mag, leuchtet auch ein.

Der Übereinstimmungsquotient wird mit Hilfe der Fragen ermittelt, die von beiden Partnern beantwortet wurden, hier ein Fallbeispiel mit zwei Fragen:

Magst du Zombie-Filme?

  1. überhaupt nicht
  2. ist mir egal
  3. ja, klar

Meine Antwort: 3

Welche Antworten ich akzeptiere: 2 oder 3

Wie wichtig die Frage für mich ist: sehr wichtig

ZombieLovers Antwort: 3

Welche Antworten Zombielover akzeptiert: 3

Wie wichtig die Frage für Zombielover ist: sehr wichtig

und eine zweite Frage:

Verschlüsselst du deine Mails?

  1. was ist das?
  2. nein, nie
  3. manchmal, wenn der Inhalt wichtig ist
  4. immer, wenn mein Gegenüber einen Schlüssel hat
  5. immer, aus Prinzip, sonst verweigere ich den Kontakt

Meine Antwort: 4

Welche Antworten ich akzeptiere: 4 oder 5

Wie wichtig die Frage für mich ist: irgendwie wichtig

ZombieLovers Antwort: 3

Welche Antworten Zombielover akzeptiert: 2, 3

Wie wichtig die Frage für Zombielover ist: ein bisschen

Aus diesen Fragen könnte nun ein erster Übereinstimmungsquotient ermittelt werden. Das geschieht mittels der Antworten und den zugeordneten Wichtigkeiten. Die Relevanz wird in einen numerischen Wert übersetzt:

  • unwichtig: 0
  • ein bisschen: 1
  • irgendwie wichtig: 10
  • sehr wichtig: 50
  • unerlässlich: 250

Insgesamt könnte ZombieLover bei mir 60 „Relevanzpunkte“ bekommen, 50 für die erste und 10 für die zweite Frage. Die erste Frage hat er nach meinem Geschmack beantwortet, also 50 volle Punkte für ihn, die zweite leider nicht. Aber immerhin – 50 von 60 möglichen Punkten und damit 83%.

Umgekehrt gäbe es bei Zombielover insgesamt 51 Punkte zu erreichen. Davon bekomme ich 50, also stolze 98%! Aber da gegenseitige und nicht einseitige Sympathie entscheidend ist, wird die Gesamtwahrscheinlichkeit, dass sich beide Teilnehmer sympathisch sind durch Multiplikation der unabhängigen Einzelwahrscheinlichkeiten ermitteln.

sqrt( 83% * 98% ) = 90,2%

Das hat einen klaren Vorteil gegenüber der reinen Durchschnittsbildung, denn es ist intuitiv ersichtlich, dass ein Gesamtdurchschnittswert von beispielsweise 80% bei einer Verteilung von 60% auf der einen und 100% auf der anderen weniger erfolgsversprechend ist, als wenn beide Teilnehmer je 80% Trefferquote aufwiesen.

okcupidWie man den Algorithmus für sich arbeiten lassen kann

Nicht schlecht für den Anfang und ein erfreulich transparentes und einfaches System. Die Einfachheit führt aber auch dazu, dass das System recht leicht ausgenutzt werden kann. Da man die Antworten, die man selbst nicht beantwortet hat, bei anderen nicht einsehen kann, hat der damalige Mathematik-Doktorand Chris McKinlay 2012 sich einen Hack ausgedacht, für den er sich auf OkCupid zwölf Fake-Profile angelegt hat, die automatisch und zufällig Fragen beantwortet haben. Aus diesen Fragen ließen sich dann die Antworten von Frauen der Plattform ermitteln. Aus den 20.000 ermittelten Profilen ließen sich sieben verschiedene grobe Cluster bilden. Zwei davon passten zu McKinlays Frauengeschmack: Alternative Frauen Mitte Zwanzig und ein wenig ältere in kreativen Berufen.

Der echte Chris McKinlay konnte nun zwei Profile anlegen und so optimieren, dass sie genau zu den Frauentypen passten, die ihn interessierten. Nicht, indem er falsche Antworten gab, sondern, indem er genau diejenigen Fragen beantwortete, bei denen er gleicher Meinung war und die zugeordnete Relevanz so optimierte, dass sich eine höchstmögliche Übereinstimmungsquote ergab. Plötzlich gab es statt der circa 100 Matches von McKinlays früherem Profil über 10.000 Damen, mit denen er eine über 90%ige Übereinstimmung hatte. Mit der Methode lernte er, wenn auch erst nach 88 Dates, tatsächlich seine heutige Partnerin kennen. Seine Erkentnisse hat er als Buch veröffentlicht.

Eine Mischung zwischen Psychotest und Geheimrezept

eHarmony, chemistry.com und viele andere nutzen einen indirekten Ansatz, um Menschen zu verkuppeln. Anhand von Fragebögen werden Persönlichkeitsmerkmale ermittelt, die Kompatibilität entscheidet dann darüber, ob ein Suchender einen bestimmten Partner vorgeschlagen bekommt. chemistry teilt die Nutzer anhand eines Psychotests der Anthropologin Helen Fisher in vier Gruppen ein: den Architekten, den Regisseur, den Diplomaten und den Abenteurer. Zu dieser Einteilung sollen etwa zwanzig Fragen Aufschluss geben, darunter:

Ich finde schnell die richtigen Worte.

  • Trifft vollkommen zu
  • Trifft zu
  • Trifft nicht zu
  • Trifft überhaupt

Zusätzlich zu den bewusst beantworteten Fragen werden unbewusste Faktoren berücksichtigt: Wie viel Zeit verbringt der Nutzer auf der Seite? Wie schnell antwortet er? Wie kommuniziert er im Allgemeinen? Mehr als 500 Variablen nehmen Einfluss auf die am Ende stehenden Vorschläge, die genaue Auswertung unterscheidet sich von Plattform zu Plattform und wird sorgfältig unter Verschluss gehalten. Das zieht natürlich auch ernsthafte Zweifel an „Wissenschaftlichkeit“ und Wirksamkeit mit sich, wie in einer kritischen Analyse aus dem Journal Psychological Science in the Public Interest.

CC-BY 2.0 via Flickr/Abode of Chaos
CC-BY 2.0 via Flickr/Abode of Chaos

Take it to the next level

Ein Kritikpunkt an Online-Dating ist, dass die Partnersuche tatsächlich beinahe zu einer Art „Einkauf“ verkommt und bei der nüchternen Betrachtung und Bewertung von Profilen emotionale und zufällige Faktoren auf der Strecke bleiben. Aber wer das bereits bei den oben aufgeführten fragebasierten Partnerbörsen denkt, für den dürften Dienste wie GenePartner oder das sich in Entstehung befindliche Angebot PAIR eine absolute Horrorversion darstellen. Da gibt es keine stundenlange Investition in das Aufmöbeln des eigenen Profils. Alles, was man zum Partnersuchen braucht, ist eine Speichelprobe. Die optimale Übereinstimmung findet dann ohne weiteres Zutun der Vergleich von DNA-Sequenzen. Genau das richtige für gestresste Geschäftsmenschen, die keine Zeit für sinnloses Suchen haben. Das findet auch PAIR-Werbeträger Edward aus Texas:

I’m a busy guy. Scouring dozens of pages for someone I might get along with gets tiresome. Luckily, Pair found someone for me only weeks after I sent in my kit.

Im Bett mit GCHQ

Klar, Dating-Dienste sind höchst kritisch, wenn es um Datenschutz geht. Die Menge an persönlichen Informationen, die preisgegeben wird, ist enorm hoch und in vermeintlicher Anonymität tendieren die Suchenden zu großer Offenheit, die sie in der Offline-Welt oftmals nie aufbringen würden. Da wird gerne vergessen, dass sich auch der Chef auf der gleichen Singleplattform herumtreiben könnte, auf der man gerade als „HeißerFeger666“ kundtut, dass man gerne einmal mit jemandem seine erotischen Sekretärinnenphantasien ausleben will.

Abgesehen von der persönlichen Dimension scheinen aber auch unsere allseits beliebten Geheimdienste daran interessiert zu sein, wer denn zu uns passen könnte. Kurz vor dem Valentinstag haben uns Leaks gezeigt, dass GCHQ in klassischer Agentenmanier mit sexuellen Lockvögeln arbeitet, um Zielpersonen zur Informationspreisgabe zu bringen oder auch, um sie im Nachhinein bloßzustellen. Dass die britischen Agenten auch sonst viel Energie in die Funktion der menschlichen Wahrnehmung stecken, hat uns eine spätere Präsentation noch genauer erläutert. Das Erkenntnis dabei: Menschen tendieren dazu, das zu sehen, was sie sich wünschen. Und wenn man ihnen das vorspielt, ist es bis zu Sympathie und Vertrauen nicht mehr weit. Die Ähnlichkeit zu dem Hack von McKinlay fällt hier auf. Und wer weiß, wie viele Profile auf Kennenlernbörsen in Wahrheit neugierigen Geheimdienstspionen gehören.

CC-BY-NC-SA 2.0 via Flickr/
CC-BY-NC-SA 2.0 via Flickr/chris

Wem all die fremdbestimmte Suche zu gruselig wird und sich selbst auf die Suche nach dem zweisamen Glück machen will: Es gibt sie noch, die Angebote, die ganz ohne Matching-Algorithmen auskommen. Und wem auch das zu viel potentielle Überwachung bedeutet, der kann es offline versuchen: Mit Zettelchen oder bei schönem Wetter im Park. Aber vorher am besten das Smartphone ausschalten.

 

 

 

 

 

In dieser Reihe erschienen:

chrïs

Weitersagen und Unterstützen. Danke!
6 Kommentare
  1. Ein interessanter und gut geschriebener Artikel, für den ich sogar aus meinem RSS-Feed herausgegangen bin um euch einen Klick zu bescheren (wow, much generous).
    Netzpolitik ist für mich nicht nur Überwachung, deswegen finde ich es gut, dass ihr euch auch mit Themen ein wenig abseits von Sicherheit und Überwachung auseinandersetzt.

  2. Man kann auch mit einer Schönen ins Kino gehen ;)

    Ich würde z.B. sagen, dass ich nie die richtigen Worte finde, obwohl das Gegenteil der Fall ist. Der Algorithmus liefert damit ein völlig falsches Ergebnis.

    Menschen sind nicht berechenbar!

    Ich suche ja immer noch eine Plattform für niveaulose unkultivierte Personen ;D

    „Das erste rechnergestützte Datingsystem gab es bereits 1965.“ Ohne es zu wissen gehe ich davon aus, dass es bereits im Alten Rom und davor „if-then“ Systeme gab.

    Letztlich ist das interessant, was die Autorin zum Schluss anmerkt: es geht um Daten, die zu Geld gemacht werden können.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.