Beiträge aus der Kategorie ‘Data’
Funktioniert Instagrams neuer Mobbing-Filter? So halb. Hier ein paar Daten
16. September 2016
herrfischer
Instagram hat diese Woche eine neue Funktion eingeführt, die manche soziale Netzwerke übernehmen könnten: Neu kann man einstellen, beleidigende Kommentare auf die eigenen Bilder gar nicht erst zu sehen zu bekommen. Sie werden zwar publiziert, aber man selbst sieht sie nicht. So will Instagram nach eigenen Angaben vor allem Mobbing-Opfer schützen.
Die Funktion ist zweiteilig:
1) Kommentare automatisch mit Begriffen filtern, die oft in gemeldeten Kommentaren vorkommen (fuck you, bitch… dergleichen)
2) Selbst Begriffe und Phrasen auflisten, was vor allem für Communities oder User interessant sein dürfte, die den immer gleichen Beschimpfungen ausgesetzt sind.
Aber funktioniert das auch?
Wir arbeiten derzeit an einer Studie über User, die auf Instagram Fotos von Selbstverletzungen posten. Wir haben dabei auch die Kommentare ausgewertet. Beschimpfungen machen zwar nur einen kleinen Teil aller Kommentare auf diese Bilder aus (der grösste Teil entfällt auf Diskussionen, gefolgt von Empathie und Mahnungen, siehe Grafik), können aber sehr heftig sein. Kommentare wie:
Und, zufrieden mit der Aufmerksamkeit die du bekommen hast? Tu der Welt den gefallen und bring dich um du minderbemitteltes Stück Scheiße
Manchmal noch mit Wahlkampfwerbung:
Fuck off faggot go back to your safespace and off yourself cunt ps trump 2016
Ich habe mit Hilfe von AntConc die signifikantesten Begriffe aus dem Korpus der Beschimpfungen gesucht und händisch etwas nachgebessert, um nicht zu viele Nicht-Beschimpfungen mit auszufiltern. Entstanden ist diese Liste:
attention, whore, fucking, shit, aufmerksamkeit, stupid, deeper, seeker, opfer, behindert, dumb, pussy, dumm, disgusting
Nicht sehr einfallsreich, nein. Aber das ist der Vorteil. Die Begriffe reduzieren die Beschimpfungen um fast die Hälfte, ohne die anderen Kommentare stark anzugreifen (selbst bei Diskussionen weniger als 10 % Reduktion):
Kein Allerheilmittel also, aber auch nicht schlecht. Die sich ständig wiederholenden Beschimpfungen filtert es aus. Gegen Kommentare allerdings, die ohne jedes Schimpfwort auskommen («Probier mal das blut als ketchup zu verwenden. Mit pommes frites schmeckt das prima!»), ist die Methode natürlich wirkungslos.
Die Resultate sind noch work in progress und hier nur grob zusammengestellt.
Wie sähe die Reeperbahn aus, wenn man ihr Gebiet in ein 3D-Höhendiagramm verwandeln würde, je nach Anzahl Instagram-Fotos?
Für die neuste Ausgabe des Bahn-Magazins DB mobil hatten wir bereits die Instagram-Daten der Reeperbahn untersucht (kleine 2D-Grafik rechts). Wir wollten wissen, welches die populärsten Hashtags auf dem Gebiet rund um die Strasse sind. Da waren die Neonröhrenstrasse #großefreiheit (1), die Bar mit Aussicht #20up (2), der #docks-Club (3), der (mittlerweile geschlossene) #uppereast-Club (4), die Konditorei #zuckermonarchie mit ihren sehr fotogenen Gebäcken (5), die ebenfalls etwas höhere gelegene #clouds-Bar (6) und der Kirmes #dom (7).
Nun bietet sich bei vielen Längs- und Querstrassen allerdings an, die Daten nicht nur in zwei, sondern drei Dimensionen aufzubereiten. Haben wir also gemacht, mit viel Pink und Neonlicht. Je höher der Hügel, desto mehr Fotos.
Und weil es so schön ist, das Ganze auch zum Selberdrehen:
Bitte beachten: Ein Hashtag kann hochgetragen werden, wenn er in einem ohnehin dichten Gebiet liegt, und konzentrierte Fotos erzeugen mehr Höhe als verstreute – weshalb #uppereast heraussticht und der #dom relativ flach ist, obwohl es deutlich mehr #dom-Bilder gibt.
Für die Bastler unter euch: Basis war eine mit QGIS erstellte Heatmap, die mit Blender erhoben wurde. Ein gutes Tutorial dafür gibt es hier.
«Was wissen wir nach zwei Jahrzehnten digitaler Beziehungsanbahnung? Wen suchen die Millionen? Werden sie glücklich mit denen, die sie im Netz finden?», wollte diese Woche Zeit Online wissen.
Interessante Fragen!
Nun finde ich die Idee ja durchaus charmant, den Gründer eines Datingportals in Liebesdingen zu befragen (auch wenn er vielleicht eher Experte für Digitalabo-Verkauf ist). Dass das Interview ein bisschen nach hausinterner PR riecht: geschenkt. Es wird ja am Ende darauf hingewiesen, dass Zeit Online mit Parship ein wenig verpartnert ist:
«Die Verlagsgruppe Georg von Holtzbrinck, die auch an der ZEIT und an ZEIT ONLINE beteiligt ist, war über ihre Tochter Holtzbrinck Digital bis zum Verkauf an Oakley Capital Mehrheitsgesellschafterin von Parship. Mit einer Minderheit war in den ersten Jahren auch der ZEIT-Verlag an Parship beteiligt. Arne Kahlke besitzt heute keine Anteile an Elitepartner oder Parship mehr. Bis heute existiert eine Werbe-Einbindung von Parship bei ZEIT ONLINE.»
Doch was dann an (voodoo)wissenschaftlich verpacktem Productplacement folgt, hat schon Chuzpe. Man will fast sagen: Hut ab!
Vorab kurz zum ökonomischen Kontext: Kostenpflichtige Singlebörsen wie Parship geraten derzeit von kostenlosen Dating-Apps wie Tinder unter Druck, die vor allem bei Jüngeren beliebt sind. Und das nicht etwa, weil die Jugend am verrohen ist und von der Hose bis zur Partnersuche heutzutage alles casual sein muss. Anbieter wie Tinder haben womöglich einfach einen bequemeren, effizienteren und vor allem billigeren Weg gefunden, passende Leute miteinander zu verbinden.
Aber gut, die Fragen gehen also an einen der (noch) «größten Heiratsvermittler Europas», Arne Kahlke. Von diesem erfahren wir gleich mal, dass das mit der Online-Partnersuche nicht ohne Probleme ist, denn:
«Maximale Freiheit und maximale Optimierung führen nicht zu maximalem Glück.»
Hätten wir das geklärt. Frage ist jetzt natürlich, auf welchen Datingplattformen Freiheit und Optimierung im richtigen Verhältnis stehen für das Glück. Kahlke (hier natürlich nicht als Unternehmer, sondern als Experte unterwegs) deutet zumindest schon mal an, auf welchen das Glück eher nicht zu finden ist:
«Einige Menschen kehren immer wieder auf die Onlineplattformen zurück, sie kommen nie zur Ruhe. Das geschieht besonders häufig bei Angeboten, die sehr detaillierte Wahlmöglichkeiten bieten.»
Die Zahlen würde ich gerne sehen, dass Angebote mit «detaillierten Wahlmöglichkeiten» eine markant höhere Rückkehrerquote haben. Und ob das dann an den Plattformen oder an den Personen liegt. Skeptisch ist Kahlke ausserdem bei Plattformen mit dem umgekehrten Konzept:
«Das andere Extrem sind Dienste, die nur noch nach dem Foto filtern: „Heiß oder nicht?“ Und das soll dann mein Lebenspartner werden?»
Warum nicht? Ich kann mir vorstellen, dass ziemlich viele gute Beziehungen mit genau der (Tinder-)Frage «Heiß oder nicht?» begannen. Aber gut. Hören wir, was der Experte weiter im Tonfall eines Beziehungspsychologen zu erzählen weiss:
«Wir sollten bei den meisten Zahlenkriterien locker lassen, selbst bei Alter, Größe und Gewicht. Es ist viel wichtiger, dass man eine ähnliche Einstellung hat und aus einem ähnlichen sozialen Umfeld mit ähnlichen Grundwerten kommt.
Die Persönlichkeitstests, die bei manchen Angeboten der eigentlichen Vermittlung vorausgehen, zeigen zudem, dass die Menschen ein verschobenes Bild von sich haben. Viele meinen, sie seien ganz anders, als die Tests ergeben.»
Nun ja, Diskrepanzen zwischen Selbsteinschätzung und Testergebnis können natürlich auch daher kommen (nur mal so theoretisch), dass diese Persönlichkeitstests, die gewisse Plattformen ihren Mitgliedern für stolze Preise aufnötigen, ihrerseits Spuren von psychometrischem Schlangenöl enthalten. Aber wir wollen dem Experten hier einfach mal folgen, dass die Tests wahrer sind als die Selbstwahrnehmung und als Vermittlungsmodus sinnvoller als die «Hot or not»-Frage, und verlassen uns fortan nur noch auf Datingplattformen mit Persönlichkeitstests, so wie… Überraschung: Elitepartner oder Parship!
Spannend wird das Interview dann auf Seite 3, vornehmlich wegen der Grafiken aus dem Buch «Inside Big Data» von Christian Rudder, das gerade in deutscher Übersetzung bei Hanser erschienen ist (irgendwie fragte ich mich an dieser Stelle, warum dieses Interview nicht gleich mit Rudder geführt wurde; ich hoffe einfach mal, dass es nichts damit zu tun hat, dass Rudder Mitgründer des Parship-Konkurrenten OKcupuid war). Schauen wir uns die Grafiken an.

Grafik © ZEIT ONLINE – Datenquelle: Christian Rudder, Inside Big Data, Hanser
Da ist zum Beispiel das interessanten Phänomen (links), dass sehr attraktive Frauen (und, in kleinerem Masse, auch Männer) überproportional viele Nachrichten erhalten. Dieser Winner-takes-it-all-Effekt tritt in vielen sozialen Netzwerken auf, ist aber auf Datingportalen ein grosses Problem, weil es ja hier letztlich für jede Person nur eine geben kann (während einen Facebook-Link beliebig viele konsumieren können). Dieses Problem zu lösen gelang beispielsweise Tinder recht elegant: Nachrichten werden erst dann übertragen, wenn beide Interesse aneinander bekundet haben. Die überaus attraktive Person wird nicht überflutet. Sie kriegt noch nicht mal direkt mit, wie begehrt sie ist.
Aber Kahlke weiss natürlich, was die Frauen (und Männer) aus den oberen zehn Prozent der Attraktivitässkala wirklich tun:
«Solche attraktiven Frauen und auch attraktive Männer sind deshalb eher auf Portalen, auf denen es anonymer zugeht, wo man die Bilder erst zu einem späteren Zeitpunkt freischalten kann. So können sie sich verstecken.»
Portale wie – Surprise, Surprise – Parship! Hier lauern sie also, gut versteckt, die attraktivsten der Attraktiven. Gut zu wissen. Wobei mir jetzt noch keine Studie begegnet ist, die die Attraktivität der Mitglieder verschiedener Datingseiten ernsthaft (also vielleicht eher noch nicht mit Deep Learning) vergleicht.
Eine kritische Frage muss sich Kahlke dann aber doch noch stellen lassen: «Suchen manche Menschen auf den ach so konservativen Partnerportalen nicht wieder nur Sex?» Denn klar: da zahlt man 34,90 Euro im Monat, lässt sich psychometrisch vermessen und hat endlich ein Date mit einem dieser versteckten Top-10-Prozenter klar gemacht – und dann will auch dieser nur gut verhüteten Sex. Ist natürlich schlecht. Wäre es da nicht praktisch, wenn es ein System geben würde, das solche Tinder-Männer aussiebt? Man ahnt schon, von welcher Lösung der führende Experte weiss:
«Wenn der Service gebührenpflichtig ist, schützt das, denn es gibt ja so viele Datingangebote, die kostenlos sind – noch mehr aber schützt der sehr aufwändige und damit für viele nervige psychologische Test.»
Macht total Sinn. Männer, die auf Sex aus sind, scheuen ja bekanntlich wirklich jede noch so kleine Investition und Mühe. Niemals würden sie 34,90 Euro für ein Parship-Abo ein Nachtessen ausgeben, nur weil sie sich dadurch eine etwas grössere Chance erhoffen, mit einer Frau im Bett zu landen. Niemals. Und an einer Club-Bar geht es ja auch deutlich schneller zur Sache als die paar Minuten, die man für diese Persönlichkeitstests braucht. Nicht.
Fun Fact: «Bis heute konnte keine Online-Dating-Seite den Erfolg ihres Algorithmus auf eine Weise demonstrieren, die es einem unabhängigen Skeptiker ermöglichen würde, die Arbeit zu überprüfen», schreibt der Autor Patrick Tucker in seinem Buch «The Naked Future». Das war 2015. Vielleicht ist der Beleg mittlerweile erbracht. Falls ja, setzt mich gerne cc. Eine amüsante (und wirklich nicht ernst gemeinte) App vermittelt Singles in der Zwischenzeit allein anhand ihrer Burrito-Vorlieben.
Offenlegung: Ich bin weder praktischer noch theoretischer Experte zum Thema Online-Dating. Ich hatte nur ab und zu, u.a. für Neon, über Singlebörsen und ihre Algorithmen geschrieben.
Es wird jetzt ein bisschen nerdig. Dafür gibt es aber auch 🌺🌼🌷🌸
Keine Ahnung, ob es in dieser Welt von Social Media, Social Gaming, Social Reading und überhaupt Social Everything auch Social Weather gibt (und ich will es grad auch nicht googeln). Es wäre so eine Art gemeinsam gefühltes Wetter, das sich über soziale Netzwerke messen und vielleicht sogar prognostizieren lässt. Ob es morgen schneien wird ist zwar eine wichtige Information. Wie wir den Schnee empfinden werden, wäre aber schon auch gut zu wissen.
In der letzten NEON ging ich noch der Frage nach, ob man mit Daten von Instagram – einem sozialen Netzwerk für überwiegend positive Gefühle – Glücksgefühlen nachspüren kann. Und unsere Datenanalysen begannen mit der Vermessung von Regenbögen. Könnte man also z.B. auch Frühlingsgefühle messen und prognostizieren? Wie fühlen sie sich an? Und wann hat man sie?
Wir haben also die Meta-Daten von Fotos mit Hashtag #frühlingsgefühle genauer untersucht, Aufnahmezeit, Caption etc. Grundsätzlich scheinen sich Frühlingsgefühle ganz gut anzufühlen. Instagrammer verwenden den Hashtags vor allem mit Tags wie #happy 😍, #smile 😊, #glücklich 🌞 oder #genießen 😎 und den entsprechenden Emojis. Sie sind dann im #garten oder beim #spaziergang in der #natur und schauen sich im #sonnenschein ☀️ #blumen 🌷 oder #blüten 🌸 an #bäumen 🌳 an. Alles ist #grün, #rosa und #pink. Schöne Aussichten. Will man lieber nicht verpassen.
Wann also treten Frühlingsgefühle am meisten auf? Nicht ganz überraschend im, nun ja: Frühling. Genauer gesagt März und April (gezählt jeweils 1 Foto/User):
#frühlingsgefühle 2015
Überrascht waren wir, als wir uns März und April genauer anschauten, inkl. Tagestemperaturen (als Ehrerweisung an unsere Alma Mater nahmen wir die von der Wetterstation der Freien Universität Berlin). Meistens häufen sich bestimmte Fotos an bestimmten Wochentagen. Fast die Hälfte aller #spaziergänge findet zum Beispiel am Wochenende statt. Auch #frühlingsgefühle haben eine leichte Tendenz zum Sonntag. Im Wesentlichen steigen und fallen sie aber einfach mit der Temperatur:
#frühlingsgefühle im März
Tagestemperaturen im März (Berlin)
Sobald die Temperatur ausschlägt, schiesst auch der Hashtag #frühlingsgefühle hoch. Die Spitzen sind praktisch identisch (nur dass sie im Laufe der Wochen an Ausprägung verlieren, denn klar: der zweite Temperaturschub löst nicht mehr die gleiche Euphorie aus). Das Schauspiel geht im April weiter:
#frühlingsgefühle im April
Tagestemperaturen April (Berlin)
Für die Statistiker unter euch (ich gehöre selbst nicht dazu): Die Korrelation der beiden Kurven beträgt März/April .45 für die Wetterstation in Berlin, .60 in Düsseldorf und .32 in München. Also ganz gut dafür, dass die Fotos jeweils über den ganzen deutschsprachigen Raum verteilt sind, oder?
Wann setzen denn nun endlich unsere Frühlingsgefühle ein? Wie warm muss es werden? Wann geht es endlich los mit ☀️🌸🌷😍💕🌞😊💐🌼🌺?
Nun, an jenen Tagen im März, an denen erstmals überdurchschnittlich viele #frühlingsgefühle gepostet werden, klettert die Temperatur über 12 Grad. Es dürfte also – zumindest in Teilen Deutschlands – noch vor dem Frühlingsanfang nächsten Sonntag so weit sein mit dem gefühlten Frühling. Hooray!
Die Wetterdaten sind vom Deutschen Wetterdienst
„Deutschland verstehen mit Instagram“ heisst unsere neue Kolumne im DB mobil, dem Magazin der Deutschen Bahn. Jeden Monat werden wir mit einer kleinen Datenanalyse einem deutschen Phänomen auf den Grund gehen – bis hin zur Frage im November, was es mit dem Lebkuchenknick auf sich hat…
In der ersten Folge wollten wir schlicht wissen, was in deutschen Grossstädten das meistfotografierte Objekt ist. Viel Spass!