Analyse sozialer Netzwerke enthüllt volles Ausmaß der Twitter-Bot-Kampagne des Kremls

Profilbilder aus einem großen Netzwerk von pro-Kreml-Accounts - Bild: Lawrence Alexander

Profilbilder aus einem großen Netzwerk von pro-Kreml-Accounts - Bild: Lawrence Alexander 

Analytik und Meinungen, Empfehlung, Russland, Soziales

Artikel von: Lawrence Alexander
Quelle: Global Voices Online 2. April 2015

Lawrence Alexander

Lawrence Alexander

Mit Hilfe von Open-Source-Tools sammelte und visualisierte der Internet-Forscher Lawrence Alexander Daten von fast 20.500 pro-Kreml Twitter-Accounts und enthüllte damit das massive Ausmaß von versuchter Informationsmanipulation im RuNet. Im ersten Teil der zweiteiligen Analyse erklärt er, wie er vorgegangen ist und was er herausgefunden hat.

RuNet Echo hat vor kurzem über die Anstrengungen der russischen “Troll-Armee berichtet, pro-Kreml Rhetorik in die sozialen Netzwerke und Medien-Websites einzubringen, Twitter ist keine Ausnahme, und eine große Zahl von Nutzer_innen hat beobachtet, dass Twitter-Accounts während und rund um wichtige Eilmeldungen und Ereignisse ähnliche Stellungnahmen twittern. Diese „Bots“ [Anm. d. Übers.: von „robot“, Computerprogramm], die so gestaltet wurden, dass sie wie richtige Twitter-User, komplett mit Avatar, aussehen, waren während der russischen Interventionen in der Ukraine vermehrt aktiv.

Aber die Beweise in dieser zweiteiligen Analyse verweisen auf ihre Rolle in einem großflächigen Desinformationsprogramm.

Alec Luhn, ein US-Journalist, der über russische Themen berichtet, beobachtete, wie schon wenige Stunden nach der Ermordung von Boris Nemzow am 27. Februar eine Gruppe von Twitter-Accounts versuchte, die Geschichte zu beeinflussen.

Mit dem Open Source Tool NodeXL sammelte und importierte ich eine ganze Liste von Accounts, die genau diesen Satz twitterten, in eine Tabelle. Von dieser Liste sammelte und importierte ich auch eine erweiterte Community von Twitter-Usern, die sich aus den Freunden und Followern jedes Accounts zusammensetzte. Es würde ein interessanter Test werden: Falls die Verunglimpfungen Nemzows nur ein Bagatellfall von gestreuten Gerüchten wären, dann kämen sie vermutlich von nicht mehr als einem Dutzend Usern.

Aber sobald die Software mit der Datenverarbeitung fertig war, wurde das volle Ausmaß des Netzwerks sichtbar: atemberaubende 2.900 Accounts. Diese Zahl ist vielleicht verständlich: Damit ein gefakter Twitter-Account glaubwürdig ist, braucht er viele Follower – was wiederum mehr Bots zur Unterstützung benötigt.

Anschließend verwendete ich Gephi, ein weiteres Gratis-Analyse-Tool, um die Daten als Graphik der Beziehungen zwischen den Entitäten zu visualisieren. Die bunten Kreise – ‘nodes’ (Datenknoten) genannt – repäsentierten Twitter-Accounts und die Schnittlinien  – ‘edges’ genannt – verweisen auf die Verbindung der Follower zwischen den Accounts. Die Accounts sind in farb-kodierte Community-Cluster zusammengefasst, basierend auf dem Modularitäts-Algorithmus, der eng verbundene, zusammengehörige Gruppen entdeckt. Die Größe der Datenknoten beruht auf der Anzahl der Verbindungen, die dieser Account mit anderen im Netzwerk hat.

Erweitertes Netzwerk von 2.900 Twitter Bots aus dem Nemzow-Thread. Bild: Lawrence Alexander

Erweitertes Netzwerk von 2.900 Twitter Bots aus dem Nemzow-Thread. Bild: Lawrence Alexander

Aus der Dichte und Nähe dieser Datenknoten in der Graphik wird klar, dass es ein großes und stark vernetztes Netzwerk ist. Die meisten Bots folgen vielen anderen und verleihen ihnen dadurch eine hohe Follower/Folge ich Zahl. An der Peripherie gibt es ein paar Ringe von weniger vernetzten Accounts, was darauf hindeuten könnte, dass das „Bot“-Netzwerk zur Zeit der Erfassung noch im Wachsen war; man könnte es sich als Baum vorstellen, mit sich nach außen verbreitenden Zweigen.

Es gab jedoch eine entscheidende Frage in dieser Analyse: Wie kann man sicher sein, dass das Netzwerk hauptsächlich aus Bots und nicht aus richtigen Menschen bestand?

NodeXL sammelt nicht nur Informationen darüber, wer wem folgt. Es erfasst auch Meta-Daten – die öffentlich verfügbaren Details jedes Twitter-Accounts und seines Verhaltens. Das zeigt, dass 87% der Profile dieses 2.900 starken Netzwerkes keine Informationen über Zeitzonen und 92% keine Twitter-Favoriten hatten. Aber in einer Zufallsstichprobe von 11.282 durchschnittlichen Twitter-Usern (basierend auf Accounts, die das Wort „und“ getwittert hatten) hatten nur 51% keine Zeitzone und – aufschlussreich – nur 15% keine Favoriten (beides Merkmale eines Verhaltens, das man als „menschlich“ klassifizieren könnte).

Zum weiteren Vergleich unten eine Graphik, die die Beziehungen der Entitäten der Zufallsstichprobe des Kontrollnetzwerks der Twitter-Nutzer_innen zeigt. Im Gegensatz zur Bots-Visualisierung hat dieses Netzwerk mehrere nicht verbundene und isolierte Cluster: Twitter-Nutzer_innen, die nicht miteinander verbunden sind – ein völlig normaler Umstand in einer zufälligen Nutzergruppe.

Mehrfachnutzung des Wortes „und“ führt in einer zufällig ausgewählten Twitter-Nutzer Gruppe zu nicht verbundenen, isolierten Clustern. Bild: Lawrence Alexander

Mehrfachnutzung des Wortes „und“ führt in einer zufällig ausgewählten Twitter-Nutzer Gruppe zu nicht verbundenen, isolierten Clustern. Bild: Lawrence Alexander

Nachdem ich aus einer einzigen Quelle ein derart groß angelegtes Netzwerk zutage gefördert hatte, entschloss ich mich, die Bot-Jagd auszuweiten. Als ich Twitter nach Phrasen wie „Kreml-Bots“, „pro-russische Trolle“ und „Putin-Sockenpuppe“ (Fake Accounts) durchsuchte, fand ich mehrere Nutzer_innen, die Screenshots von mutmaßlichen Bot-Aktivitäten teilten. Manche benützen auch den Hashtag #Kremlinbots (#Кремлеботы), um über die Beobachtungen zu berichten.

Mit derselben Methode wie bei den Anti-Nemzow Tweets sammelte ich Netzwerke von Accounts, die auf der Benützung einiger Schlüsselphrasen, die größere Communitys aufdeckten, basierte – oder in einigen Fällen nur eine Liste von Nutzer_innen, die man in dem Screenshot sah. Diese wurden in Gruppen geteilt und mit A, B, C und D beschriftet. (Auf den Grund für diese Beschriftung gehe ich im zweiten Teil der Analyse näher ein.)

@PressRuissa ist ein Satire-Account (nun gesperrt), der pro-russische Medien verulkt, eine Mischung aus Satire und Kommentar zu Desinformation und Voreingenommenheit. Einer der Tweets war die Ausgangsquelle für das Netzwerk der Gruppe A:

Die russischen Twitterer zeigen in überraschender Übereinstimmung, dass “Nowaja Gaseta ihre Bot-Aktivität vertuscht”. (via @nokato) pic.twitter.com/DSwcIKWpDg

— Falcon News Intl. (@PressRuissa) March 13, 2015 [Anm. d. Übers.: Account offenbar mittlerweise gesperrt]

Gruppe B kam aus verschiedenen Bot-verdächtigen Accounts, deren Verhalten zu den vorhergehenden Samples zu passen scheint. Einige wurden durch ihre Tendenz identifiziert, vom Russischen ins Englische zu wechseln, mit der einzigen Fehlermeldung „RSS in Offline-Modus“ – vermutlich durch eine Panne in der Kontrollsoftware verursacht.

RSS in offline mode

— Леонид Верхратский (@GCL2BUugsq4n5JL) April 1, 2015

Für die restlichen Quellen bildet ein Tweet von Devin Ackles, eines Analysten des Think-Tanks CASE Ukraine, die Basis für Gruppe C.

Und zu guter Letzt teilte Vitaliy Moroz von Internews Ukraine einen Screencap von Bot-Accounts, die das Sample für Gruppe D bildeten.

Alle vier Gruppen wurden in einem einzigen Datensatz zusammengeführt, was insgesamt 17,590 Twitter-Accounts ergab. Wie bei jenen, die die Anti-Nemzow-Bots produziert hatten, zeigten die Meta-Daten, dass die große Mehrheit davon tatsächlich Bots waren. 93% zeigten keinen Ort im Profil an, 96% hatten keine Information zur Zeitzone und 97% hatten keine Twitter-Favoriten gespeichert.

Obwohl sie im Durchschnitt 2830 Tweets produziert hatten, interagierten die Accounts auch fast nie mit anderen Twitter-Nutzer_innen durch @Antworten oder @Mentions (Erwähnungen).

Die Bots senden Tweets, interagieren aber nicht. Bild: Lawrence Alexander

Die Bots senden Tweets, interagieren aber nicht. Bild: Lawrence Alexander

Interessanterweise wurden den Bots westlich klingende Namen gegeben, wie zum Beispiel barnardgrant, terancebarnaby, terencecoward und duncanstarks.

Ein noch überraschenderes Resultat ergab sich, als ich die Follow-Beziehungen der Bot-Gruppen visualisierte. Obwohl ich die Samples aus vier verschiedenen Quellen gezogen hatte, stellte sich heraus, dass das kombinierte Netzwerk stark vernetzt war.

Alle 17.590 Accounts aus allen vier Quellen. Man beachte die engen Verflechtungen und das Fehlen isolierter Cluster. Bild: Lawrence Alexander

Alle 17.590 Accounts aus allen vier Quellen. Man beachte die engen Verflechtungen und das Fehlen isolierter Cluster. Bild: Lawrence Alexander

Dies steht in krassem Gegensatz zum randomisierten (zufälligen) Kontroll-Sample: Der endgültige Datensatz zeigte überhaupt keine isolierten Gruppen oder isoliertes Vorkommen. Das legt den Schluss nahe, dass die Bots von einer einzigen Agentur geschaffen wurden – und die Beweislast zeigt stark in Richtung Moskau.

Artikel von: Lawrence Alexander
Quelle: Global Voices Online 2. April 2015

Übersetzt von: Euromaidan Press Übersetzerteam Deutsch

Schlagworte:, , , , , ,