Twitter postet den Code, von dem es behauptet, er bestimmt, welche Tweets die Leute sehen und warum

Vergrößern / Twitter hat den Code veröffentlicht, der von seinem Algorithmus verwendet wird, um seinen Benutzern Tweets zu empfehlen.

Twitter hat sich gut gemacht eines der vielen Versprechen von CEO Elon Muskdas an einem Freitagnachmittag postet, was es behauptet, ist der Code für seinen Tweet-Empfehlungsalgorithmus auf GitHub.

Der Code, der unter einer GNU Affero General Public License v3.0 veröffentlicht wurde, enthält zahlreiche Erkenntnisse darüber, welche Faktoren dazu führen, dass ein Tweet mit größerer oder geringerer Wahrscheinlichkeit in den Timelines der Benutzer auftaucht.

In ein Blogbeitrag, der die Code-Veröffentlichung begleitet, stellt das Technikteam von Twitter (ohne besondere Verfasserangabe) fest, dass das System zur Bestimmung, welche „Top-Tweets, die letztendlich auf der For You-Timeline Ihres Geräts erscheinen“, „aus vielen miteinander verbundenen Diensten und Jobs besteht“. Jedes Mal, wenn ein Twitter-Startbildschirm aktualisiert wird, zieht Twitter „die besten 1.500 Tweets aus einem Pool von Hunderten von Millionen“, heißt es in dem Beitrag.

Die größte Quelle dieser Tweets sind „In-Network-Quellen“ oder Benutzer, denen jemand folgt. Die Top-Tweets aus diesem Stapel werden nach der Wahrscheinlichkeit einer Interaktion eines Benutzers mit dem Autor dieses Tweets geordnet; Je wahrscheinlicher, desto häufiger werden ihre Tweets in For You angezeigt. Für die „Out-of-Network-Quellen“, also diejenigen, denen der Benutzer nicht folgt, berücksichtigt Twitter laut Twitter Tweets, die das Engagement von Personen angezogen haben, denen Benutzer folgen, und Tweets, die von denen gemocht werden, die Tweets mögen, die einem Benutzer ähnlich sind.

Diejenigen, die den Code durchgesehen haben, haben bereits Überlegungen entdeckt, die viele weitere Fragen aufwerfen. Viele haben sie natürlich auf Twitter selbst gepostet.

Ólafur Waage, ein leitender Softwareentwickler beim norwegischen Softwareberatungsdienst TurtleSec, bemerkte, dass in „HomeTweetTypePredicates.scala“ einige der scheinbaren Überlegungen für einen Tweet als Kandidat für den Abschnitt „For You“ lauten:

  • author_is_elon
  • author_is_power_user
  • author_is_democrat
  • author_is_republican

An anderer Stelle im Code stellt ein Codekommentar, der vermutlich von einem Twitter-Ingenieur hinterlassen wurde, klar, dass diese Identifikationswerte „nur für die Erfassung von Metriken verwendet werden“. Der Kommentar lautet wie folgt:

Lesen Sie auch  Quordle heute – Tipps und Antworten für Samstag, 23. September (Spiel Nr. 607)

Diese Autoren-ID-Listen werden ausschließlich für die Erfassung von Metriken verwendet. Wir verfolgen, wie oft wir Tweets dieser Autoren bereitstellen und wie oft ihre Tweets von den Benutzern beeindruckt werden. Dies hilft uns, in unserer A/B-Experimentierplattform zu validieren, dass wir keine Änderungen versenden, die sich negativ auf eine Gruppe gegenüber anderen auswirken.

Die Namen der fraglichen Objekte wie “DDGStatsDemocratsFeature” oder “DDGStatsElonFeature” scheinen diese Interpretation zu unterstützen, aber es ist möglicherweise nicht möglich, dies mit dem verfügbaren Code zu bestätigen. Interessant ist jedoch, dass Twitter diese Variablen prüft und zusammenführt. Während einer Audiositzung von Twitter Spaces bemerkte ein Twitter-Ingenieur, dass die Bezeichnungen „Demokrat“ und „Republikaner“ für Metriken verwendet wurden. Musk, der behauptete, er habe die Etiketten bis heute nicht gekannt, schlug vor, dass sie nicht dort sein sollten.

Andere Dinge, die bei einem Tweet berücksichtigt werden, sind, ob er weniger als 30 Minuten alt ist, ob er Bilder enthält und ob er von einem „Power-User“ stammt manche glauben bedeutet ein “altes” verifiziertes Konto.

Musk hat getwittert neben dem Blogbeitrag des Unternehmens, dass der Empfehlungsalgorithmus behauptet, dass der „Härtetest“ sein wird, wenn „unabhängige Dritte“ „mit angemessener Genauigkeit bestimmen können, was den Benutzern wahrscheinlich angezeigt wird“.

Die Veröffentlichung des Algorithmuscodes von Twitter erfolgt nur wenige Tage, nachdem der breitere Quellcode des sozialen Netzwerks auf GitHub entdeckt wurde, der laut The New York Times möglicherweise seit Monaten dort war. Twitter erwirkte daraufhin eine Vorladung, die GitHub zwang, die Informationen des GitHub-Posters preiszugeben.

Lesen Sie auch  Neue ChatGPT-Tool-Codes, erstellt Diagramme in Sekundenschnelle

Ein Bericht von Platformer Anfang dieser Woche deutete darauf hin, dass Twitter eine geheime Liste von 35 Top-Twitter-Nutzern verwendet hat, darunter Präsident Biden, LeBron James, Ben Shapiro und Musk. Beweise für die Implementierung dieser Liste, die Berichten zufolge teilweise von Musks Unzufriedenheit mit seinem eigenen Engagement angespornt wurde, wurden bisher nicht in der von Twitter veröffentlichten Codebasis gefunden.

Vor allem trifft der Code nur wenige Stunden ein, bevor „Legacy-verifizierte“ Benutzer – diejenigen, die vor dem Kauf des Dienstes durch Musk ein blaues Häkchen erhalten haben, um Authentizität oder Seriosität anzuzeigen – zugunsten zahlender Twitter Blue-Abonnenten nicht verifiziert werden sollen. Während einige Benutzer, die mit Regierungen und großen Organisationen verbunden sind, einen Antrag stellen können Häkchen in anderen Farbennur Twitter Blue-Abonnenten erhalten für 8 $ pro Monat eine „priorisierte Rangfolge in Gesprächen“, unter anderem.

Alle diese Änderungen treten am 1. April oder am Aprilscherz ein.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.