Top-Methodik für Programmiersprachen – IEEE Spectrum

Bei unserem Ziel, die Beliebtheit einer Programmiersprache abzuschätzen, stellten wir fest, dass niemand jeder Person über die Schulter schauen kann, die Code schreibt, sei es ein Kind, das ein Java-Skript für einen persönlichen Minecraft-Server schreibt, oder ein Entwickler mobiler Apps, der darauf hofft, Erfolg zu haben es groß, oder ein Luft- und Raumfahrtingenieur, der geschäftskritischen Code für eine Reise zum Mars schreibt. Unser interaktives Programm „Top-Programmiersprachen“ versucht, das Problem der Schätzung der Beliebtheit einer Sprache anzugehen.

Wir tun dies, indem wir Beliebtheitsmaße aus einer Vielzahl von Datenquellen erstellen, von denen wir glauben, dass sie gute Proxys für aktives Interesse an jeder Programmiersprache sind. Insgesamt identifizieren wir 59 Programmiersprachen. Anschließend gewichten wir jede Datenquelle, um einen allgemeinen Beliebtheitsindex zu erstellen. Im Folgenden beschreiben wir die Datenquellen, die wir zur Ermittlung der Kennzahlen verwenden, und das Gewichtungsschema, das wir zur Erstellung der Gesamtindizes verwenden.

Mit Beliebtheit meinen wir, dass wir versuchen, Sprachen zu bewerten, die aktiv verwendet werden. Wir betrachten drei verschiedene Aspekte der Beliebtheit: Sprachen, die bei typischen IEEE-Mitgliedern und arbeitenden Softwareentwicklern aktiv verwendet werden (das „Spectrum“-Ranking), Sprachen, die von Arbeitgebern nachgefragt werden (das „Jobs“-Ranking) und Sprachen, die in der Rangliste aufgeführt sind Zeitgeist (das „Trending“-Ranking).

Wir haben die Beliebtheit von Sprachen anhand der folgenden Quellen anhand von insgesamt acht Kennzahlen gemessen (siehe unten). Wir haben die Informationen für alle Metriken im Juni–Juli 2023 gesammelt. Die Daten wurden manuell erfasst, um zu vermeiden, dass die Ergebnisse aufgrund von API-Änderungen oder -Beendigungen verzerrt werden und weil viele Namen der Programmiersprache (C++, Scheme) mit gebräuchlichen Begriffen in Forschungsarbeiten kollidieren und Stellenanzeigen oder waren für eine Suchmaschine schwer zu analysieren. Als es bei einer großen Anzahl von Suchergebnissen unmöglich war, Unklarheiten durch die Prüfung aller einzelnen Ergebnisse zu beseitigen, verwendeten wir eine Stichprobe jeder Datenquelle und ermittelten die relevante Stichprobengröße auf der Grundlage einer Schätzung des wahren Mittelwerts mit einer Konfidenz von 95 Prozent. Nicht alle Datenquellen enthalten Informationen für jede Programmiersprache und wir interpretieren diese Informationen so, dass die Programmiersprache „keine Treffer“ hat (d. h. nicht beliebt ist).

Die Ergebnisse jeder Metrik werden normalisiert, um einen relativen Beliebtheitswert zwischen 0 und 1 zu erzeugen. Anschließend werden die einzelnen Metriken mit einem Gewichtungsfaktor multipliziert, kombiniert und das Ergebnis erneut normalisiert, um einen aggregierten Beliebtheitswert zu erzeugen.

Lesen Sie auch  Verbessern Sie die Desktop-Produktivität mit Microsoft Windows 11 Pro für 49,99 $

Durch die Aggregation von Metriken hoffen wir, statistische Besonderheiten zu kompensieren, die den Beliebtheitswert einer Sprache in einer bestimmten Datenquelle verzerren könnten. Durch Variation der Gewichtungsfaktoren können wir unterschiedliche Ergebnisse für die Rankings „Spektrum“, „Jobs“ und „Trending“ erstellen. Wir erkennen voll und ganz an, dass diese Gewichtungen zwar subjektiv sind, sie jedoch auf unserem Verständnis der Quellen und unserer vorherigen Berichterstattung über Softwarethemen basieren. Durch die Variation der Gewichtungsfaktoren können wir verschiedene Arten der Beliebtheit hervorheben und unterschiedliche Beliebtheitsrankings erstellen. Anschließend haben wir jede gewichtete Datenquelle für jedes Programm kombiniert und dann die resultierende Häufigkeit renormiert, um einen aggregierten Beliebtheitswert zu erstellen. Durch die Aggregation über alle Datenquellen hinweg hoffen wir, statistische Besonderheiten zu kompensieren, die den Beliebtheitswert einer Sprache in einer bestimmten Datenquelle verzerren könnten.

Die Top Programming Languages ​​wurden ursprünglich vom Datenjournalisten Nick Diakopoulos erstellt. Unsere statistische Methodikberaterin ist Hilary Wething. Rankings werden mit R berechnet.

Google ist die führende Suchmaschine der Welt und eignet sich daher ideal zur Schätzung der Sprachpopularität. Wir haben die Anzahl der Treffer für jede Sprache gemessen, indem wir nach der Vorlage „X-Programmiersprache“ (mit Anführungszeichen) gesucht haben, und die Anzahl der von der Suche zurückgegebenen Ergebnisse manuell aufgezeichnet. Wir haben die Messung im Juni 2023 durchgeführt. Diese Messung gefällt uns, weil sie den Umfang der Online-Informationsressourcen zu jeder Programmiersprache angibt.

Paketüberfluss

Stack Overflow ist eine beliebte Website, auf der Programmierer Fragen zum Codieren stellen können. Wir haben die Anzahl der Fragen aufgezeichnet, die jedem Programm in der letzten Woche vor unserer Suche (Juni–Juli 2023) zugeordnet wurden. Für die Mathematica/Wolfram-Sprache haben wir uns auf die Schwestersprache „Stack“ für die Mathematica-Plattform verlassen und die Anzahl der in der vergangenen Woche gestellten programmbezogenen Fragen gezählt. Diese Daten wurden manuell erfasst. Diese Kennzahl gibt an, welche Programmiersprachen derzeit im Trend liegen.

IEEE Xplore Digital Library

IEEE unterhält eine digitale Bibliothek mit Millionen von Konferenz- und Zeitschriftenartikeln aus einem breiten Spektrum wissenschaftlicher und technischer Disziplinen. Wir haben für die Jahre 2022 und 2023 nach Artikeln gesucht, die jede der Sprachen in der Vorlage „X-Programmierung“ erwähnen, da dies der kleinste Zeitraum ist, für den wir auf Artikel zugreifen konnten. Für Suchergebnisse, die Tausende von Artikeln ergaben, haben wir die richtige Stichprobengröße für ein 95-prozentiges Konfidenzintervall (normalerweise etwas über 300) ermittelt und diese Anzahl von Artikeln gezogen. Für jede von uns untersuchte Sprache haben wir den Anteil der Artikel ermittelt, die die Programmiersprache verwenden, und dann die Gesamtzahl der Artikel mit diesem Anteil multipliziert, um die wahrscheinliche Gesamtzahl der Artikel zu ermitteln, die auf eine bestimmte Programmiersprache verweisen. Wir haben diese Suche im Juni 2023 durchgeführt. Diese Metrik erfasst die Verbreitung der verschiedenen Programmiersprachen, wie sie in der Ingenieurswissenschaft verwendet und referenziert werden.

Lesen Sie auch  Ein von Apple geplantes Upgrade der App Store-Suchmaschine ist noch nicht das Ende | von Wire Edge | Okt. 2023

IEEE-Jobseite

Wir haben die Nachfrage nach verschiedenen Programmiersprachen in Stellenausschreibungen auf der IEEE Job Site gemessen. Für Suchergebnisse, die Tausende von Stellenangeboten ergaben, haben wir die richtige Stichprobengröße für ein 95-prozentiges Konfidenzintervall (normalerweise etwa 300 Ergebnisse) ermittelt und diese Anzahl von Stellenangeboten zur manuellen Untersuchung herangezogen. Für jede von uns untersuchte Sprache haben wir den Anteil der Stellenangebote ermittelt, die die Programmiersprache verwenden, und dann die Gesamtzahl der Stellenangebote mit diesem Anteil multipliziert, um die wahrscheinliche Gesamtzahl der Stellenangebote zu ermitteln, die sich auf eine bestimmte Programmiersprache beziehen. Da außerdem einige der Sprachen, die wir verfolgen, im Klartext mehrdeutig sein könnten – wie z. B. lD, Go, J, Ada und R –, haben wir nach Stellenausschreibungen mit diesen Wörtern in der Stellenbeschreibung gesucht und die Ergebnisse dann manuell überprüft und erneut Stichproben genommen Einträge, wenn die Anzahl der Ergebnisse groß war. Die Suche wurde im Juli 2023 durchgeführt. Uns gefällt die IEEE Job Site aufgrund ihrer großen Anzahl an Stellenangeboten außerhalb der USA, was sie zu einem idealen Instrument zur Messung der weltweiten Beliebtheit macht.

CareerBuilder

Wir haben die Nachfrage nach verschiedenen Programmiersprachen auf der CareerBuilder-Jobseite gemessen. Wir haben nach „Entwickler“-Jobs gesucht, die in den Vereinigten Staaten angeboten werden, da dies die beliebteste Berufsbezeichnung für Programmierer ist. Wir haben 400 Stellenanzeigen befragt und manuell untersucht, um herauszufinden, welche Sprachen die Arbeitgeber in den Stellenausschreibungen erwähnt haben. Die Suche wurde im Juli 2023 durchgeführt. Wir möchten, dass die Website zum Karriereaufbau die Beliebtheit von Programmiererjobs in den Vereinigten Staaten ermittelt.

GitHub

GitHub ist ein öffentliches Repository für viele von Freiwilligen betriebene Open-Source-Softwareprojekte. Wir haben von GitHut 2.0 gesammelte Daten verwendet, die die 50 am häufigsten verwendeten Sprachen anhand der Anzahl der mit dieser Sprache getaggten Repositorys messen und aus der öffentlichen API von GitHub stammen. Wir verwenden zwei Metriken von GitHub: Repositories, die von Benutzern „markiert“ wurden, um langfristige Interessen widerzuspiegeln, und die Anzahl der Pull-Anfragen, um die aktuelle Aktivität anzuzeigen. Die Daten beziehen sich auf das zweite Quartal 2023. Diese Kennzahlen geben an, in welchen Sprachen Programmierer arbeiten möchten, wenn sie eine persönliche Entscheidung haben.

Lesen Sie auch  Auf welche Anzeichen ist zu achten?

Bibliothek des Trinity College Dublin

Die Bibliothek des Trinity College Dublin ist eine von sechs Pflichtexemplarbibliotheken in Irland und im Vereinigten Königreich. Von jedem in Irland veröffentlichten oder vertriebenen Buch muss eine Kopie bei der Bibliothek hinterlegt werden, und auf Anfrage muss auch jeder britische Verleger oder Vertreiber ein Buch hinterlegen. Wir haben nach allen Büchern gesucht, die im bisherigen Jahresverlauf veröffentlicht wurden und deren Thema der Kategorie „Computerprogrammierung“ zugeordnet war, und die Anzahl der Rücksendungen summiert. Die Suche wurde im Juni 2023 durchgeführt. Diese Bibliothekssammlung gefällt uns, weil sie eine große und kategorisierte Auswahl an Werken, hauptsächlich in englischer Sprache, darstellt.

Zwietracht

Discord ist eine beliebte Chatroom-Plattform, auf der viele Programmierer Informationen austauschen. Wir haben die Anzahl der Tags gezählt, die jeder Sprache entsprechen. Bei Sprachen, bei denen es sich auch um Namen von nicht programmbezogenen Themen handeln könnte (viele nicht programmbezogene Themen verfügen auch über dedizierte Discord-Server; „Julia“ könnte sich beispielsweise auf die Programmiersprache oder die Sesamstraßenpuppe beziehen), wurden die Ergebnisse manuell überprüft. Disboard wurde im Juni 2023 durchsucht. Disboard listet viele öffentliche Discord-Server auf und viele junge Programmierer nutzen die Website, was zu einer anderen demografischen Gruppe von Programmierern führt.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.