Das jahrzehntealte ASCII-Abenteuer NetHack könnte auf die Zukunft der KI hinweisen – TechCrunch

Modelle des maschinellen Lernens haben bereits Schach, Go, Atari-Spiele und mehr gemeistert, aber um auf die nächste Stufe aufzusteigen, beabsichtigen die Forscher bei Facebook, dass KI eine andere Art von Spiel annimmt: das notorisch schwierige und unendlich komplexe NetHack.

„Wir wollten mit diesem Spiel die unserer Meinung nach am leichtesten zugängliche „große Herausforderung“ entwickeln. Es wird nicht lösen KI, aber sie wird Wege in Richtung unlock freigeben besser AI“, sagte Edward Grefenstette von Facebook AI Research. „Spiele sind eine gute Domäne, um unsere Annahmen darüber zu finden, was Maschinen intelligent macht, und sie zu brechen.“

Sie kennen NetHack vielleicht nicht, aber es ist eines der einflussreichsten Spiele aller Zeiten. Du bist ein Abenteurer in einer Fantasy-Welt und tauchst durch die immer gefährlicheren Tiefen eines Dungeons, der jedes Mal anders ist. Sie müssen Monster bekämpfen, Fallen und andere Gefahren überwinden und in der Zwischenzeit mit Ihrem Gott gut auskommen. Es ist das erste „Roguelike“ (nach Rogue, seinem unmittelbaren und viel einfacheren Vorgänger) und wohl immer noch das Beste – mit ziemlicher Sicherheit das härteste.

(Es ist übrigens kostenlos und Sie können es herunterladen und auf fast jeder Plattform spielen.)

Seine einfache ASCII-Grafik, die ag für einen Goblin, ein @ für den Spieler, Linien und Punkte für die Architektur des Levels usw. verwendet, täuscht über seine unglaubliche Komplexität hinweg. Denn Nethack, das 1987 sein Debüt feierte, wird seitdem aktiv weiterentwickelt, wobei sein wechselndes Entwicklerteam seine Liste von Objekten und Kreaturen, Regeln und den unzähligen, unzähligen Interaktionen zwischen ihnen allen erweitert.

Und das ist ein Teil dessen, was NetHack zu einer so schwierigen und interessanten Herausforderung für KI macht: Es ist so offen. Die Welt ist nicht nur jedes Mal anders, sondern jedes Objekt und jede Kreatur kann auf neue Weise interagieren, die meisten von ihnen über Jahrzehnte handcodiert, um jede mögliche Spielerwahl abzudecken.

NetHack mit kachelbasiertem Grafik-Update – alle Informationen stehen weiterhin per Text zur Verfügung.

„Atari, Dota 2, StarCraft 2… die Lösungen, die wir dort gefunden haben, sind sehr interessant. NetHack stellt einfach andere Herausforderungen. Man muss sich auf menschliches Wissen verlassen, um das Spiel als Mensch zu spielen“, sagte Grefenstette.

Lesen Sie auch  Könnten Videospiele NFTs zu den Massen bringen?

In diesen anderen Spielen gibt es eine mehr oder weniger offensichtliche Strategie zum Gewinnen. Natürlich ist es in einem Spiel wie Dota 2 komplexer als in einem Atari 800-Spiel, aber die Idee ist dieselbe – es gibt Teile, die der Spieler kontrolliert, ein Spielbrett der Umgebung und Gewinnbedingungen, die verfolgt werden müssen. Das ist bei NetHack so, aber es ist noch seltsamer. Zum einen ist das Spiel jedes Mal anders, und das nicht nur im Detail.

„Neuer Dungeon, neue Welt, neue Monster und Gegenstände, du hast keinen Speicherpunkt. Wenn du einen Fehler machst und stirbst, bekommst du keinen zweiten Schuss. Es ist ein bisschen wie im richtigen Leben“, sagte Grefenstette. „Man muss aus Fehlern lernen und mit diesem Wissen in neue Situationen kommen.“

Einen ätzenden Trank zu trinken ist natürlich eine schlechte Idee, aber wie wäre es, ihn auf ein Monster zu werfen? Ihre Waffe damit beschichten? Auf das Schloss einer Schatzkiste gießen? Mit Wasser verdünnen? Wir haben intuitive Vorstellungen von diesen Aktionen, aber eine spielstarke KI denkt nicht so wie wir.

Die Tiefe und Komplexität der Systeme in NetHack sind schwer zu erklären, aber diese Vielfalt und Schwierigkeit machen das Spiel laut Grefenstette zu einem perfekten Kandidaten für einen Wettbewerb. “Man muss sich auf menschliches Wissen verlassen, um das Spiel zu spielen”, sagte er.

Menschen entwickeln seit vielen Jahren Bots zum Spielen von NetHack, die nicht auf neuronalen Netzwerken basieren, sondern auf Entscheidungsbäumen, die so komplex sind wie das Spiel selbst. Das Team von Facebook Research hofft, einen neuen Ansatz zu entwickeln, indem es eine Trainingsumgebung aufbaut, in der Menschen auf maschinellem Lernen basierende Spielalgorithmen testen können.

NetHack-Bildschirme mit Beschriftungen, die zeigen, was der KI bewusst ist.

Die NetHack Learning Environment wurde eigentlich letztes Jahr zusammengestellt, aber die NetHack Challenge beginnt erst jetzt. Das NLE ist im Grunde eine Version des Spiels, die in eine dedizierte Computerumgebung eingebettet ist, mit der eine KI über Textbefehle (Anweisungen, Aktionen wie Angriff oder Quaff) mit ihm interagieren kann.

Lesen Sie auch  Stardew Valley Mod macht das Angeln im Spiel einfacher

Ein verlockendes Ziel für ambitionierte KI-Designer. Während Spiele wie StarCraft 2 in gewisser Weise ein höheres Ansehen genießen können, ist NetHack legendär und die Idee, ein Modell auf völlig anderen Linien zu bauen als andere Spiele zu dominieren, ist eine interessante Herausforderung.

Es ist auch, wie Grefenstette erklärte, zugänglicher als viele in der Vergangenheit. Wenn Sie eine KI für StarCraft 2 erstellen wollten, brauchten Sie viel Rechenleistung, um visuelle Erkennungs-Engines auf den Bildern aus dem Spiel auszuführen. Aber in diesem Fall wird das gesamte Spiel per Text übertragen, was die Arbeit äußerst effizient macht. Es kann tausendmal schneller gespielt werden, als es jeder Mensch selbst mit dem einfachsten Computer-Setup könnte. Damit bleibt die Herausforderung für Einzelpersonen und Gruppen offen, die keinen Zugang zu den leistungsstarken Setups haben, die für andere maschinelle Lernmethoden erforderlich sind.

„Wir wollten eine Forschungsumgebung schaffen, die viele Herausforderungen für die KI-Community stellt, aber nicht nur auf große akademische Labore beschränkt“, sagte er.

In den nächsten Monaten wird NLE für Testzwecke verfügbar sein, und Wettbewerber können ihren Bot oder ihre KI im Grunde auf beliebige Weise aufbauen. Aber wenn der Wettbewerb selbst am 15. Oktober ernsthaft beginnt, werden sie auf die Interaktion mit dem Spiel in seiner kontrollierten Umgebung durch Standardbefehle beschränkt – kein spezieller Zugriff, keine Überprüfung des RAM usw.

Das Ziel des Wettbewerbs wird es sein, das Spiel zu beenden, und das Facebook-Team verfolgt, wie oft der Agent in einer bestimmten Zeit „aufsteigt“, wie es in NetHack heißt. Aber „wir gehen davon aus, dass es für alle gleich null wird“, gab Grefenstette zu. Schließlich ist dies eines der härtesten Spiele aller Zeiten, und selbst Menschen, die es seit Jahren spielen, haben Probleme, einmal im Leben zu gewinnen, geschweige denn mehrmals hintereinander. Es wird andere Bewertungsmetriken geben, um die Gewinner in einer Reihe von Kategorien zu beurteilen.

Lesen Sie auch  Twitter macht Änderungen rückgängig, die Einbettungen gelöschter Tweets in leere Kästchen verwandelt haben

Die Hoffnung ist, dass diese Herausforderung den Keim für einen neuen Ansatz für die KI darstellt, der dem tatsächlichen menschlichen Denken grundsätzlicher ähnelt. Shortcuts, Trial-and-Error, Score-Hacking und Zerging funktionieren hier nicht – der Agent muss logische Systeme erlernen und sie flexibel und intelligent anwenden oder durch die Hände eines wütenden Zentauren oder Eulenbären schrecklich sterben.

Sie können die Regeln und andere Besonderheiten der NetHack Challenge hier einsehen. Die Ergebnisse werden auf der NeurIPS-Konferenz im Laufe dieses Jahres bekannt gegeben.

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.