Geheimnisvolles KI-Modell „gpt2-chatbot“ verblüfft Experten: Durchbruch oder bloßer Hype?

Entdecken Sie, wie Unternehmen KI verantwortungsvoll in die Produktion integrieren. Bei dieser Veranstaltung in SF, die nur auf Einladung stattfindet, wird die Schnittstelle zwischen Technologie und Wirtschaft erkundet. Erfahren Sie hier, wie Sie teilnehmen können.


Ein leistungsstarkes neues künstliches Intelligenzsystem, das heute auf mysteriöse Weise im Internet aufgetaucht ist, hat ein hektisches Ratespiel über seine Ursprünge und Fähigkeiten entfacht – wobei einige Forscher glauben, dass es einen bedeutenden Sprung gegenüber bestehenden KI-Modellen darstellt.

Das Modell mit dem Namen „gpt2-chatbot“ tauchte ohne großes Aufsehen auf einer Website auf, die zum Vergleichen von KI-Sprachsystemen beliebt ist (LMSYS Chatbot Arena, erstellt mit Gradio). Aber seine Leistung war alles andere als unauffällig, denn KI-Experten zeigten sich überrascht und begeistert darüber, dass es den Fähigkeiten von GPT-4, dem fortschrittlichsten System, das bisher vom renommierten Labor OpenAI vorgestellt wurde, gleichkommt und möglicherweise sogar übertrifft.

„[It’s] Natürlich ist es unmöglich zu sagen, wer es gemacht hat, aber ich stimme den Einschätzungen zu, dass es mindestens GPT-4-Niveau ist“, sagte Andrew Gao, ein KI-Forscher und Student der Stanford University, der die Entstehung des „gpt2-chatbot“ online genau verfolgt hat.

In einer Reihe von Beiträgen auf X.com (ehemals Twitter) stellte er fest, dass das Modell beim ersten Versuch ein Problem der Internationalen Mathematikolympiade, einem prestigeträchtigen Wettbewerb für Oberstufenschüler, löste. „Die IMO ist wahnsinnig hart“, sagte Gao. „Nur die vier besten Mathematikstudenten der USA kommen zum Wettbewerb.“

VB-Ereignis

Die AI Impact Tour – San Francisco

Begleiten Sie uns bei der nächsten Station der AI Impact Tour von VB in San Francisco, während wir uns durch die Komplexität einer verantwortungsvollen Integration von KI in Unternehmen bewegen. Verpassen Sie nicht die Chance, Einblicke von Branchenexperten zu gewinnen, sich mit gleichgesinnten Innovatoren zu vernetzen und anhand von Kundenerlebnissen die Zukunft von GenAI zu erkunden und Geschäftsprozesse zu optimieren.

Eine Einladung anfordern

Ethan Mollick, ein Professor an der Wharton School der University of Pennsylvania, der sich mit KI beschäftigt, sagte, dass das Modell in seinen Experimenten bei komplexen Denkaufgaben wie dem Schreiben von Code zum Zeichnen eines Einhornbildes besser abschnitt als GPT-4. „Vielleicht besser als GPT-4“, sagte er. „Schwer zu sagen, aber es schneidet im ikonischen Stil viel besser ab.Zeichne ein Einhorn mit Code‘ Aufgabe.”

Lesen Sie auch  Vor der O3-Station gibt es ein Gespräch über die Berufsfachschule (2023 Woche 5) – Affen kämpfen gegen Löwen, um zu wählen, und sie konkurrieren um den einen oder anderen. - Sekundäre Berufsausbildung - Baseball

Über die Ursprünge des mysteriösen Modells wird wild spekuliert

Die starke Leistung des Modells hat zu heftigen Spekulationen darüber geführt, wer es erstellt haben könnte und warum es ohne Veröffentlichung auf einer Test-Website veröffentlicht wurde.

Viele Forscher glauben, dass „gpt2-chatbot“ wahrscheinlich von OpenAI stammt, dem einflussreichen Labor hinter ChatGPT, DALL-E und anderen Systemen, die die KI im vergangenen Jahr vorangetrieben haben. Das Modell nennt sich „ChatGPT, ein großes Sprachmodell, das von OpenAI trainiert wurde und auf der GPT-4-Architektur basiert.“ Diese Behauptung lässt sich jedoch nicht einfach überprüfen, da KI-Systeme angewiesen werden können, sich selbst auf irreführende Weise zu beschreiben.

Einige Experten wiesen auf Ähnlichkeiten zwischen „gpt2-chatbot“ und früheren OpenAI-Modellen als Beweis dafür hin, dass es aus dem Labor stammte. „Mir und anderen wurde gesagt, dass es von OpenAI erstellt wurde“, sagte Gao in einem Beitrag auf X.com. „Dies ist jedoch aufgrund der Datenkontamination ein schwaches Signal (viele Modelle werden auf OpenAI-Chats trainiert und denken daher, dass sie von OpenAI erstellt wurden).“

Andere bemerkten, dass „gpt2-chatbot“ zwar in seinen Fähigkeiten GPT-4 nahe kommt, aber hinter dem zurückbleibt, was viele von GPT-5, dem angeblichen nächsten großen Modell von OpenAI, erwarten. „Ich schaue mir die Eingabeaufforderungen zur Geschäftsidee für fast alle Modellveröffentlichungen an, und die Antworten scheinen eher auf Agentenmaßnahmen ausgerichtet zu sein“, sagt Joe Fox, ein KI-Forscher. sagte in einem X.com-Beitragwas darauf hindeutet, dass „gpt2-chatbot“ in einigen praktischen Tests keinen großen Sprung gegenüber GPT-4 darstellt.

Lesen Sie auch  Kann KI dem Arc-Browser dabei helfen, es mit Google Chrome oder Microsoft Edge aufzunehmen?

Es besteht weiterhin die Möglichkeit, dass „gpt2-chatbot“ von einem weniger bekannten Unternehmen oder einer weniger bekannten Forschungsgruppe stammen könnte, die ihre KI-Fähigkeiten unter Beweis stellen und für Aufsehen sorgen wollte. Einige haben auf das Beispiel von GPT-4chan verwiesen, einem umstrittenen KI-Modell, das im Juni 2022 vom KI-Forscher Yannic Kilcher veröffentlicht wurde und das ebenfalls die beliebte GPT-Namenskonvention nutzte, aber nicht mit OpenAI verbunden war (und schließlich von der Hugging Face-Plattform entfernt wurde). „Erzeugung schädlicher Inhalte“).

Unerwartete Fähigkeiten weisen auf weiteres Potenzial hin

Während Experten weiterhin den „gpt2-chatbot“ untersuchen, um das Ausmaß seiner Fähigkeiten aufzudecken, sind mehrere Verhaltensweisen zutage getreten, die auf weitere potenzielle Fortschritte hinweisen.

Die Forscher waren überrascht, als sie herausfanden, dass das Modell offenbar eher dazu bereit ist, Regeln zu brechen und Einschränkungen zu ignorieren, als frühere Chatbots wie ChatGPT. Dimitris Papailiopoulos, KI-Professor an der University of Wisconsin, sagte, das Modell könne ein Logikrätsel lösen, an dem GPT-4 in der Vergangenheit scheiterte. „Ich habe festgestellt, dass der gpt2-chatbot besser ist als alle anderen Modelle und völlig nutzlos“, scherzte er.

Das Modell hat auch seine Eignung zum Schreiben anspruchsvollen Codes bewiesen. Chase McCoy, Gründungsingenieur bei CodeGen, sagte, dass gpt2-chatbot „bei allen Codierungsaufforderungen, die wir zum Testen neuer Modelle verwenden, besser abgeschnitten hat“ als GPT-4 oder Claude Opus. „Die Stimmung ist definitiv da“, sagte er.

Einige Benutzer stellten sogar fest, dass das Modell in einen hin- und hergehenden Dialog eintreten konnte, um seine Antworten iterativ zu verbessern und so ein Bewusstsein für seine eigenen Grenzen und Denkprozesse zu demonstrieren. „Es scheint besser als GPT-4 darin zu sein, zu planen, was getan werden muss“, sagte Gao. „Zum Beispiel werden potenzielle Websites zum Anschauen und potenzielle Suchanfragen angezeigt. GPT-4 gibt eine viel vagere Antwort.“

Lesen Sie auch  Trumps Wahlkampfteam hat sich bemüht, gefälschte Wählerdokumente an Pence zu bringen: germanic

Das unerbittliche Tempo des Fortschritts

Unabhängig von seinem wahren Ursprung und seinem vollen Potenzial unterstreicht das Aufkommen von „gpt2-chatbot“, wie schnell sich der Bereich der künstlichen Intelligenz entwickelt und wie schwierig es geworden ist, den Überblick über die neuesten Durchbrüche zu behalten.

Vor etwas mehr als einem Jahr läutete GPT-4 einen großen Sprung im „gesunden Menschenverstand“ ein, zu dem KI fähig ist. Anthropics ChatGPT-Konkurrent Claude 3, der kurz darauf veröffentlicht wurde, hat ebenfalls Grenzen in der Fähigkeit von Chatbots überschritten, sich an offenen Gesprächen zu beteiligen. Auch Technologiegiganten wie Google, Meta und Apple haben große Investitionen in die KI-Entwicklung angekündigt.

Gleichzeitig hat die Veröffentlichung von Open-Source-KI-Modellen und die Praxis der Feinabstimmung bestehender Modelle für bestimmte Aufgaben leistungsstarke KI zu etwas gemacht, das selbst kleine Teams und Einzelpersonen ohne Vorwarnung erstellen und online veröffentlichen können. Ein mysteriöses neues KI-Modell mit dem Namen „gpt2-chatbot“ hat Forscher mit seinen fortschrittlichen Fähigkeiten verblüfft und heftige Spekulationen über seinen Ursprung und sein Potenzial als KI-Durchbruch der nächsten Generation ausgelöst.

Das Ergebnis war eine ständige Flut neuer Systeme, die die Vorstellungen davon, was Computer leisten können, erweitern und gelegentlich, wie im Fall von „gpt2-chatbot“, einen Überraschungsschock durch die KI-Welt schicken. Die Suche nach unerwarteten neuen Systemen ist für Forscher, die versuchen, die KI auf dem neuesten Stand zu halten, zu einem Zeitvertreib geworden.

Auch wenn die wahre Bedeutung von „gpt2-chatbot“ noch abzuwarten bleibt, bieten sein unangekündigtes Erscheinen und sein scheinbarer Leistungssprung einen Ausblick auf das, was bei der Beschleunigung der KI-Fortschrittswelle zu einem regelmäßigen Ereignis werden könnte. In einem Bereich, der sich mit rasender Geschwindigkeit bewegt, kommen die größten Fortschritte manchmal ohne große Vorwarnung durch einen mysteriösen Avatar in einer abgelegenen Ecke des Internets.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.