Google Gemini: Neue KI soll sowohl GPT-4 als auch Experten-Menschen übertreffen

Zwillinge können mit Text, Audio und Video umgehen

Google

Google hat ein neues KI-Modell namens Gemini auf den Markt gebracht, von dem es behauptet, dass es sowohl das GPT-4-Modell von OpenAI als auch Menschen auf „Expertenebene“ in einer Reihe von Intelligenztests übertreffen kann.

Der CEO des Unternehmens, Sundar Pichai, enthüllte die Existenz von Gemini auf der I/O-Konferenz von Google im Mai dieses Jahres, obwohl sich das Unternehmen zu diesem Zeitpunkt noch in der Schulung befand. Doch heute gab das Unternehmen bekannt, dass es das Spitzenmodell der Öffentlichkeit vorstellen wird.

Für verschiedene Anwendungen wurden drei Versionen von Gemini entwickelt, die Nano, Pro und Ultra heißen und an Größe und Leistungsfähigkeit zunehmen. Google lehnte es ab, Fragen zur Größe von Pro und Ultra, zur Anzahl der darin enthaltenen Parameter oder zum Umfang oder der Quelle ihrer Trainingsdaten zu beantworten. Aber seine kleinste Version, Nano, die für die lokale Ausführung auf Smartphones konzipiert ist, besteht eigentlich aus zwei Modellen: eines für langsamere Telefone mit 1,8 Milliarden Parametern und eines für leistungsstärkere Geräte mit 3,25 Milliarden Parametern. Der Vergleich der Fähigkeiten von KI-Modellen ist eine ungenaue Wissenschaft, aber GPT-4 soll Gerüchten zufolge bis zu 1,7 Billionen Parameter umfassen und Metas LLAMA-2 hat 70 Milliarden.

Die Mittelklasse-Pro-Version von Gemini schlägt einige andere Modelle, wie zum Beispiel GPT3.5 von OpenAI, aber das leistungsstärkere Ultra übertrifft laut Google die Leistungsfähigkeit aller bestehenden KI-Modelle. Im branchenüblichen MMLU-Benchmark erreichte es 90 Prozent, wobei ein Mensch auf „Expertenniveau“ voraussichtlich 89,8 Prozent erreichen sollte.

Dies ist das erste Mal, dass eine KI den Menschen im Test besiegt hat, und es ist die höchste Punktzahl aller existierenden Modelle. Der Test umfasst eine breite Palette kniffliger Fragen zu Themen wie logischen Irrtümern, moralischen Problemen in Alltagsszenarien, medizinischen Fragen, Wirtschaft und Geographie.

Lesen Sie auch  Steigern Sie Ihre Erfahrung: 10 großartige Möglichkeiten, die Fähigkeiten von ChatGPT zu nutzen | von Sneha | Juni 2023


Im gleichen Test erreichte GPT-4 87 Prozent, LLAMA-2 68 Prozent und Claude 2 von Anthropic 78,5 Prozent. Gemini schlug alle diese Modelle in acht von neun anderen gängigen Benchmark-Tests.

Das Pro-Modell wird in Googles Bard integriert, einen Online-Chatbot, der im März dieses Jahres eingeführt wurde. Das Unternehmen gibt an, dass Anfang nächsten Jahres eine weitere Version von Bard namens Bard Advanced auf den Markt kommen wird, die über das größere Gemini Ultra-Modell verfügen wird.

Die neue Version von Bard wird ab heute in mehr als 170 Ländern auf Englisch verfügbar sein, in Großbritannien und Europa jedoch nicht in anderen Sprachen oder gar auf Englisch. Sissie Hsiao von Google sagt, die Verzögerung sei eher auf Regulierung als auf Technik zurückzuführen: „Wir arbeiten mit lokalen Richtlinien und Regulierungsbehörden zusammen, um sicherzustellen, dass wir uns an lokale Gesetze und ähnliche Dinge halten, bevor wir in anderen Bereichen starten.“

Eli Collins Laut DeepMind bei Google ist Gemini das größte und leistungsfähigste Modell des Unternehmens, aber auch das allgemeinste – das heißt, es ist an eine Vielzahl von Aufgaben anpassbar. Im Gegensatz zu vielen aktuellen Modellen, die sich auf Text konzentrieren, wurde Gemini auf Text, Bilder und Ton trainiert und soll in der Lage sein, Eingaben zu akzeptieren und Ausgaben in all diesen Formaten bereitzustellen. Mit der Einführung von Bard können Benutzer ab heute jedoch nur Textansagen verwenden. Das Unternehmen verspricht, „in den kommenden Monaten“ Audio- und Bildinteraktionen zu ermöglichen.

Collins sagt, dass Gemini „in fast allen Bereichen auf dem neuesten Stand der Technik“ ist und dass es sich noch in der Testphase befindet, um genau zu bestimmen, wie leistungsfähig es in verschiedenen Medien, Sprachen und Anwendungen ist. „Wir arbeiten immer noch daran, alle neuartigen Fähigkeiten von Ultra zu verstehen“, sagt er.

Lesen Sie auch  Vor dem Senatsausschuss zum Drogenhandel plädieren Anwälte zur Verteidigung

Bei der Einführungsveranstaltung wurden keine Versionen von Gemini zum Testen zur Verfügung gestellt, aber Google zeigte Demonstrationen der KI, wie sie Hausaufgaben löste und mit Live-Videoeingaben arbeitete. Es wird auch behauptet, dass es bei der Entwicklung von Software besser ist als frühere Modelle: Letztes Jahr veröffentlichte DeepMind einen KI-gestützten Codegenerator namens AlphaCode, der nach Angaben des Unternehmens 50 Prozent der menschlichen Entwickler schlagen könnte, und veröffentlicht jetzt eine aktualisierte Version, die von betrieben wird Gemini behauptet, 85 Prozent der menschlichen Programmierer schlagen zu können.

Themen:

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.