Das Modell wird in drei „Größen“ erhältlich sein und gestaffelt erscheinen. Bisher wurde Folgendes enthüllt.
Zwillinge sind multimodal
Gemini von Google ist eine multimodale KI, die mehrere Datentypen verarbeiten kann.
Dieses Modell kann Bilder, Text, Audio, Video und Codierungssprachen verarbeiten. Zu den neuen Funktionen gehört die Möglichkeit, visuelle Diagramme im Text zu analysieren.
Google erweitert außerdem die Codegenerierungsfähigkeiten der Technologie, um mit Microsofts GitHub Copilot zu konkurrieren, der auf OpenAI basiert, wie The Information zuvor berichtete.
Die erste Version, Gemini 1.0, ist für drei Größen optimiert: Gemini Ultra, Pro und Nano.
Inspiriert von AlphaGo
Gemini ist von AlphaGo inspiriert, das von Googles DeepMind entwickelt wurde und das erste Computerprogramm war, das einen professionellen menschlichen Go-Spieler besiegte. Im Jahr 2016 besiegte AlphaGo Lee Sedol, einen der stärksten Go-Spieler der Welt, und eine neue Geschichte in der KI begann.
Die in AlphaGo verwendete Technologie werde mit der Technologie kombiniert, die ChatGPT antreibt, sagte DeepMind-Chef Demis Hassabis im Juni gegenüber Wired.
„Auf einer hohen Ebene kann man sich Gemini als eine Kombination der Stärken von Systemen vom Typ AlphaGo mit den erstaunlichen sprachlichen Fähigkeiten großer Sprachmodelle vorstellen“, sagte er.
erste Version
Google begann im September damit, eine frühe Version des Modells an eine kleine Gruppe von Unternehmen zu verteilen, berichtete The Information.
Eine Person, die die Technologie zuvor getestet hat, sagte der Zeitung, dass GPT-4 möglicherweise einen Vorteil gegenüber GPT-4 habe, da es Daten von Googles Verbraucherprodukten und Informationen aus dem Internet nutzt. Ta. Dadurch kann das Modell die Benutzerabsicht genauer verstehen.
Die Person sagte auch, das Modell scheine weniger falsche Antworten zu haben, ein häufiges Problem in der künstlichen Intelligenz, das als „Halluzination“ bekannt ist. KI-gestützte Chatbots sind dafür bekannt, falsche Informationen als Tatsachen darzustellen. Im Februar zeigte eine Anzeige von Googles ChatGPT-Konkurrent Bard einen KI-Chatbot, der ungenaue Antworten gab.
Forscher des SemiAnalysis-Blogs sagen voraus, dass Gemini GPT-4 übertreffen wird, weil Google Zugriff auf erstklassige Chips hat.