Wie Anthropics neues KI-Modell Claude 3 abschneidet

#Wie #Anthropics #neues #KIModell #Claude #abschneidet

Anthropics neue künstliche Intelligenz (KI) basiert Claude 3 Modelle in vielen Bereichen die Konkurrenz schlagen, sagten Experten gegenüber PYMNTS.

Das Unternehmen, das die Modelle am Montag (4. März) herausbrachte, behauptet, dass Claude 3 Opus – das fortschrittlichste unter den neuen Modellen – in Branchen-Benchmark-Bewertungen sowohl OpenAIs GPT-4 als auch Googles Gemini Ultra übertroffen habe. Die Bewertungen umfassten Bereiche wie Wissen auf Bachelor-Niveau, Argumentation auf Graduierten-Niveau und grundlegende Mathematik.

Die neuen Modelle verdeutlichen den zunehmenden Wettbewerb zwischen KI-Unternehmen um die Weiterentwicklung ihrer Technologien in einem zunehmend hitzigen Sektor.

„Claude übertrifft GPT-4 in fast allen Bereichen“, sagte Richard Gardner, CEO eines Technologieberatungsunternehmens Modulsagte PYMNTS in einem Interview.

„Wir sind jedoch der Meinung, dass Claudes Ausrichtungsebene zu restriktiv ist. Allerdings wird auch die Ausrichtungsschicht von GPT-4 zu restriktiv“, sagte er und fügte hinzu, dass er die Verwendung von Open-Source-Modellen bevorzuge.

Die neuen Funktionen von Anthropic

Die neuen KI-Tools von Anthropic innerhalb der Claude 3-Familie heißen Opus, Sonnet und Haiku. Die Modelle Sonnet und Haiku sind einfacher und günstiger als Opus. Sonnet und Opus sind in 159 Ländern erhältlich und Haiku wird bald veröffentlicht, sagte Anthropic. Das Unternehmen hat nicht mitgeteilt, wie lange oder wie viel die Entwicklung von Claude 3 gekostet hat, erwähnte jedoch, dass Unternehmen wie Airtable und Asana beim Testen der Modelle geholfen haben.

Sonnet ist auch auf Amazon Bedrock erhältlich. Opus und Haiku sollen in einigen Wochen auf der Plattform verfügbar sein.

Mit seiner neuen Funktion zur multimodalen Unterstützung ermöglicht Anthropic Benutzern erstmals die Analyse verschiedener Arten von Daten, darunter Bilder, Diagramme und Dokumente.

Lesen Sie auch  Preciado fehlt: Sparta fehlt im Derby und in den Play-offs | iRADIO

Tests zeigen, dass Claude 3 im Vergleich zu anderen Modellen, Caleb Moore, besser darin ist, Quellcode zu erstellen Mitbegründer und Chief Technology Officer eines Softwareunternehmens Darwinium, sagte PYMNTS in einem Interview.

„Weitere gemeinsame Faktoren sind das vergleichende Denken (die Fähigkeit, auf der Grundlage der bereitgestellten zusammenhängenden Informationen zu einer logischen Schlussfolgerung zu gelangen) sowie die Tiefe des bereits im System kodierten Wissens, das es nutzen kann“, fügte er hinzu.

Der Vergleich von KI-Modellen kann schwierig sein, sagt Ilia Badeev, Leiterin der Datenwissenschaft bei Trevolution-Gruppeein Reisedienstleistungsunternehmen, das KI nutzt, sagte PYMNTS in einem Interview.

„Menschen verlassen sich zum Vergleich oft auf öffentliche Tests, aber diese Tests sind ziemlich abstrakt und spiegeln möglicherweise nicht immer reale Szenarien wider“, sagte Badeev. „Nur weil ein Modell in einigen Tests herausragend ist, heißt das nicht, dass es perfekt für Ihre speziellen Aufgaben geeignet ist.“

Auswahl von KI-Modellen

Ein wichtiger Punkt, der bei der Auswahl eines KI-Modells berücksichtigt werden müsse, seien die Kosten, betonte Badeev. Für Claude 3 Opus erhalten Sie beispielsweise 75 US-Dollar für eine Million Token – deutlich mehr als GPT-4 Turbo, das für das gleiche Volumen 30 US-Dollar kostet.

Gardner sagte, dass fast jedes Modell so angepasst werden kann, dass es einen bestimmten Geschäftsanwendungsfall unterstützt. Einige Modelle könnten für bestimmte Aufgaben besser sein als andere, aber das liege in erster Linie an der Feinabstimmung, bemerkte er und verwies auf Apps, die speziell für die Verwaltung klinischer Notizen oder zur Unterstützung von medizinischem Personal entwickelt wurden.

Unternehmen sollten ein KI-Modell wählen, das auf Genauigkeit, Geschwindigkeit, Datenschutz, einfacher Bereitstellung oder Wartung und Kosten basiert, sagte Gardner und fügte hinzu, dass Open-Source-Modelle den Benutzern mehr Privatsphäre bieten.

Lesen Sie auch  Frauen-Cricket – Australien tourt von Dezember 2023 bis Januar 2024 für eine Multiformat-Serie durch Indien

Für kreative Autoren könnten die Fähigkeiten von GPT-4 zur Textgenerierung nützlicher sein, sagt Michal Oglodek, Chief Technology Officer bei Ivy.aisagte PYMNTS in einem Interview. Wenn ein Benutzer hingegen Genauigkeit und die Wahrung der Markenkonsistenz anstrebt, könnte Gemini 1 mit seinem Fokus auf Wahrhaftigkeit und Sicherheit die bessere Wahl sein. Und für Anwender, die komplexe Anfragen präzise bearbeiten müssen, könnte Claude 3 Vorteile bieten.

„Testen Sie Modelle nach Möglichkeit direkt in Ihrer Anwendung“, sagte Oglodek. „Benchmarks sind informativ, aber der reale Einsatz liefert das genaueste Bild.“

Für die gesamte PYMNTS AI-Berichterstattung abonnieren Sie die Tageszeitung KI-Newsletter.

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.