Was du wissen musst
- Google Deepmind bietet Einblick in ein KI-Tool, das zur Verbesserung der Video-Streaming-Plattform von YouTube eingesetzt wird.
- Shorts werden durch KI-generierte Metadatenbeschreibungen unterstützt, die mit dem visuellen Sprachmodell Flamingo von Google erstellt wurden.
- Diese von der KI generierten Beschreibungen beschreiben, was auf dem Bildschirm angezeigt wird, und tragen so dazu bei, Shorts-Videos besser durchsuchbar zu machen.
Google hat kontinuierlich daran gearbeitet, KI-Technologie mit seinem Ökosystem an Apps sowohl auf dem Desktop als auch auf Mobilgeräten zu vermischen. Dazu gehören auch beliebte Dienste wie YouTube, wie in einem aktuellen Video hervorgehoben wird.
A Twittern von Google Deepmind zeigt, wie das Unternehmen seine KI-Forschung zur Verbesserung von YouTube Shorts einsetzt. Der Beitrag zeigt, wie KI eingesetzt wird, die „automatisch Beschreibungen für Hunderte Millionen Videos in ihren Metadaten generiert und sie dadurch besser durchsuchbar macht“.
Dies ist ein Bereich, der die Art und Weise, wie YouTube-Shorts angesehen und entdeckt werden, wahrscheinlich verbessern könnte, obwohl die Plattform bereits eine tägliche Zuschauerzahl von etwa 50 Milliarden verzeichnet. Ein Problem bei diesen Videos besteht jedoch darin, dass ihnen aufgrund der Art der Videos normalerweise Beschreibungen und hilfreiche Titel fehlen.
Um dem entgegenzuwirken, implementiert Google das visuelle Sprachmodell „Flamingo“, um Beschreibungen für Nutzer zu generieren. Dieses Modell nimmt Bilder aus dem Kurzfilm und beschreibt, was auf dem Bildschirm passiert. Die von der KI generierte Beschreibung wird zu Metadaten und wird in YouTube gespeichert, um der Plattform dabei zu helfen, sie zu kategorisieren und sie richtig vorzuschlagen, wenn Benutzer nach etwas zum Ansehen suchen.
Diese KI-generierten Beschreibungen werden bereits auf alle neu hochgeladenen Shorts angewendet, was für Shorts-Ersteller weniger Arbeit bedeutet.
Unser leistungsstarkes visuelles Sprachmodell Flamingo verändert die Art und Weise, wie 𝘺𝘰𝘶 @YouTube-Shorts ansehen kann. 🦩Es generiert automatisch Beschreibungen für Hunderte Millionen Videos in ihren Metadaten und macht sie so leichter durchsuchbar. So hilft KI YouTubern und Zuschauern. ⬇️ pic.twitter.com/pAt7MxFNs124. Mai 2023
Mehr sehen
Todd Sherman, Leiter des Produktmanagements bei Shorts, erklärte gegenüber The Verge, dass dies alles im Hintergrund geschieht, um das Shorts-Erlebnis zu verbessern. Er weist auch darauf hin, dass dies verantwortungsvoll und auf eine Weise erfolgt, die dem System hilft, den Inhalt zu verstehen.
„Wir präsentieren es den Machern nicht, aber es wird viel Mühe darauf verwendet, sicherzustellen, dass es korrekt ist“, sagte Sherman gegenüber The Verge. „Es ist sehr unwahrscheinlich, dass ein beschreibender Text generiert wird, der ein Video irgendwie in ein schlechtes Licht rückt. Das ist ein Ergebnis, mit dem wir überhaupt nicht rechnen.“
Im Moment sieht es so aus, als würde Flamingo nur für YouTube-Shorts verwendet, aber der Tweet verweist auch auf einen Beitrag aus dem Jahr 2022, der weitere Möglichkeiten beschreibt, wie Google DeepMind das YouTube-Erlebnis verbessert.
Die Flamingo-Technologie auf YouTube ist nur eines der neuesten KI-Projekte von Google. Nach der I/O 2023-Veranstaltung erfuhren wir mehr darüber, was das Unternehmen auf Lager hat. KI-Bemühungen kommen für die Google-Suche, Workspace und viele weitere Produkte des Unternehmens, die darauf vorbereitet zu sein scheinen, es mit Bing von Microsoft und ChatGPT von OpenAI aufzunehmen.