In diesem Artikel erkläre ich, wie die vom Azure AI Vision-Dienst bereitgestellte Bild-Tagging-Funktion eine Liste von Bild-Tags generieren kann, die einem Bild zugeordnet sind, wenn ein Bild auf Optimizely CMS hochgeladen wird.
Die Azure AI-Dienste für Vision, die auf dem Florence Large Foundation-Modell von Microsoft basieren, bieten eine Reihe von Funktionen für die Bildanalyse und erweiterte Anpassung. Eine wichtige Funktion dieses Dienstes ist die Bild-Tagging-Funktion, mit der Bild-Tags für eine Vielzahl erkennbarer Objekte, Lebewesen, Landschaften und in Bildern dargestellte Aktionen generiert werden können.
Die Kennzeichnung geht über das Hauptthema hinaus und umfasst die Umgebung (drinnen oder draußen), Möbel, Werkzeuge, Pflanzen, Tiere, Accessoires, Gadgets und mehr. In Fällen, in denen Tags möglicherweise mehrdeutig sind oder nicht allgemein erkannt werden, enthält die API-Antwort Hinweise, um die Bedeutung des Tags im Kontext einer bekannten Einstellung zu verdeutlichen. Das für die Bild-Tagging-Funktion verwendete Bild ist oben dargestellt.
Unten sehen Sie einen Screenshot, der einen Codeausschnitt zeigt, der zum Erstellen der Liste der Bild-Tags verwendet wurde
Antwort von der API
Bildanalyse – Inhalts-Tags Der Vorgang ist abgeschlossen:
Bildhöhe = 682
Bildbreite = 1024
Modellversion = 2023-02-01-Vorschau
Anzahl der generierten Bild-Tags = 27
„Indoor“, Konfidenz 0,9981
„Wand“, Konfidenz 0,9916
„Innenarchitektur“, Vertrauen 0,9902
„lebendig“, Konfidenz 0,9607
„Couch“, Vertrauen 0,9523
„Boden“, Konfidenz 0,9394
„den“, Konfidenz 0,9238
„Raum“, Konfidenz 0,9193
„Kissen“, Konfidenz 0,9164
„Studiocouch“, Vertrauen 0,9103
„Loveseat“, Vertrauen 0,9007
„Kissen“, Konfidenz 0,8865
„Schlafsofa“, Vertrauen 0,8859
„Haus“, Konfidenz 0,8759
„Vorhang“, Konfidenz 0,8743
„Couchtisch“, Vertrauen 0,8701
„Formen“, Konfidenz 0,8688
„Fensterbehandlung“, Konfidenz 0,8664
„Leinen“, Konfidenz 0,8585
„Möbel“, Konfidenz 0,8576
„Tabelle“, Konfidenz 0,8554
„Herd“, Vertrauen 0,8460
„Wohnzimmer“, Vertrauen 0,7905
„Fenster“, Konfidenz 0,7895
„Kamin“, Vertrauen 0,7752
„Stuhl“, Konfidenz 0,6184
„Decke“, Konfidenz 0,5874
Wie in der obigen API-Antwort gezeigt, hat das für die Bild-Tagging-Funktion verwendete Bild 27 Tags erzeugt. Anschließend werden diese Tags zu einer IList zusammengesetzt