Der ehemalige Musikpromoter von Chocolate City erstellt in drei Tagen ein Music AI-Album

Um zu beweisen, dass KI mit kleinem Budget überzeugende Musik schaffen kann, hat Eclipse Nkasi in drei Tagen und für weniger als 500 US-Dollar ein KI-Musikalbum erstellt.

Noch vor einigen Monaten konnte man KI-generierte Bilder leicht an der seltsamen Zeichnung menschlicher Hände erkennen. Damals machten sich viele über die Unfähigkeit der KI lustig, Hände zu zeichnen, und stellten die Behauptung in Frage, sie könne Kreative ersetzen. Aber die von der KI erzeugten Bilder haben sich verbessert, und heutzutage kann es schwierig sein, zwischen Bildern, die von KI erzeugt wurden, und solchen, die von menschlichen Künstlern geschaffen wurden, zu unterscheiden. Das Gleiche passiert mit der Musik, da KI jetzt die Stimmen beliebter Künstler nachahmen und in ihrem Stil singen kann. Trotz dieser Fortschritte bezweifeln viele immer noch, dass KI gute Musik produzieren kann.

Der unabhängige Künstler und ehemalige Promoter des nigerianischen Plattenlabels Chocolate City Music, Nkasi, sagt gegenüber TechCabal: „Wenn es um Musik ging, waren die Menschen sehr sensibel oder emotional in Bezug auf ihre Haltung gegenüber KI. Die Menschen hielten es für unmöglich, dass KI ursprünglich Kunst schaffen könnte. Man hört Argumente, dass der KI die Seele fehlt oder dass es nicht möglich ist, etwas nah genug zu erzeugen. Ich habe das als Herausforderung gesehen.“

KI-Musik erstellen
Bildquelle: Dall-E/Ngozi

Während KI-Musikgeneratoren mit generischen oder detaillierten Eingabeaufforderungen beeindruckende und einzigartige Klänge verschiedener Genres erzeugen können, gibt es nicht so viele, die in der Lage sind, beeindruckende Originalsongs zu erzeugen. Modelle wie MusicLM von Google, das gestern der Öffentlichkeit zugänglich gemacht wurde, können interessante Instrumentals produzieren. Aber diese Models stolpern, wenn es um die Texte geht. Berichten zufolge waren die Texte der Musik, die vor Monaten auf MusicLM produziert wurde, durcheinander und zusammenhangslos, ähnlich wie Wörter auf Bildern durcheinander gebracht werden können, die vom Bildgenerator Dall-E von OpenAI generiert wurden. Diese öffentlich veröffentlichte Version generiert keine Songs mit der Stimme eines Sängers, da dies zu Urheberrechtsproblemen führen kann, wie es bei den meisten Songs mit Stimmen und Musik bekannter Künstler in letzter Zeit der Fall war. Spotify hat kürzlich aus urheberrechtlichen Gründen Tausende von KI-generierten Songs entfernt.

Lesen Sie auch: Was wird jetzt passieren, wenn KI wie Ihr nigerianischer Lieblingsmusiker singen kann?

Etwas Originelles und Erschwinglicheres

Die meisten der beliebten KI-generierten Lieder enthalten die KI-geklonten Stimmen bekannter Künstler, die bereits bestehende Lieder singen, keine neuen. Erinnern Sie sich an den KI-generierten Song mit Drake, der im April viral ging? Das war kein Original. Es war ein Rap-Acapella, überarbeitet mit einer KI-generierten Drake-Stimme. Der neue Gesang wurde über einen bereits vorhandenen, modifizierten Beat gelegt. Nkasi wollte, dass die meisten, wenn nicht sogar alle kreativen Elemente des Albums ursprünglich von KI erstellt wurden, also verwendete er verschiedene KI-Tools, um an jedem Teil – Text, Instrumental und Gesang – zu arbeiten und sie zusammenzusetzen.

KI-Musik erstellen
Bildquelle: Dall-E/Ngozi

Nkasi wollte nicht nur beweisen, dass KI originelle und emotional fesselnde Musik schaffen kann, er wollte auch zeigen, dass KI dies auch mit einem knappen Budget schaffen kann. Dieser Ehrgeiz wurde durch die Neugier des ehemaligen Chocolate City-Musikförderers und seine Erfahrung im Umgang mit dem Musikgeschäft als Teil eines Labels und als Solokünstler motiviert. „Die Erstellung und Vermarktung von Musik ist sehr teuer, insbesondere für neue Künstler“, sagte Nkasi gegenüber TechCabal. Ihm zufolge kostet ein Musikalbumprojekt für einen durchschnittlichen Künstler im Allgemeinen 2 Millionen Pfund (4.339 US-Dollar) bis 3 Millionen Pfund (6.509 US-Dollar). „Man muss für Beats bezahlen und der durchschnittliche Musikproduzent in Lagos, der weiß, was er tut, würde etwa 100.000 ₦ verlangen. Hersteller wie Masterkraft verlangen weit über eine Million Naira. Wenn Sie dies auf einem einfachen Niveau tun möchten, 100.000–200.000 ₦. Wenn Sie 13 Lieder machen wollen, können Sie rechnen. Außerdem können Mixing und Mastering etwa 100.000 ₦ kosten.“

Lesen Sie auch  Die Emirates Mars Mission nimmt erstaunliche Bilder des Marsmondes Deimos auf

Aber Nkasi wollte in drei Tagen ein Album für weniger als 500 US-Dollar (231.000 ₦) erstellen. Das Ergebnis seiner Bemühungen ist ein Album mit dem Titel Infinite Echoes, das er unter seinem Studionamen Eclipse Nkasi auf Streaming-Plattformen wie Spotify und YoutubeMusic veröffentlichte. „Abgesehen von den Gemeinkosten für Generatoren usw. war es wahnsinnig günstig. Ich glaube nicht, dass ich mehr als die Hälfte meines 500-Dollar-Budgets ausgegeben habe. Das meiste Geld, das ich für ein Tool ausgegeben habe, war das Sprachsynthese-Tool, mit dem ich eine KI-Sängerin erstellen konnte, die ich Mya Blue taufte. Das hat mich etwa 168 US-Dollar für die Software und die Sprachbank gekostet. Zusätzliche Sprachbanken kosten etwa 70 US-Dollar“, sagte Nkasi.

Lesen Sie auch: Google wird mit seinem KI-Musikgenerator die Art und Weise verändern, wie Sie Musik erstellen und hören

Erstellen des Albums

Abgesehen von einigen Beiträgen von ihm besteht Nkasi darauf, dass der gesamte kreative Prozess der Produktion des Neun-Track-Albums mit künstlicher Intelligenz durchgeführt wurde. Ihm zufolge schlug AI den Titel „Infinite Echoes“ vor. Außerdem wurde das Album konzipiert, das Albumcover erstellt, die Songs geschrieben und die Tracklist, Songversionen und Instrumentals erstellt. AI sang auch die meisten Lieder. „Ich weiß genau, was es braucht, um ein Album auf Künstler- und Geschäftsseite zu erstellen, aber ich wollte das Album einfach in drei Tagen fertigstellen“, sagte er in einem Interview mit TechCabal.

KI-Musik erstellen
Bildquelle: Dall-E/Ngozi

Nkasi entwickelte die Instrumentals des Albums auf einem KI-Musikgenerator, SoundRaw. Der Generator verfügt über eine Datenbank lizenzfreier Instrumentalstücke, die von KI generiert wurden. „Sie können die Länge, das Tempo, die Komposition, die Instrumente und das Genre der Klänge an Ihre Bedürfnisse anpassen“, sagte er und fügte hinzu, dass er ein kostenpflichtiges Konto habe, das 15 US-Dollar pro Monat kostet. Er lud die meisten Instrumentals, die er brauchte, in zwei Tagen herunter und hatte noch 28 Tage Zeit, um auf viele weitere Instrumentals zuzugreifen. „Es ist so günstig. Wenn ich wie in meinen Anfangstagen noch ein umtriebiger Künstler gewesen wäre, hätte es mir geholfen, in wenigen Tagen mehrere Alben zu erstellen“, sagte er.

Neben SoundRaw nutzte Nkasi für das Album auch KI-Tools wie Sprachsynthesizer, ChatGPT und den Bildgenerator Midjourney AI. ChatGPT schrieb die Texte und schlug Eingabeaufforderungen für andere KI-Tools vor, beispielsweise den Bildgenerator Midjourney, der zur Erstellung des Albumcovers verwendet wurde.

„Ich habe für ein paar andere Tools bezahlt, die ich letztendlich aber nicht genutzt habe. Von allen Text-to-Speech-KI-Tools, die ihm zur Verfügung standen, bevorzugte und nutzte er ElevenLabs, da es das einzige war, das eine Singstimme erzeugte, die wirklich menschlich klang. „Die KI-Stimme hielt oft kurz inne, um Luft zu holen. Es gibt keinen Grund, warum KI atmen sollte, aber sie versuchte mich davon zu überzeugen, dass die Stimme menschlich ist“, erläuterte Nkasi.

Lesen Sie auch  il coro «Eintracht, Eintracht» fa paura- Corriere TV

Lesen Sie auch: Betrüger glauben noch nicht, dass KI den Job erledigen kann

Über das Album

Das Album begann mit einer KI-generierten Stimme, die mit amerikanischem Akzent sprach und eine fast zweiminütige Geschichte erzählte. Es befasste sich mit der Geschichte einer Figur namens Leo, angetrieben von dem Wunsch, einen neuen Sound zu schaffen, der Menschen unterschiedlicher Kulturen und Hintergründe vereinen kann. Leos Reise führte ihn in ein mystisches Reich namens Unendliche Echos, das den Schlüssel zu einem Rhythmus enthielt, der verschiedene Individuen und ihre Geschichten verbindet. Diese Erzählung seiner Odyssee taucht im Laufe des Albums mit den Titeln Interlude I und Interlude II noch zweimal auf. Diese Zwischenspiele gaben Einblick in die Beweggründe hinter den verschiedenen Genres (Hip Hop, Dance Hall und Afrobeat) im Album.

So ging beispielsweise der sanfte und poetische Titel „Love Tempo“ nahtlos in den Gospel-durchdrungenen Song „God’s Whispers I“ über. Nach dem ersten Zwischenspiel erkundete „Dream Chaser“ die Verfolgung materialistischer Wünsche und mündete in „Ifuu (Men Di Bad)“, einer fesselnden Komposition, angereichert mit bedeutenden Teilen von Igbo-Texten. Als ein weiteres Zwischenspiel endete, rückte ein Reggae-ähnliches Stück mit dem Titel „Find You“ mit Texten in der Sprache von Patois ins Rampenlicht und endete mit einem weiteren Gospelsong, „God’s Whisper II“.

Bildquelle: Dall-E/Ngozi

Es könnte für jeden sehr schwer zu erraten sein, dass die Klänge, Texte und der Gesang größtenteils ein Produkt der KI sind. Nkasi hielt es für wichtig, die KI dazu zu bringen, Dinge zu tun, die er normalerweise als Künstler tun würde. Songs auf dem Album wie „Find You“ und „Ifuu (Men Di Bad)“ enthielten Texte in nigerianischen Sprachen wie Pidgin, Patois und Igbo. „Was ich sehr interessant fand, war, dass wir AI dazu veranlasst haben, in nigerianischem Pidgin zu schreiben, und die Ergebnisse waren beeindruckend. Auf ein Lied wie Scheinen das hatte Igbo; Igbo wurde KI-generiert. Der Rap-Vers, der sich auf Palmwein und Chillen bezieht, war ChatGPT, ebenso wie die Igbo-Formulierungen“, sagte er.

„Dieses Mal habe ich den Prozess irgendwie umgekehrt. Ich hatte nur die Idee für den Refrain und die Formulierungen für den Refrain, also habe ich eine Aufforderung an ChatGPT eingegeben, ihm den Refrain mitzuteilen und es zu bitten, den Rest des Liedes mit Patois und Pidgin-Sprache dazwischen zu schreiben“, fügte Nkasi hinzu. Er sagt, dass die Art und Weise, wie es in dem Song ist, auch die Art und Weise ist, wie ChatGPT es produziert hat, und dass er es nur nachstellen und mit den anderen KI-Tools zum Leben erwecken musste.

Abgesehen von Scheinen Und Traumfänger, Nkasi sagt, dass jedes andere Element vollständig mit KI erstellt wurde, was einen erheblichen menschlichen Aufwand erforderte. „Der menschliche Beitrag kam also zum größten Teil aus der Melodiesynchronisierung, da ChatGPT das Lied schrieb, aber weil es keine Melodie dazu gab, musste ich die Gesangsmelodie herausfinden, die am besten zu dem Beat passte, den die KI uns gab.“ In einigen Fällen mussten wir einige Sätze im Liedtext kürzen und einige andere verlängern.

Lesen Sie auch  Die von Ihnen verwendete Seife kann Sie für Mücken attraktiver machen

Probleme auf dem Weg

Nkasi fühlte sich durch die mangelnde Interoperabilität der verschiedenen Software, die er zur Produktion des Albums verwendete, etwas behindert. „Die einzigartige Herausforderung, vor der wir stehen, besteht darin, dass die verschiedenen KI-Tools, mit denen wir Musik machen, nicht miteinander kommunizieren. Wenn ChatGPT schreibt, hat es keine Ahnung, wie der Beat klingt. Und wenn wir versuchen, die Melodie herauszufinden und die Stimme zu erzeugen, muss die KI die Texte und Beats verstehen.“ Deshalb musste die Melodie von ihm (dem Menschen) bestimmt werden. „Wir nahmen die Texte, die wir hatten, entwickelten Melodieideen, trainierten die KI, sie mit der generierten Stimme zu singen, und fügten sie zusammen.“

Wenn man jedoch bedenkt, wie schnell KI-Innovationen Engpässe beseitigen, glaubt Nkasi nicht, dass dieses Problem allzu lange ungelöst bleiben wird. Irgendwann wird vielleicht jemand herausfinden, wie man diese unterschiedlichen Prozesse mit einer Plug-and-Play-Methode verbinden kann.

Ein KI-Musikkünstler

„Ein Freund von mir, der beliebte Gospel-Künstler Limoblaze, argumentierte, dass es für KI unmöglich sei, einen Gospel-Song zu schreiben, der die Menschen bewegen könnte. Alles, was ich tun musste, war, die KI-Tools dazu zu bringen, etwas zu schaffen, das sich auf den Glauben und die Hingabe an Gott bezog. Daraus entstand „God’s Whispers 2“, einer der beiden Gospel-Songs auf dem Album“, verriet Nkasi.

In God’s Whispers II stellt Nkasi eine Künstlerin vor, die als Mya Blue identifiziert wird, aber sie ist keine echte Person. Die anderen beiden vorgestellten Künstler, Nnamdi Agbo und David Wonder, sind Menschen, aber Mya Blue ist eine weibliche, von der KI erzeugte Stimme. Nkasi bewies seinen Standpunkt, denn dieses Lied klang wie jedes andere Gospellied. Er sagte: „Wir haben die Akkorde gespielt, ChatPGT verwendet, um die Texte zu schreiben, und ein völlig anderes KI-Tool, um die Stimme zu erzeugen.“ [for Mya Blue]. Sie existiert nur als KI.“

Bildquelle: Dall-E/Ngozi

Das Lied beginnt mit einem Duett von Nkasobi und Mya Blue, und Mya Blue, die singt und sanft atmet, als wäre sie ein Mensch, setzt die letzten zwei Minuten mit einem Solo fort. Seine Stimme erinnert mich daran, wie die Schauspielerin Vannessa Hudgens in Disneys High School Musical sang. „Ich habe das für die Leute gemacht, die sich davon überzeugen wollen, dass sie erkennen können, dass es sich um KI handelt“, fügte Nkasi hinzu.

Das Vorgehen gegen KI

Letzten Monat berichtete die Financial Times, dass die Universal Music Group Streaming-Plattformen wie Spotify und Apple angewiesen habe, Dienste für künstliche Intelligenz daran zu hindern, Melodien und Texte aus ihren urheberrechtlich geschützten Songs zu entfernen.

Allerdings ist Nkasi der Meinung, dass KI bei so vielen Spielern unvermeidlich ist. Er sagt, dass es dem durchschnittlichen Künstler zugute kommen wird. „Das Problem ist, dass die KI den riesigen Katalog entkräften kann, für dessen Ansammlung und Zusammenstellung große Labels Milliarden von Dollar ausgegeben haben. Für den durchschnittlichen Künstler demokratisiert es den Zugang und erleichtert die Arbeit“, schließt er.

Erhalten Sie die besten afrikanischen Tech-Newsletter in Ihrem Posteingang

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.