ChatGPT und sein Nachfolger GPT-4 scheinen Details aus einer großen Anzahl urheberrechtlich geschützter Bücher auswendig gelernt zu haben, was Fragen zur Rechtmäßigkeit der Erstellung dieser großen Sprachmodelle (LLMs) aufwirft.
Beide künstlichen Intelligenzen wurden von der Privatfirma OpenAI entwickelt und mit riesigen Datenmengen trainiert, aber aus welchen Texten diese Trainingsdaten genau bestehen, ist unbekannt. Um mehr herauszufinden, untersuchten David Bamman von der University of California, Berkeley, und seine Kollegen, ob die KIs in der Lage waren, …