Landgericht Hamburg: KI-Trainings-Datensatz verletzt kein Urheberrecht

Das Landgericht Hamburg (D) hat in einem Urteil entschieden, dass die Verwendung urheberrechtlich geschützter Fotos zur Erstellung von KI-Trainingsdatensätzen legal ist, sofern sie der wissenschaftlichen Forschung dient.

In dem Verfahren klagte ein Fotograf gegen den gemeinnützigen Verein LAION, der einen umfangreichen Datensatz mit 5,85 Milliarden Bild-Text-Paaren für das Training von KI-Systemen erstellt und öffentlich zugänglich gemacht hatte. Der Kläger sah darin eine Verletzung seiner Urheberrechte.

Das Gericht wies die Klage jedoch ab und entschied, dass die Nutzung des Fotos durch den Verein von der Schrankenregelung des § 60d des Deutschen Urheberrechtsgesetzes gedeckt sei. Diese Regelung erlaubt Vervielfältigungen für Text- und Data-Mining zu Zwecken der wissenschaftlichen Forschung.

«Wissenschaftliche Forschung bezeichnet allgemein das methodisch-systematische Streben nach neuen Erkenntnissen», erläuterte das Gericht. Es betonte, dass auch «die Erstellung eines Datensatzes der streitgegenständlichen Art, der Grundlage für das Trainieren von KI-Systemen sein kann, durchaus als wissenschaftliche Forschung […] anzusehen» sei.

Entscheidend war für das Gericht auch, dass der Verein keine kommerziellen Zwecke verfolgt. Dies ergebe sich daraus, «dass der Beklagte diesen [Datensatz] unstreitig kostenfrei öffentlich zugänglich macht.»

Das Urteil könnte weitreichende Folgen für die Entwicklung von KI-Systemen in Deutschland haben. Es stärkt die Position von Forschungsorganisationen, die grosse Datenmengen für das Training von KI benötigen, und gibt ihnen mehr Rechtssicherheit bei der Nutzung urheberrechtlich geschützter Werke für diesen Zweck.

Allerdings ist zu beachten, dass das Urteil noch nicht rechtskräftig ist und ziemlich sicher weitergezogen wird.

Responses

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Verwandte Beiträge

Was kosten Trainingsdaten?

Inside IT führt im Artikel «Was Big Tech für KI-Trainingsdaten bezahlt» ein paar interessante Zahlen zu den Kosten von Trainingsdaten für KI-Modelle zusammen. Diese stammen,

Weiterlesen »

Cohere LLM-Online Kurs

Der kanadische LLM-Anbieter Cohere bietet einen umfassenden Online-Kurs zu den wichtigsten Themen rund um generative KI bzw. grosse Sprachmodelle (Large Language Models LLM) an.

Weiterlesen »