Sieben Anbieter von Musik-, Bild-, Video- und anderen Datensätzen, die für das Training von Systemen der künstlichen Intelligenz verwendet werden, haben die erste Handelsgruppe der Branche gegründet, wie sie am Mittwoch mitteilten.

Die Dataset Providers Alliance (DPA) wird sich für eine "ethische Datenbeschaffung" beim Training von KI-Systemen einsetzen, einschließlich der Rechte der in den Datensätzen abgebildeten Personen und des Schutzes der geistigen Eigentumsrechte der Eigentümer von Inhalten, so die Unternehmen in einer Erklärung.

Zu den Gründungsmitgliedern gehören das US-Musikdatenunternehmen Rightsify, der Bildlizenzierungsdienst vAIsual, der japanische Stockfotoanbieter Pixta und der in Deutschland ansässige Datenmarktplatz Datarade.

Das Aufkommen generativer KI-Technologien, die die menschliche Kreativität imitieren können, hat in den letzten Jahren einen Aufschrei der Urheber von Inhalten und eine Reihe von Urheberrechtsklagen gegen Technologieunternehmen wie Google, Meta und den ChatGPT-Hersteller OpenAI ausgelöst, der von Microsoft unterstützt wird.

Die Entwickler haben ihre Modelle trainiert, indem sie sie mit riesigen Mengen an Inhalten gefüttert haben, von denen viele kostenlos aus dem Internet entnommen wurden, ohne die Zustimmung derjenigen, die die Werke geschaffen haben oder die Rechte an ihnen besitzen.

Technologieunternehmen, die behaupten, die Nutzung sei legal, zahlen auch stillschweigend für den Zugang zu privaten Inhaltssammlungen, um den Bedarf an bestimmten Datentypen zu decken und um sich gegen rechtliche und regulatorische Risiken abzusichern.

Die Aussicht, dass die Nachfrage nach lizenzierten Daten steigen wird, wenn sich die Urheberrechtsinhaber in ihren Rechtsstreitigkeiten durchsetzen, hat zur Entstehung einer neu entstehenden Industrie von Unternehmen geführt, die Inhalte verpacken und den Zugang zu ihnen für die Nutzung durch KI-Systeme verkaufen.

Infolgedessen haben sich Gruppen gebildet, die ethische Standards für diesen Handel festlegen, wie Fairly Trained, eine in diesem Jahr gegründete gemeinnützige Organisation, die Modelle zertifiziert, die urheberrechtlich geschütztes Material nicht ohne Lizenz verwendet haben.

Die DPA zielt auf den Inhalt dieser Transaktionen ab. Sie verlangt zum Beispiel, dass ihre Mitglieder sich verpflichten, keine Textdaten zu verkaufen, die durch das Crawlen des Internets gewonnen wurden, oder Audiodaten, die die Stimmen von Menschen enthalten, ohne deren ausdrückliche Zustimmung.

Ein Hauptaugenmerk liegt auf der Durchsetzung von Gesetzen wie dem NO FAKES Act, einem im letzten Jahr in den USA eingeführten Gesetzesentwurf, der Strafen für die Erstellung unerlaubter digitaler Repliken von Stimmen oder Abbildern von Personen vorsieht, sagte Alex Bestall, CEO von Rightsify und dessen Lizenzierungstochter GCX, der die Gründung der Gruppe leitete.

"Anwaltschaft wird eine große Rolle spielen, denn jeder hat seine Position zu KI und Urheberrecht eingenommen, aber viele dieser Kämpfe müssen noch gelöst werden und es wird eine Weile dauern, bis sie gelöst sind", sagte Bestall.

Die DPA wird auch auf mehr Transparenzanforderungen für Trainingsdaten drängen, wie sie im KI-Gesetz der Europäischen Union und einem ähnlichen, im April eingeführten US-Gesetz, dem Generative AI Copyright Disclosure Act, enthalten sind, fügte er hinzu.

Die Gruppe plant, im Juli ein Weißbuch zu veröffentlichen, in dem sie ihre Positionen darlegt, sagte er. (Berichterstattung durch Katie Paul; Bearbeitung durch Richard Chang)