Das US Unternehmen Anthropic gibt sich gerne als die nette KI Unternehmung mit dem guten Gewissen. Gerichtsunterlagen vom United States District Court
Northern District of California enthüllen nun einige interessante Geschäftspraktiken aus der Gründungszeit von Anthropic.
Hintergrund zum Gerichtsfall
Das Dokument enthält eine rechtliche Entscheidung über den Fall von US Bücherautoren. Diese haben gegen Anthropic geklagt, da diese aus ihrer Sicht ihre Werke ohne Genehmigung verwendet hätte. Anthropic hatte Millionen von urheberrechtlich geschützten eBooks heruntergeladen und in Papierform gekauft um sie zum Training von Künstlicher Intelligenz (KI), insbesondere dem großen Sprachmodell „Claude“, zu verwenden.
eBooks teilweise von Piraterie Seiten
Das Gericht sah es als erwiesen, dass grosse Bestände der eBooks welche durch Anthropic für das Training ihrer Modelle verwendet wurden von Piraterie Plattformen stammten. So sollen Millionen von eBooks von dubiosen Quellen wie Books3, Library Genesis (LibGen) oder Pirate Library Mirror (PiLiMi) verwendet worden sein.
Millionen von Papierbüchern entsorgt
Neben eBooks hat Anthropic scheinbar auch Millionen von Büchern in Papierform beschafft und ihre KI Modelle wie Claude trainieren zu können. Die Bücher wurden gescannt und somit digitalisiert und anschliessend entsorgt. Diese Vorgehensweise ist grundsätzlich nicht ungewöhnlich doch aufgrund der unglaublich hohen Anzahl Bücher im Millionenbereich welche verwendet wurden aus Sicht der Nachhaltigkeit ein fragwürdiger Vorgang.
Entscheid der Richter
Die US Richter konnten keinen Copyright Verstoss bei der eigentlichen Digitalisierung der Buchinhalte feststellen und sprechen Anthropic in diesem Punkt frei. Buchinhalte zu digitalisieren, daraus zu lernen und den Originalinhalt wieder zu löschen sei nicht problematisch stellten die Richter fest. Der Vorgang wurde als konform mit der Fair Use Doktrin taxiert. Die Richter verglichen das Vorgehen mit einem jungen Autor der viele Bücher liest um dann selber später erfolgreiche Bücher schreiben zu können. Das Gericht entschied jedoch, dass die Nutzung von piratierten Büchern, um eine zentrale Bibliothek aufzubauen, nicht gerechtfertigt war, da dies keine transformative Nutzung darstellt und die Bücher unrechtmäßig erworben wurden. Dieser Entscheid könnte sich für Anthropic als fatal herausstellen, da die US KI Firma wie erwähnt Millionen eBooks aus solchen Quellen verwendet hat. Erfolgreiche Schadensersatzklagen und daraus notwendige Schadensersatzzahlungen könnten zum existentiellen Problem für Anthropic werden.
Quelle: Arstechnica, Gerichtsdokumente: Link
Das sieht nicht gut aus. Bei Millionen von eBooks die hier verwendet wurden können die Zahlungen schnell mal in die Milliarden bzw. Billionen gehen….