Μηνύσεις σε OpenAI και META για πνευματικά δικαιώματα|G BLOG

Η κωμικός και συγγραφέας Sarah Silverman, μαζί με τους συγγραφείς Christopher Golden και Richard Kadrey υπέβαλλαν πρόσφατα αγωγές ενάντια στις εταιρείες OpenAI και META σε ένα περιφερειακό δικαστήριο των Ηνωμένων Πολιτειών της Αμερικής αξιώνοντας αποζημιώσεις για παραβιάσεις πνευματικών δικαιωμάτων.

Στις αγωγές, η γνωστή κωμικός και συγγραφέας μαζί με τους άλλους δύο συγγραφείς ισχυρίζονται, μεταξύ άλλων, ότι τα γλωσσικά μοντέλα ChatGPT (της OpenAI) και LLaMA (της META) εκπαιδεύτηκαν με τη χρήση διάφορων σετ ή συνόλων δεδομένων που περιείχαν έργα τους και τα οποία, όπως λένε, αποκτήθηκαν παράνομα από ιστοσελίδες «σκιωδών βιβλιοθηκών» όπως οι Bibliotik, Library Genesis, Z-Library και άλλες, επισημαίνοντας ότι τα βιβλία τους είναι «διαθέσιμα στο σύνολο τους μέσω (παράνομων) συστημάτων torrent».

Στην αγωγή ενάντια στην OpenAI, οι Sarah Silverman, Christopher Golden και Richard Kadrey παρουσιάζουν πειστήρια που δείχνουν ότι όταν ζητηθεί από το ChatGPT μπορεί να συνοψίσει τα βιβλία τους, κάτι που όπως λένε παραβιάζει τα πνευματικά τους δικαιώματα. Το «The Bedwetter» της Sarah Silverman είναι το πρώτο βιβλίο που παρουσιάζεται να συνοψίζεται από το ChatGPT στα πειστήρια που παρουσιάστηκαν ενώ ως παραδείγματα χρησιμοποιούνται και τα βιβλία Ararat και Sandman Slim των Christopher Golden και Richard Kadrey αντίστοιχα.

Όσον αφορά την ξεχωριστή αγωγή που υπέβαλλαν κατά της META, οι τρεις συγγραφείς ισχυρίζονται ότι τα βιβλία τους βρίσκονταν σε σετ/σύνολα δεδομένων, τα οποία αξιοποιήθηκαν από την εταιρεία META για την εκπαίδευση των μοντέλων LLaMA, ένα κουαρτέτο από μοντέλα AI ανοιχτού κώδικα που παρουσίασε η εταιρεία τον περασμένο Φεβρουάριο.

Στην καταγγελία τους, οι τρεις ενάγοντες περιγράφουν πως τα σετ ή σύνολα δεδομένων της META έχουν παράνομη προέλευση. Πιο συγκεκριμένα, σε ένα έγγραφο της META που περιγράφει λεπτομερώς το LLaMA, η εταιρεία αναφέρει τις πηγές των συνόλων δεδομένων εκπαίδευσης. Ένα από αυτά τα σετ δεδομένων ονομάζεται ThePile και συγκεντρώθηκε από μία εταιρεία με την ονομασία EleutherAI. Το σετ δεδομένων ThePile, όπως επισημαίνεται στην καταγγελία, περιγράφεται σε ένα έγγραφο της EleutherAI ως «αντίγραφο του περιεχομένου του ιδιωτικού tracker με την ονομασία Bibliotik». Η Bibliotik όπως και οι άλλες «σκιώδεις βιβλιοθήκες» που αναφέρονται στα έγγραφα που κατατέθηκαν χαρακτηρίζονται «κατάφωρα παράνομες».

Και στις δύο περιπτώσεις, οι συγγραφείς λένε ότι «δεν συναίνεσαν στη χρήση των βιβλίων τους, τα οποία προστατεύονται από πνευματικά δικαιώματα, ως εκπαιδευτικού υλικού για τα μοντέλα τεχνητής νοημοσύνης των εταιρειών». Οι συγγραφείς κατηγορούν τις δύο εταιρείες για παραβίαση πνευματικών δικαιωμάτων, αμέλεια, παράνομο πλουτισμό και αθέμιτο ανταγωνισμό και ζητούν νόμιμες αποζημιώσεις, επιστροφή κερδών και πολλά άλλα.

Οι νομικοί εκπρόσωποι τους Joseph Saveri και Matthew Butterick αναφέρουν στην ιστοσελίδα της εταιρείας τους LLMlitigation ότι έχουν ακούσει «συντάκτες, συγγραφείς και εκδότες να εκφράζουν την ανησυχία τους για την παράξενη ικανότητα του [ChatGPT] να δημιουργεί κείμενο παρόμοιο με αυτό που βρίσκεται σε κείμενα που προστατεύονται από πνευματικά δικαιώματα, συμπεριλαμβανομένων και χιλιάδων βιβλίων». Ο John Saveri έχει επίσης υποβάλει προσφυγές εναντίον εταιρειών AI για λογαριασμό διάφορων προγραμματιστών και καλλιτεχνών. Η εταιρεία Getty Images κατέθεσε επίσης μήνυση με επίκεντρο την τεχνητή νοημοσύνη, ισχυριζόμενη ότι η Stability AI που δημιούργησε το εργαλείο δημιουργίας εικόνων AI Stable Diffusion εκπαίδευσε το μοντέλο της σε «εκατομμύρια εικόνες που προστατεύονται από πνευματικά δικαιώματα». Οι Joseph Saveri και Matthew Butterick εκπροσωπούν επίσης τους συγγραφείς Mona Awad και Paul Tremblay σε μια παρόμοια υπόθεση όπου κατηγορούν την OpenAI και το chatbot της για παραβίαση πνευματικής ιδιοκτησίας.