Ένα τμήμα του πηγαίου κώδικα του Claude Code, του γνωστού AI agent της Anthropic, κατέληξε στο GitHub την Τρίτη, προκαλώντας “πυρετό” στους μηχανικούς λογισμικού. Οι ειδικοί έσπευσαν να μελετήσουν το υλικό, με την ελπίδα να αντλήσουν γνώσεις και να βελτιώσουν τα δικά τους πρότζεκτ.
Η ειρωνεία της υπόθεσης είναι ότι η Anthropic, η οποία η ίδια έχει εμπλακεί σε πρακτικές χρήσης κλεμμένων πληροφοριών για την εκπαίδευση των μεγάλων γλωσσικών μοντέλων της, υπέβαλε αμέσως αίτημα αφαίρεσης του κώδικα, επικαλούμενη παραβίαση πνευματικών δικαιωμάτων.
“Υποβάλαμε αίτημα DMCA takedown για ένα αποθετήριο που φιλοξενούσε διαρροή του πηγαίου κώδικα του Claude Code και τα forks του”, δήλωσε εκπρόσωπος της Anthropic, αναφερόμενος στον νόμο Digital Millennium Copyright Act.
Η Anthropic, η OpenAI και η Google έχουν βρεθεί αντιμέτωπες με αγωγές για τη χρήση υλικού που προστατεύεται από πνευματικά δικαιώματα – συμπεριλαμβανομένων δημοσιευμένων βιβλίων, άρθρων, επιστημονικών περιοδικών και άλλου περιεχομένου που βρέθηκε στο διαδίκτυο – χωρίς ρητή άδεια. Ως απάντηση, συγγραφείς, καλλιτέχνες και εκδότες έχουν κάνει χρήση της νομοθεσίας περί πνευματικών δικαιωμάτων για να ζητήσουν λογοδοσία και, συχνά, αποζημίωση.
Τον Σεπτέμβριο, ένα δικαστήριο διέταξε την Anthropic να καταβάλει 1,5 δισεκατομμύριο δολάρια σε αποζημιώσεις σε μια ομαδική αγωγή που άσκησαν συγγραφείς και εκδότες – συμπεριλαμβανομένων των κύριων εναγόντων Andrea Bartz, Charles Graeber και Kirk Wallace Johnson – λόγω ισχυρισμών ότι χρησιμοποίησε πειρατικά βιβλία και σκιώδεις βιβλιοθήκες για την εκπαίδευση του Claude.
Τον Ιούνιο, το Reddit μήνυσε την Anthropic για απόξεση (scraping) μεγάλου όγκου περιεχομένου που δημιουργήθηκε από χρήστες, προκειμένου να εκπαιδεύσει τα μοντέλα της χωρίς εξουσιοδότηση ή αποζημίωση των χρηστών.
Τον περασμένο μήνα, οι Universal Music Group, Concord και ABKCO κατέθεσαν αγωγή κατά της Anthropic για παράνομη λήψη πάνω από 20.000 τραγουδιών που προστατεύονται από πνευματικά δικαιώματα, επίσης για την εκπαίδευση των μοντέλων της.
Τώρα, οι ρόλοι έχουν αντιστραφεί και η Anthropic επικαλείται τους νόμους περί πνευματικών δικαιωμάτων για να προστατεύσει τις δικές της δημιουργίες. “Εφαρμόζουμε μέτρα για να αποτρέψουμε να συμβεί αυτό ξανά”, δήλωσε εκπρόσωπος της Anthropic.
Ευτυχώς για την εταιρεία, η διαρροή μπορεί να μην είναι τόσο σοβαρή όσο κάποιοι φοβούνταν. Ο Paul Price, ειδικός κυβερνοασφάλειας και ιδρυτής της εταιρείας ηθικής hacking Code Wall – η οποία πρόσφατα αποκάλυψε ευπάθειες στο εσωτερικό chatbot της McKinsey, Lilli – δήλωσε ότι η διαρροή της Anthropic δεν αποκάλυψε κάτι κρίσιμο.
“Είναι περισσότερο embarrassing παρά επιζήμιο. Το περισσότερο από το πραγματικά “ζουμερό” υλικό βρίσκεται στα εσωτερικά μοντέλα πηγών και αυτό δεν διέρρευσε”, δήλωσε στο Business Insider.
Εξήγησε ότι η εταιρεία εξέθεσε ακούσια το “harness” της – μια υποδομή λογισμικού που χρησιμοποιείται συνήθως για τη σύνδεση μεγάλων γλωσσικών μοντέλων με το ευρύτερο πλαίσιο στο οποίο χρησιμοποιούνται.
“Το Claude Code είναι ένα από τα καλύτερα σχεδιασμένα agent harnesses που υπάρχουν, και τώρα μπορούμε να δούμε πώς αντιμετωπίζουν τα δύσκολα προβλήματα”, πρόσθεσε ο Price, σημειώνοντας ότι θα μπορούσε επίσης να αποδειχθεί χρήσιμη πληροφορία για τους ανταγωνιστές.
Η διαρροή ανέδειξε επίσης ένα παράδοξο του κύκλου υπερβολικής δημοσιότητας γύρω από την Τεχνητή Νοημοσύνη: τα ίδια εργαλεία που επιταχύνουν την κατασκευή και την κυκλοφορία προϊόντων, καθιστούν επίσης ευκολότερη τη διαρροή, την αντιγραφή και την άμεση διάδοση πληροφοριών – ευαίσθητων ή όχι.