Η Anthropic, εταιρεία ανάπτυξης τεχνητής νοημοσύνης, βρέθηκε αντιμέτωπη με μια νέα, ακούσια διαρροή πηγαιού κώδικα για το δημοφιλές εργαλείο κωδικοποίησης Claude Code. Το περιστατικό αυτό έρχεται λίγες μόλις ημέρες αφότου το περιοδικό Fortune αποκάλυψε ότι η εταιρεία είχε δημοσιοποιήσει κατά λάθος σχεδόν 3.000 αρχεία, συμπεριλαμβανομένου ενός προσχεδίου ανάρτησης ιστολογίου που ανέφερε ένα ισχυρό επερχόμενο μοντέλο, γνωστό εσωτερικά ως “Mythos” ή “Capybara”, το οποίο παρουσιάζει πρωτοφανείς κινδύνους κυβερνοασφάλειας.
Η πρόσφατη διαρροή αφορά περίπου 500.000 γραμμές κώδικα, κατανεμημένες σε περίπου 1.900 αρχεία. Εκπρόσωπος της Anthropic επιβεβαίωσε τη διαρροή, δηλώνοντας ότι “κάποιος εσωτερικός πηγαίος κώδικας” διέρρευσε κατά την “έκδοση του Claude Code”. Τόνισε, ωστόσο, ότι “δεν εμπλέκονται ούτε εκτέθηκαν ευαίσθητα δεδομένα πελατών ή διαπιστευτήρια”. Η εταιρεία απέδωσε το περιστατικό σε “πρόβλημα στη συσκευασία της έκδοσης, που προκλήθηκε από ανθρώπινο λάθος, και όχι σε παραβίαση ασφάλειας”. Υποσχέθηκε, δε, την εφαρμογή μέτρων για την αποτροπή επανάληψης παρόμοιων συμβάντων.
Η διαρροή του πηγαίου κώδικα είναι πιθανώς πιο επιζήμια για την Anthropic από την προηγούμενη, ακούσια έκθεση του προσχεδίου ανάρτησης ιστολογίου σχετικά με το επερχόμενο μοντέλο. Παρόλο που η τελευταία παραβίαση δεν αποκάλυψε τα βάρη (weights) του ίδιου του μοντέλου Claude, επέτρεψε σε άτομα με τεχνικές γνώσεις να εξαγάγουν επιπλέον εσωτερικές πληροφορίες από τον κώδικα της εταιρείας.
Το Claude Code θεωρείται ένα από τα δημοφιλέστερα προϊόντα της Anthropic, με αυξανόμενη υιοθέτηση από μεγάλες επιχειρήσεις. Οι δυνατότητες του Claude Code πηγάζουν, εν μέρει, όχι μόνο από το υποκείμενο μεγάλο γλωσσικό μοντέλο, αλλά και από το “harness” λογισμικού που περιβάλλει το μοντέλο και του παρέχει οδηγίες για τη χρήση άλλων εργαλείων, καθώς και σημαντικούς “φύλακες” (guardrails) που διέπουν τη συμπεριφορά του. Η διαρροή αφορά τον πηγαίο κώδικα αυτού του “agentic harness”, επιτρέποντας δυνητικά σε ανταγωνιστές να πραγματοποιήσουν αντίστροφη μηχανική (reverse-engineer) στον τρόπο λειτουργίας του και να βελτιώσουν τα δικά τους προϊόντα. Επιπλέον, προκύπτει η πιθανότητα δημιουργίας εκδόσεων ανοικτού κώδικα του “agentic harness” του Claude Code, βασισμένων στον κλεμμένο κώδικα.
Ο διαρρεύσας κώδικας παρείχε επίσης περαιτέρω αποδείξεις για την ύπαρξη ενός νέου μοντέλου με την εσωτερική ονομασία “Capybara”, το οποίο η εταιρεία ετοιμάζει ενεργά για κυκλοφορία. Σύμφωνα με τον Roy Paz, ερευνητή ασφάλειας AI στην LayerX Security, το μοντέλο αυτό θα διαθέτει “γρήγορη” και “αργή” έκδοση και αναμένεται να αντικαταστήσει το Opus, το πιο προηγμένο μοντέλο της Anthropic που κυκλοφορεί σήμερα.
Η Anthropic αυτή τη στιγμή διαθέτει τα μοντέλα της σε τρία διαφορετικά μεγέθη: Opus (η μεγαλύτερη και πιο ικανή έκδοση), Sonnet (ελαφρώς ταχύτερη και φθηνότερη, αλλά λιγότερο ικανή) και Haiku (η μικρότερη, φθηνότερη και ταχύτερη). Στο προσχέδιο ανάρτησης ιστολογίου που έλαβε το Fortune, το “Capybara” περιγράφεται ως μια νέα κατηγορία μοντέλου, μεγαλύτερη και πιο ικανή από το Opus, αλλά και πιο ακριβή.
Η πρόσφατη διαρροή, η οποία δημοσιοποιήθηκε αρχικά σε μια ανάρτηση, φαίνεται να συνέβη αφού η Anthropic ανέβασε ολόκληρο τον πηγαίο κώδικα του Claude Code στο NPM (μια πλατφόρμα για την κοινή χρήση και ενημέρωση λογισμικού), αντί μόνο την τελική έκδοση που εκτελούν οι υπολογιστές. Αυτό το λάθος, σύμφωνα με τον Paz, μοιάζει με “ανθρώπινο λάθος” που προέκυψε από παράκαμψη των συνήθων διασφαλίσεων έκδοσης. “Συνήθως, μεγάλες εταιρείες έχουν αυστηρές διαδικασίες και πολλαπλούς ελέγχους πριν ο κώδικας φτάσει στην παραγωγή”, δήλωσε στο Fortune, “Στην Anthropic, φαίνεται ότι η διαδικασία δεν ήταν σε ισχύ και μια απλή λανθασμένη ρύθμιση ή κλικ εξέθεσε ξαφνικά τον πλήρη πηγαίο κώδικα.”
Ο Paz εξέφρασε επίσης ανησυχίες για τον τρόπο σύνδεσης του εργαλείου με τα εσωτερικά συστήματα της Anthropic. Φαίνεται πιθανό να είναι δυνατή η πρόσβαση σε εσωτερικές υπηρεσίες που θα έπρεπε να είναι περιορισμένες, ακόμη και χωρίς ειδικά κρυπτογραφημένα κλειδιά πρόσβασης. Προειδοποίησε ότι αυτό θα μπορούσε να δώσει σε κακόβουλους δρώντες, συμπεριλαμβανομένων κρατών, νέες ευκαιρίες για να εκμεταλλευτούν τα μοντέλα της Anthropic για τη δημιουργία ισχυρότερων εργαλείων κυβερνοεπιθέσεων και την παράκαμψη των μηχανισμών ασφαλείας.
Το τρέχον πιο ισχυρό μοντέλο της Anthropic, το Claude 4.6 Opus, έχει ήδη χαρακτηριστεί από την εταιρεία ως επικίνδυνο όσον αφορά τους κινδύνους κυβερνοασφάλειας. Η Anthropic έχει δηλώσει ότι τα τρέχοντα μοντέλα Opus είναι ικανά να εντοπίζουν αυτόνομα zero-day ευπάθειες σε λογισμικό. Ενώ αυτές οι δυνατότητες προορίζονται να βοηθήσουν τις εταιρείες να εντοπίζουν και να διορθώνουν σφάλματα, θα μπορούσαν επίσης να αξιοποιηθούν από χάκερ, συμπεριλαμβανομένων κρατών, για να βρουν και να εκμεταλλευτούν ευπάθειες.
Αυτή δεν είναι η πρώτη φορά που η Anthropic διέρρευσε ακούσια λεπτομέρειες για το δημοφιλές εργαλείο Claude Code. Τον Φεβρουάριο του 2025, μια πρώιμη έκδοση του Claude Code είχε ακούσια εκθέσει τον αρχικό του κώδικα σε παρόμοια παραβίαση, αποκαλύπτοντας πώς λειτουργούσε το εργαλείο παρασκηνιακά και πώς συνδεόταν με τα εσωτερικά συστήματα της Anthropic. Η Anthropic αφαίρεσε αργότερα το λογισμικό και απέσυρε τον δημόσιο κώδικα.