Η εταιρεία τεχνητής νοημοσύνης Anthropic αποκάλυψε κατά λάθος λεπτομέρειες για μια επερχόμενη κυκλοφορία μοντέλου, μια αποκλειστική εκδήλωση για CEO και άλλα εσωτερικά δεδομένα, συμπεριλαμβανομένων εικόνων και αρχείων PDF, σε αυτό που φαίνεται να είναι ένα σοβαρό λάθος ασφαλείας. Οι πληροφορίες που δεν είχαν δημοσιοποιηθεί ήταν προσβάσιμες μέσω του συστήματος διαχείρισης περιεχομένου (CMS) της εταιρείας. Σύμφωνα με τον Alexandre Pauwels, ερευνητή κυβερνοασφάλειας στο Πανεπιστήμιο του Cambridge, κοντά στα 3.000 αρχεία που σχετίζονταν με το blog της Anthropic, τα οποία δεν είχαν δημοσιευτεί προηγουμένως, ήταν δημόσια προσβάσιμα.
Μετά από ενημέρωση της Anthropic από το Fortune την Πέμπτη, η εταιρεία έλαβε μέτρα για την ασφάλιση των δεδομένων, καθιστώντας τα μη προσβάσιμα. Πριν από αυτά τα μέτρα, η Anthropic αποθήκευε όλο το περιεχόμενο για τον ιστότοπό της σε ένα κεντρικό σύστημα προσβάσιμο χωρίς σύνδεση. Οποιοσδήποτε με τεχνικές γνώσεις μπορούσε να στείλει αιτήματα στο δημόσιο σύστημα ζητώντας πληροφορίες για τα αρχεία που περιέχει. Αυτό σήμαινε ότι μη δημοσιευμένο υλικό, συμπεριλαμβανομένων προσχεδίων σελίδων και εσωτερικών πόρων, θα μπορούσε να προσπελαστεί άμεσα.
Το πρόβλημα φαίνεται να οφείλεται στον τρόπο λειτουργίας του CMS. Όλοι οι πόροι που ανεβαίνουν στην κεντρική αποθήκη δεδομένων ήταν δημόσιοι εξ ορισμού, εκτός αν είχαν οριστεί ρητώς ως ιδιωτικοί. Η εταιρεία φαίνεται να ξέχασε να περιορίσει την πρόσβαση σε ορισμένα έγγραφα που δεν προορίζονταν για δημοσίευση. Ένας εκπρόσωπος της Anthropic δήλωσε στο Fortune: «Ένα πρόβλημα με ένα από τα εξωτερικά εργαλεία CMS μας οδήγησε στην πρόσβαση προσχεδίου περιεχομένου», αποδίδοντας το περιστατικό σε «ανθρώπινο λάθος στη διαμόρφωση του CMS».
Παρά τα πρόσφατα τεχνικά προβλήματα σε εταιρείες τεχνολογίας που συνδέονται με κώδικα που παράγεται από AI, η Anthropic δήλωσε ότι η AI δεν έπαιξε ρόλο σε αυτό το περιστατικό. Ο εκπρόσωπος τόνισε ότι το πρόβλημα ήταν «άλλαξε με το Claude, το Cowork ή οποιαδήποτε εργαλεία AI της Anthropic». Η εταιρεία προσπάθησε να υποβαθμίσει τη σημασία των υλικών που είχαν μείνει ανασφάλιστα, αναφέροντας ότι «αυτά τα υλικά ήταν προσχέδια περιεχομένου που εξετάζονταν για δημοσίευση και δεν αφορούσαν την κύρια υποδομή μας, τα συστήματα AI, τα δεδομένα πελατών ή την αρχιτεκτονική ασφαλείας».
Ενώ πολλά από τα έγγραφα φαίνεται να είναι παροπλισμένοι ή αχρησιμοποίητοι πόροι για προηγούμενες αναρτήσεις ιστολογίων, όπως εικόνες, πανό και λογότυπα, ορισμένα από τα δεδομένα φαίνεται να περιγράφουν ευαίσθητες πληροφορίες. Τα έγγραφα περιλαμβάνουν λεπτομέρειες για επικείμενες ανακοινώσεις προϊόντων, συμπεριλαμβανομένων πληροφοριών για ένα αδημοσίευτο μοντέλο AI, το οποίο η Anthropic χαρακτήρισε ως το πιο ικανό μοντέλο που έχει εκπαιδεύσει. Μετά από επικοινωνία με το Fortune, η εταιρεία παραδέχτηκε ότι αναπτύσσει και δοκιμάζει ένα νέο μοντέλο με πελάτες πρώιμης πρόσβασης, το οποίο χαρακτήρισε ως «αλλαγή σταδίου» στις δυνατότητες της AI, με σημαντικά καλύτερες επιδόσεις σε «συλλογισμό, κωδικοποίηση και κυβερνοασφάλεια» σε σύγκριση με προηγούμενα μοντέλα της Anthropic.
Τα δημόσια προσβάσιμα δεδομένα περιλάμβαναν επίσης πληροφορίες για μια επερχόμενη, μόνο με πρόσκληση, συγκέντρωση CEOs μεγάλων ευρωπαϊκών εταιρειών στο Ηνωμένο Βασίλειο, στην οποία αναμένεται να παραστεί ο CEO της Anthropic, Dario Amodei. Ο εκπρόσωπος της Anthropic δήλωσε ότι η συγκέντρωση ήταν «μέρος μιας συνεχούς σειράς εκδηλώσεων που φιλοξενούμε τον τελευταίο χρόνο».
Μεταξύ των εγγράφων υπήρχαν και εικόνες που φαίνεται να είναι για εσωτερική χρήση, συμπεριλαμβανομένης μιας εικόνας με τίτλο που περιγράφει «γονική άδεια» ενός υπαλλήλου. Αυτό δεν είναι η πρώτη φορά που μια εταιρεία τεχνολογίας εκθέτει ακούσια εσωτερικούς πόρους ή υλικό πριν από επίσημες ανακοινώσεις. Πρόσφατα, η Apple έχει διαρρεύσει πληροφορίες δύο φορές μέσω του ιστότοπού της, ενώ εταιρείες όπως η Epic Games και η Nintendo έχουν δει προδημοσιευμένες εικόνες και άλλα μέσα να διαρρέουν μέσω συστημάτων παράδοσης περιεχομένου. Ακόμη και μεγαλύτερες εταιρείες όπως η Google έχουν εκθέσει κατά λάθος εσωτερική τεκμηρίωση σε δημόσιες διευθύνσεις URL, και δεδομένα που σχετίζονται με οχήματα της Tesla έχουν εκτεθεί μέσω λανθασμένα διαμορφωμένων τρίτων διακομιστών.
Ωστόσο, το πρόβλημα επιδεινώνεται πιθανώς από τα διαθέσιμα εργαλεία κωδικοποίησης AI, συμπεριλαμβανομένου του Claude Code της Anthropic. Αυτά τα εργαλεία αυτοματοποιούν τη σάρωση, την ανίχνευση προτύπων και τη συσχέτιση δημόσια προσβάσιμων πόρων, καθιστώντας ευκολότερη την ανακάλυψη τέτοιου περιεχομένου.