Η αμερικανική startup Τεχνητής Νοημοσύνης (AI) Anthropic ανέπτυξε ένα νέο μοντέλο, το οποίο ισχυρίζεται ότι είναι υπερβολικά ισχυρό για να διατεθεί δημόσια, σύμφωνα με δηλώσεις στελεχών της εταιρείας που επικαλούνται διάφορα μέσα ενημέρωσης. Η εταιρεία ανέφερε την Τετάρτη ότι βρίσκεται σε συζητήσεις με την κυβέρνηση των ΗΠΑ σχετικά με το μοντέλο, ονομασμένο Claude Mythos Preview, και τις δυνατότητές του.
Η είδηση έρχεται ένα μήνα αφότου ο πρόεδρος των ΗΠΑ Donald Trump απαγόρευσε στις κυβερνητικές υπηρεσίες τη χρήση της Τεχνητής Νοημοσύνης της Anthropic για έξι μήνες, κατηγορώντας την εταιρεία για πίεση στο Πεντάγωνο και για υπονόμευση της εθνικής ασφάλειας. Τότε, το Υπουργείο Άμυνας των ΗΠΑ είχε συνάψει συμφωνία με την ανταγωνίστρια της εταιρείας, OpenAI, για τη χρήση των εργαλείων της σε κωδικοποιημένα στρατιωτικά συστήματα.
Εσωτερικά έγγραφα για το μη διαθέσιμο μοντέλο Claude Mythos είχαν διαρρεύσει ακούσια τον Φεβρουάριο, μετά την αποκάλυψη χιλιάδων εγγράφων σε δημόσια αποθήκευση δεδομένων. Επίσης, νωρίτερα αυτόν τον μήνα, η Anthropic δημοσίευσε κατά λάθος πάνω από 500.000 γραμμές κώδικα για την Τεχνητή Νοημοσύνη Claude, συμπεριλαμβανομένων μη διαθέσιμων χαρακτηριστικών και σημειώσεων προγραμματιστών, χαρακτηρίζοντάς το ως “ανθρώπινο λάθος, όχι παραβίαση ασφαλείας”.
Το νέο μοντέλο της Anthropic είναι “εξαιρετικά αυτόνομο” και μπορεί να συλλογιστεί σαν ένας προηγμένος ερευνητής ασφαλείας, δήλωσε στο Axios ο Logan Graham, επικεφαλής της ομάδας “frontier red team” της εταιρείας. Ανέφερε ότι μπορεί να εντοπίσει δεκάδες χιλιάδες ευπάθειες και, σε αντίθεση με προηγούμενα μοντέλα, να δημιουργήσει τα αντίστοιχα exploits. Σε συνέντευξή του στους New York Times, ο Graham τόνισε ότι το μοντέλο σηματοδοτεί “το σημείο εκκίνησης για αυτό που πιστεύουμε ότι θα αποτελέσει σημείο καμπής ή επαναξιολόγησης στον κλάδο, σχετικά με το τι πρέπει να γίνει τώρα”.
Σε ανάρτησή της στο blog την Τετάρτη, η Anthropic ανέφερε ότι το μοντέλο Mythos θα είναι διαθέσιμο μόνο σε μια επιλεγμένη ομάδα εταιρειών τεχνολογίας και κυβερνοασφάλειας, επικαλούμενη ανησυχίες σχετικά με την ικανότητά του να εντοπίζει και να εκμεταλλεύεται κενά ασφαλείας. Η εταιρεία πρόσθεσε ότι δεν θα καταστεί δημόσια προσβάσιμο μέχρι να τεθούν σε ισχύ δικλείδες ασφαλείας για τον περιορισμό των πιο επικίνδυνων δυνατοτήτων του.
Αντί να διαθέσει ευρέως την τεχνολογία, η Anthropic σχεδιάζει να παρέχει πρόσβαση μέσω μιας νέας βιομηχανικής συνεργασίας, του Project Glasswing. Η πρωτοβουλία, η οποία περιλαμβάνει πάνω από 40 οργανισμούς όπως η Apple, η Amazon, η Microsoft, η Google και η NVIDIA, θα δοκιμάσει την ικανότητα του μοντέλου να εντοπίζει και να βοηθά στην επιδιόρθωση ευπαθειών σε κρίσιμες εφαρμογές. Η Anthropic δήλωσε ότι έχει παραδώσει το μοντέλο σε εξωτερικές ομάδες, συμπεριλαμβανομένων κυβερνητικών οργανισμών των ΗΠΑ, για την αξιολόγηση βασικών κινδύνων – όπως κυβερνοασφάλεια, απώλεια ελέγχου, CBRN (χημικοί, βιολογικοί, ραδιολογικοί, πυρηνικοί κίνδυνοι) και επιβλαβής χειραγώγηση – και έχει ενσωματώσει τα ευρήματα στην συνολική αξιολόγηση κινδύνου.