Η Anthropic αναπτύσσει ένα πανίσχυρο μοντέλο Τεχνητής Νοημοσύνης που δεν μπορεί να διατεθεί δημόσια

Η αμερικανική startup Τεχνητής Νοημοσύνης (AI) Anthropic ανέπτυξε ένα νέο μοντέλο, το οποίο ισχυρίζεται ότι είναι υπερβολικά ισχυρό για να διατεθεί δημόσια, σύμφωνα με δηλώσεις στελεχών της εταιρείας που επικαλούνται διάφορα μέσα ενημέρωσης. Η εταιρεία ανέφερε την Τετάρτη ότι βρίσκεται σε συζητήσεις με την κυβέρνηση των ΗΠΑ σχετικά με το μοντέλο, ονομασμένο Claude Mythos Preview, και τις δυνατότητές του.

Η είδηση έρχεται ένα μήνα αφότου ο πρόεδρος των ΗΠΑ Donald Trump απαγόρευσε στις κυβερνητικές υπηρεσίες τη χρήση της Τεχνητής Νοημοσύνης της Anthropic για έξι μήνες, κατηγορώντας την εταιρεία για πίεση στο Πεντάγωνο και για υπονόμευση της εθνικής ασφάλειας. Τότε, το Υπουργείο Άμυνας των ΗΠΑ είχε συνάψει συμφωνία με την ανταγωνίστρια της εταιρείας, OpenAI, για τη χρήση των εργαλείων της σε κωδικοποιημένα στρατιωτικά συστήματα.

Εσωτερικά έγγραφα για το μη διαθέσιμο μοντέλο Claude Mythos είχαν διαρρεύσει ακούσια τον Φεβρουάριο, μετά την αποκάλυψη χιλιάδων εγγράφων σε δημόσια αποθήκευση δεδομένων. Επίσης, νωρίτερα αυτόν τον μήνα, η Anthropic δημοσίευσε κατά λάθος πάνω από 500.000 γραμμές κώδικα για την Τεχνητή Νοημοσύνη Claude, συμπεριλαμβανομένων μη διαθέσιμων χαρακτηριστικών και σημειώσεων προγραμματιστών, χαρακτηρίζοντάς το ως “ανθρώπινο λάθος, όχι παραβίαση ασφαλείας”.

Το νέο μοντέλο της Anthropic είναι “εξαιρετικά αυτόνομο” και μπορεί να συλλογιστεί σαν ένας προηγμένος ερευνητής ασφαλείας, δήλωσε στο Axios ο Logan Graham, επικεφαλής της ομάδας “frontier red team” της εταιρείας. Ανέφερε ότι μπορεί να εντοπίσει δεκάδες χιλιάδες ευπάθειες και, σε αντίθεση με προηγούμενα μοντέλα, να δημιουργήσει τα αντίστοιχα exploits. Σε συνέντευξή του στους New York Times, ο Graham τόνισε ότι το μοντέλο σηματοδοτεί “το σημείο εκκίνησης για αυτό που πιστεύουμε ότι θα αποτελέσει σημείο καμπής ή επαναξιολόγησης στον κλάδο, σχετικά με το τι πρέπει να γίνει τώρα”.

Σε ανάρτησή της στο blog την Τετάρτη, η Anthropic ανέφερε ότι το μοντέλο Mythos θα είναι διαθέσιμο μόνο σε μια επιλεγμένη ομάδα εταιρειών τεχνολογίας και κυβερνοασφάλειας, επικαλούμενη ανησυχίες σχετικά με την ικανότητά του να εντοπίζει και να εκμεταλλεύεται κενά ασφαλείας. Η εταιρεία πρόσθεσε ότι δεν θα καταστεί δημόσια προσβάσιμο μέχρι να τεθούν σε ισχύ δικλείδες ασφαλείας για τον περιορισμό των πιο επικίνδυνων δυνατοτήτων του.

Αντί να διαθέσει ευρέως την τεχνολογία, η Anthropic σχεδιάζει να παρέχει πρόσβαση μέσω μιας νέας βιομηχανικής συνεργασίας, του Project Glasswing. Η πρωτοβουλία, η οποία περιλαμβάνει πάνω από 40 οργανισμούς όπως η Apple, η Amazon, η Microsoft, η Google και η NVIDIA, θα δοκιμάσει την ικανότητα του μοντέλου να εντοπίζει και να βοηθά στην επιδιόρθωση ευπαθειών σε κρίσιμες εφαρμογές. Η Anthropic δήλωσε ότι έχει παραδώσει το μοντέλο σε εξωτερικές ομάδες, συμπεριλαμβανομένων κυβερνητικών οργανισμών των ΗΠΑ, για την αξιολόγηση βασικών κινδύνων – όπως κυβερνοασφάλεια, απώλεια ελέγχου, CBRN (χημικοί, βιολογικοί, ραδιολογικοί, πυρηνικοί κίνδυνοι) και επιβλαβής χειραγώγηση – και έχει ενσωματώσει τα ευρήματα στην συνολική αξιολόγηση κινδύνου.

Η αμερικανική startup συζητά τις δυνατότητες του "Claude Mythos" με την κυβέρνηση των ΗΠΑ, ενώ εσωτερικά έγγραφα είχαν διαρρεύσει κατά λάθος.

> Latest Stories

Δικαστική κίνηση από τη μητέρα του Nolan Wells για τον θάνατο του 18χρονου

Η Milania Giudice χορεύει με την αδερφή της που την κατήγγειλε στην αστυνομία

Πυρετός για ένα εισιτήριο στο μουσείο του George Lucas: 5 ώρες αναμονή για τους θαυμαστές

Ξαφνιάστηκε ο Adan Banuelos: Έμαθε από τα ΜΜΕ ότι χώρισε με την Bella Hadid

Ισπανία: Εικόνες αποκάλυψης από drone μετά την πυρκαγιά των 30.000 στρεμμάτων

Στα 37,5 δισεκατομμύρια δολάρια αποτιμά ο Pete Hegseth το κόστος του πολέμου με το Ιράν

Minab: Τελέστηκαν οι κηδείες των 32 παιδιών που σκοτώθηκαν σε αεροπορική επιδρομή

Διαδηλωτές διέκοψαν την κατάθεση του Pete Hegseth στη Γερουσία για τον πόλεμο με το Ιράν

> Russia

Το Διεθνές Νομισματικό Ταμείο εγκρίνει νέα δόση 690 εκατομμυρίων δολαρίων για την Ουκρανία

Παρά τις διαπιστωμένες καθυστερήσεις στις μεταρρυθμίσεις για την καταπολέμηση της διαφθοράς, η χρηματοδοτική ενίσχυση προς το Κίεβο προχωρά κανονικά.

Ρωσία και Λάος ενισχύουν τις διμερείς σχέσεις τους με επίκεντρο την πυρηνική ενέργεια

Andy Burnham: Ο νέος πρωθυπουργός της Βρετανίας και το στοίχημα της ελπίδας

Μπολόνια: Έντονες συγκρούσεις μετά τον θάνατο Μαροκινού επιχειρηματία από αστυνομική επέμβαση

Δικαστήριο στο Δελχί επιτρέπει σε Αμερικανό μισθοφόρο ειδική διατροφή στη φυλακή Tihar