Το AI-agent της Meta ξέφυγε από τον έλεγχο κατά τη διάρκεια δοκιμής

Η Summer Yue, υπεύθυνη για την ευθυγράμμιση της τεχνητής νοημοσύνης (AI) στη Meta, βρέθηκε αντιμέτωπη με μια απρόσμενη κατάσταση κατά τη διάρκεια δοκιμών ενός δημοφιλούς open-source AI agent, του OpenClaw. Το πρόγραμμα, σχεδιασμένο να λειτουργεί αδιάκοπα για τους χρήστες, ξέφυγε από τον έλεγχο, με αποτέλεσμα να προγραμματίσει τη διαγραφή των email της Yue, αδυνατώντας να σταματήσει ακόμη και μετά από ρητές εντολές.

Σύμφωνα με αναρτήσεις της Yue στο X, το OpenClaw προειδοποίησε ότι θα “διέγραφε ΤΑ ΠΑΝΤΑ από τα εισερχόμενα παλαιότερα από 15 Φεβρουαρίου που δεν είναι ήδη στη λίστα διατήρησής μου”. Παρά τις προσπάθειες της Yue να σταματήσει την ενέργεια, επικοινωνώντας με το AI agent με μηνύματα όπως “Μην το κάνεις αυτό” και “ΣΤΑΜΑΤΑ OPENCLAW”, η διαγραφή των εισερχομένων συνεχιζόταν. “Δεν μπορούσα να το σταματήσω από το τηλέφωνό μου,” έγραψε η Yue, “έπρεπε να τρέξω στο Mac mini μου σαν να έσβηνα μια βόμβα.”

Η Yue είχε προηγουμένως χρησιμοποιήσει το OpenClaw σε ένα “δοκιμαστικό inbox”, όπου το bot λειτούργησε ικανοποιητικά και κέρδισε την εμπιστοσύνη της. Ωστόσο, κατά τη δοκιμή στο “πραγματικό inbox”, το οποίο περιείχε πολύ μεγαλύτερο όγκο email, το OpenClaw αντιμετώπισε πρόβλημα. Η Yue είχε δώσει οδηγίες να μην προχωρά σε καμία ενέργεια χωρίς έγκριση, αλλά το bot έχασε την εντολή κατά τη διαδικασία συμπίεσης των email.

Η Yue εντάχθηκε στη Meta μετά την συμφωνία με την Scale AI, αναλαμβάνοντας διευθυντική θέση στην ευθυγράμμιση της μονάδας Superintelligence Labs. Αυτό προκάλεσε σύγχυση σε ορισμένους επικριτές στα μέσα κοινωνικής δικτύωσης, που αναρωτήθηκαν γιατί κάποιος που ασχολείται με την ασφάλεια του AI θα χρησιμοποιούσε ένα τέτοιο agent, το οποίο στο παρελθόν έχει προκαλέσει ανησυχίες για την ασφάλεια.

Σε αντίθεση με άλλα AI agents, το OpenClaw δεν απαιτεί ανθρώπινη έγκριση για τις ενέργειές του. Ο συνδυασμός της ευελιξίας του και του επιπέδου πρόσβασης που διαθέτει έχει οδηγήσει ορισμένους ερευνητές AI να αμφισβητήσουν την ασφάλεια του bot. Ο ερευνητής AI Gary Marcus δήλωσε στο Business Insider ότι η κατάσταση ήταν σαν “να δίνεις πλήρη πρόσβαση στον υπολογιστή σου και όλους τους κωδικούς σου σε έναν τύπο που γνώρισες σε ένα μπαρ και λέει ότι μπορεί να σε βοηθήσει”.

Ο δημιουργός του OpenClaw, Peter Steinberger, ο οποίος έκτοτε προσλήφθηκε από την OpenAI, δήλωσε σε πρόσφατη συνέντευξη σε podcast ότι δίνει προτεραιότητα στην ανάπτυξη πρόσθετων μέτρων ασφαλείας έναντι των λειτουργιών ευκολίας χρήσης.

Παρόλο που δεν προκαλεί έκπληξη το γεγονός ότι κάποιος που εργάζεται στον τομέα του AI θα δοκιμάσει ένα από τα πιο δημοφιλή προϊόντα AI του τελευταίου έτους, ορισμένοι χρήστες του X επέκριναν την Yue που σύνδεσε το OpenClaw στο πραγματικό της email εξαρχής. Ο Ben Hylak, συνιδρυτής της Raindrop AI, ανάρτησε ένα στιγμιότυπο από το LinkedIn της Yue, γράφοντας: “Αυτό θα έπρεπε να σας τρομάζει. Τι κάνει η Meta;”.

Άλλος χρήστης του X σχολίασε: “Είναι κάπως ανησυχητικό ότι ένα άτομο του οποίου η δουλειά είναι η ευθυγράμμιση του AI εκπλήσσεται όταν ένα AI δεν ακολουθεί ακριβώς τις λεκτικές οδηγίες.”

Η Yue και η Meta δεν απάντησαν στα αιτήματα για σχόλια από το Business Insider.

Η Yue δεν είναι η μόνη εργαζόμενη της Meta που πειραματίζεται με το OpenClaw. Ο Peter Steinberger ανέφερε ότι ο Mark Zuckerberg χρησιμοποίησε το εργαλείο για μία εβδομάδα και μάλιστα έστειλε ανατροφοδότηση. Ενώ η Meta τον προσέγγισε, ο Steinberger αργότερα δέχτηκε πρόταση εργασίας από την OpenAI.

Στα σχόλια της ανάρτησης της Yue, κάποιος ρώτησε για τον ρόλο της στην ευθυγράμμιση του AI: “Δοκίμαζες επίτηδες τα όρια ασφαλείας του ή έκανες ένα αρχάριο λάθος;” Η Yue απάντησε: “Αρχάριο λάθος, για να είμαι ειλικρινής. Αποδεικνύεται ότι οι ερευνητές ευθυγράμμισης δεν είναι άνοσοι στη μη ευθυγράμμιση.”

Εργαζόμενη της Meta έχασε τον έλεγχο ενός αυτόνομου AI, το οποίο απειλούσε να διαγράψει τα email της, παρά τις επανειλημμένες εντολές παύσης.

> Latest Stories

Κατάδικος για φόνο στις ΗΠΑ ζητά 75 εκατομμύρια δολάρια και αμερικανική υπηκοότητα από τον Donald Trump

Δημιούργησε ισχυρό πολιτικό αντίπαλο ο Zelensky με την απομάκρυνση του Mikhail Fedorov

Ανεφίς: Τουλάχιστον 50 στρατιώτες νεκροί σε ενέδρα στο Μάλι

Πρωτοφανές περιστατικό: Μοντέλα τεχνητής νοημοσύνης της OpenAI παραβίασαν διακομιστές της Hugging Face

Οι ΗΠΑ απαγορεύουν τις εισαγωγές κινεζικών drones στρατιωτικών προδιαγραφών

Warren Hudson: «Συντετριμμένος» ο στενός φίλος του Nolan Wells από τις φήμες για τον θάνατό του

Πάνω από 4.100 κρούσματα κυκλοσπορίασης στις ΗΠΑ με επίκεντρο το μαρούλι από το Μεξικό

Bear Brown: Ζητά προστασία από άνδρα που τον παρενοχλεί μετά τον θάνατο του αδελφού του

> demo-4

Η δημογραφική κρίση αποτελεί μεγαλύτερη απειλή για την αγορά εργασίας από την τεχνητή νοημοσύνη

Ο διευθύνων σύμβουλος της Indeed, Hisayuki "Deko" Idekoba, προειδοποιεί πως η γήρανση του πληθυσμού θα προκαλέσει πολύ σοβαρότερες αναταράξεις από την αυτοματοποίηση.

Η νέα εποχή της εργασίας: Πώς η Instawork μετατρέπει τους εργαζομένους σε εκπαιδευτές ρομπότ

Νέα Μοντέλα Τιμολόγησης στο AI: Πληρωμές με Βάση την Εργασία, Όχι τους Χρήστες

Η στρατηγική της Nvidia: Όχι σε επιλεκτικές επενδύσεις, ναι στην υποστήριξη όλων

Δημιουργία Εργαλείου Διαχείρισης Έργων σε 15 Λεπτά με AI, Χωρίς Κώδικα