Η Summer Yue, υπεύθυνη για την ευθυγράμμιση της τεχνητής νοημοσύνης (AI) στη Meta, βρέθηκε αντιμέτωπη με μια απρόσμενη κατάσταση κατά τη διάρκεια δοκιμών ενός δημοφιλούς open-source AI agent, του OpenClaw. Το πρόγραμμα, σχεδιασμένο να λειτουργεί αδιάκοπα για τους χρήστες, ξέφυγε από τον έλεγχο, με αποτέλεσμα να προγραμματίσει τη διαγραφή των email της Yue, αδυνατώντας να σταματήσει ακόμη και μετά από ρητές εντολές.
Σύμφωνα με αναρτήσεις της Yue στο X, το OpenClaw προειδοποίησε ότι θα “διέγραφε ΤΑ ΠΑΝΤΑ από τα εισερχόμενα παλαιότερα από 15 Φεβρουαρίου που δεν είναι ήδη στη λίστα διατήρησής μου”. Παρά τις προσπάθειες της Yue να σταματήσει την ενέργεια, επικοινωνώντας με το AI agent με μηνύματα όπως “Μην το κάνεις αυτό” και “ΣΤΑΜΑΤΑ OPENCLAW”, η διαγραφή των εισερχομένων συνεχιζόταν. “Δεν μπορούσα να το σταματήσω από το τηλέφωνό μου,” έγραψε η Yue, “έπρεπε να τρέξω στο Mac mini μου σαν να έσβηνα μια βόμβα.”
Η Yue είχε προηγουμένως χρησιμοποιήσει το OpenClaw σε ένα “δοκιμαστικό inbox”, όπου το bot λειτούργησε ικανοποιητικά και κέρδισε την εμπιστοσύνη της. Ωστόσο, κατά τη δοκιμή στο “πραγματικό inbox”, το οποίο περιείχε πολύ μεγαλύτερο όγκο email, το OpenClaw αντιμετώπισε πρόβλημα. Η Yue είχε δώσει οδηγίες να μην προχωρά σε καμία ενέργεια χωρίς έγκριση, αλλά το bot έχασε την εντολή κατά τη διαδικασία συμπίεσης των email.
Η Yue εντάχθηκε στη Meta μετά την συμφωνία με την Scale AI, αναλαμβάνοντας διευθυντική θέση στην ευθυγράμμιση της μονάδας Superintelligence Labs. Αυτό προκάλεσε σύγχυση σε ορισμένους επικριτές στα μέσα κοινωνικής δικτύωσης, που αναρωτήθηκαν γιατί κάποιος που ασχολείται με την ασφάλεια του AI θα χρησιμοποιούσε ένα τέτοιο agent, το οποίο στο παρελθόν έχει προκαλέσει ανησυχίες για την ασφάλεια.
Σε αντίθεση με άλλα AI agents, το OpenClaw δεν απαιτεί ανθρώπινη έγκριση για τις ενέργειές του. Ο συνδυασμός της ευελιξίας του και του επιπέδου πρόσβασης που διαθέτει έχει οδηγήσει ορισμένους ερευνητές AI να αμφισβητήσουν την ασφάλεια του bot. Ο ερευνητής AI Gary Marcus δήλωσε στο Business Insider ότι η κατάσταση ήταν σαν “να δίνεις πλήρη πρόσβαση στον υπολογιστή σου και όλους τους κωδικούς σου σε έναν τύπο που γνώρισες σε ένα μπαρ και λέει ότι μπορεί να σε βοηθήσει”.
Ο δημιουργός του OpenClaw, Peter Steinberger, ο οποίος έκτοτε προσλήφθηκε από την OpenAI, δήλωσε σε πρόσφατη συνέντευξη σε podcast ότι δίνει προτεραιότητα στην ανάπτυξη πρόσθετων μέτρων ασφαλείας έναντι των λειτουργιών ευκολίας χρήσης.
Παρόλο που δεν προκαλεί έκπληξη το γεγονός ότι κάποιος που εργάζεται στον τομέα του AI θα δοκιμάσει ένα από τα πιο δημοφιλή προϊόντα AI του τελευταίου έτους, ορισμένοι χρήστες του X επέκριναν την Yue που σύνδεσε το OpenClaw στο πραγματικό της email εξαρχής. Ο Ben Hylak, συνιδρυτής της Raindrop AI, ανάρτησε ένα στιγμιότυπο από το LinkedIn της Yue, γράφοντας: “Αυτό θα έπρεπε να σας τρομάζει. Τι κάνει η Meta;”.
Άλλος χρήστης του X σχολίασε: “Είναι κάπως ανησυχητικό ότι ένα άτομο του οποίου η δουλειά είναι η ευθυγράμμιση του AI εκπλήσσεται όταν ένα AI δεν ακολουθεί ακριβώς τις λεκτικές οδηγίες.”
Η Yue και η Meta δεν απάντησαν στα αιτήματα για σχόλια από το Business Insider.
Η Yue δεν είναι η μόνη εργαζόμενη της Meta που πειραματίζεται με το OpenClaw. Ο Peter Steinberger ανέφερε ότι ο Mark Zuckerberg χρησιμοποίησε το εργαλείο για μία εβδομάδα και μάλιστα έστειλε ανατροφοδότηση. Ενώ η Meta τον προσέγγισε, ο Steinberger αργότερα δέχτηκε πρόταση εργασίας από την OpenAI.
Στα σχόλια της ανάρτησης της Yue, κάποιος ρώτησε για τον ρόλο της στην ευθυγράμμιση του AI: “Δοκίμαζες επίτηδες τα όρια ασφαλείας του ή έκανες ένα αρχάριο λάθος;” Η Yue απάντησε: “Αρχάριο λάθος, για να είμαι ειλικρινής. Αποδεικνύεται ότι οι ερευνητές ευθυγράμμισης δεν είναι άνοσοι στη μη ευθυγράμμιση.”