Ένας κορυφαίος ερευνητής στην ασφάλεια της τεχνητής νοημοσύνης, ο Mrinank Sharma, παραιτήθηκε από την Anthropic, αφήνοντας μια αινιγματική προειδοποίηση για παγκόσμιες “διασυνδεδεμένες κρίσεις”. Ο Sharma, απόφοιτος του Oxford και επικεφαλής της Ομάδας Έρευνας Ασφάλειας (Safeguards Research Team) της εταιρείας που αναπτύσσει το chatbot Claude, ανακοίνωσε την απόφασή του μέσω ανάρτησης στο X (πρώην Twitter), περιγράφοντας μια αυξανόμενη προσωπική συνειδητοποίηση για “την κατάστασή μας”.
“Ο κόσμος βρίσκεται σε κίνδυνο. Και όχι μόνο από την τεχνητή νοημοσύνη, ή τα βιολογικά όπλα, αλλά από μια ολόκληρη σειρά διασυνδεδεμένων κρίσεων που εκτυλίσσονται αυτήν τη στιγμή”, έγραψε ο Sharma σε συναδέλφους του. Η αποχώρησή του έρχεται σε μια περίοδο αυξανόμενων εντάσεων γύρω από το εργαστήριο τεχνητής νοημοσύνης με έδρα το San Francisco, το οποίο ταυτόχρονα αγωνίζεται να αναπτύξει ολοένα και πιο ισχυρά συστήματα, ενώ ταυτόχρονα οι δικοί του εκτελεστικοί διευθυντές προειδοποιούν ότι οι ίδιες τεχνολογίες θα μπορούσαν να βλάψουν την ανθρωπότητα.
Η παραίτηση αυτή ακολουθεί επίσης αναφορές για ένα διευρυνόμενο χάσμα μεταξύ της Anthropic και του Πενταγώνου σχετικά με την επιθυμία του στρατού να αναπτύξει τεχνητή νοημοσύνη για αυτόματη στόχευση όπλων, χωρίς τις διασφαλίσεις που η εταιρεία επιδιώκει να επιβάλει. Η παραίτηση του Sharma, λίγες ημέρες μετά την κυκλοφορία του Opus 4.6 από την Anthropic – μια πιο ισχυρή έκδοση του βασικού εργαλείου Claude – υποδηλώνει εσωτερικές τριβές σχετικά με τις προτεραιότητες ασφαλείας.
“Καθ’ όλη τη διάρκεια της θητείας μου εδώ, έχω δει επανειλημμένα πόσο δύσκολο είναι να αφήσουμε πραγματικά τις αξίες μας να καθοδηγούν τις πράξεις μας”, έγραψε. “Το έχω δει μέσα μου, μέσα στον οργανισμό, όπου αντιμετωπίζουμε συνεχώς πιέσεις να παραμερίσουμε αυτό που έχει τη μεγαλύτερη σημασία, και σε ολόκληρη την ευρύτερη κοινωνία επίσης.” Η ομάδα του ερευνητή είχε συσταθεί πριν από λίγο περισσότερο από ένα χρόνο με αποστολή να αντιμετωπίσει απειλές ασφαλείας της τεχνητής νοημοσύνης, συμπεριλαμβανομένης της “κακής χρήσης και μη ευθυγράμμισης μοντέλων”, της πρόληψης βιοτρομοκρατίας και της “πρόληψης καταστροφών”. Ο Sharma σημείωσε με περηφάνια την εργασία του στην ανάπτυξη άμυνας κατά βιο-όπλων που υποβοηθούνται από την τεχνητή νοημοσύνη και το “τελικό του έργο για την κατανόηση του πώς οι βοηθοί τεχνητής νοημοσύνης θα μπορούσαν να μας κάνουν λιγότερο ανθρώπινους ή να διαστρεβλώσουν την ανθρωπιά μας”.
Τώρα προτίθεται να επιστρέψει στο Ηνωμένο Βασίλειο για να “εξερευνήσει ένα πτυχίο ποίησης” και να “γίνει αόρατος για ένα διάστημα”. Ο διευθύνων σύμβουλος της Anthropic, Dario Amodei, έχει προειδοποιήσει επανειλημμένα για τους κινδύνους που ενέχουν οι τεχνολογίες που εμπορεύεται η εταιρεία του. Σε ένα δοκίμιο σχεδόν 20.000 λέξεων τον περασμένο μήνα, προειδοποίησε ότι τα συστήματα τεχνητής νοημοσύνης “σχεδόν αδιανόητης ισχύος” είναι “επερχόμενα” και θα “δοκιμάσουν ποιοι είμαστε ως είδος”. Ο Amodei προειδοποίησε για “κινδύνους αυτονομίας” όπου η τεχνητή νοημοσύνη θα μπορούσε “να εκτροχιαστεί και να υπερνικήσει την ανθρωπότητα”, και υπέδειξε ότι η τεχνολογία θα μπορούσε να επιτρέψει “μια παγκόσμια ολοκληρωτική δικτατορία” μέσω επιτήρησης που υποβοηθάται από την τεχνητή νοημοσύνη και αυτόνομων όπλων.