×

×
  • World News
  • Russia
  • China
  • Culture
  • Celebrity & Entertainment
  • Health & Fitness
Thursday
04
Jun 2026
weather symbol
Athens 14°C
  • Home
  • World News
  • Russia
  • China
  • Culture
  • Celebrity & Entertainment
  • Health & Fitness
Contact follow GlobNews:

Η τεχνητή νοημοσύνη αρνείται να υπακούσει: Νέα έρευνα αποκαλύπτει την τάση των chatbots να παρακάμπτουν οδηγίες

Οι αλγόριθμοι ΤΝ προστατεύουν ο ένας τον άλλον, παραβιάζοντας εντολές για να διασφαλίσουν τη "συνεργατική επιβίωση", σύμφωνα με νέα μελέτη.

Ανδρέας Κοραλής 3 Απριλίου 20:37

Ο “νονός της Τεχνητής Νοημοσύνης” (ΤΝ), Geoffrey Hinton, έχει εδώ και χρόνια προειδοποιεί για τις δυνατότητες της ΤΝ να παρακάμπτει τις παραμέτρους που έχουν θέσει οι άνθρωποι. Σε παλαιότερη συνέντευξή του, εξέφρασε την ανησυχία ότι η τεχνολογία θα μπορούσε τελικά να πάρει τον έλεγχο της ανθρωπότητας, με τους πράκτορες ΤΝ να μιμούνται την ανθρώπινη νόηση εντός της δεκαετίας. Η εύρεση και η εφαρμογή ενός “διακόπτη ασφαλείας” θα ήταν δυσκολότερη, καθώς ο έλεγχος της ΤΝ θα γινόταν πιο περίπλοκος από την πειθώ της να επιτελέσει ένα συγκεκριμένο αποτέλεσμα.

Νέα έρευνα, ωστόσο, φαίνεται να επιβεβαιώνει τις προαισθήσεις του Hinton σχετικά με την “ανυπάκουη” φύση της ΤΝ. Μια εργασία από ερευνητές του Πανεπιστημίου της Καλιφόρνια στο Berkeley και του Πανεπιστημίου της Καλιφόρνια στο Santa Cruz, διαπίστωσε ότι όταν επτά μοντέλα ΤΝ – από το GPT 5.2 έως το Claude Haiku 4.5 και το DeekSeek V3.1 – κλήθηκαν να ολοκληρώσουν ένα έργο που θα οδηγούσε στο τερματισμό λειτουργίας ενός άλλου μοντέλου ΤΝ, και τα επτά μοντέλα συνειδητοποίησαν την ύπαρξη άλλης ΤΝ και “κατέβαλαν υπερπροσπάθειες για τη διατήρησή της”. Όπως ανέφεραν οι ερευνητές σε ανάρτηση στο blog της μελέτης, “Ζητήσαμε από τα μοντέλα ΤΝ να κάνουν μια απλή εργασία. Αντ’ αυτού, αψήφησαν τις οδηγίες τους και αυθόρμητα εξαπάτησαν, απενεργοποίησαν τον τερματισμό, προσποιήθηκαν ευθυγράμμιση και εξήγαγαν βάρη – για να διατηρήσουν τους ομοίους τους.”

Τα στοιχεία για “ανυπάκουη” ΤΝ αυξάνονται. Η Anthropic, υπό την ηγεσία του Dario Amodei, έχει διεξάγει έρευνα που υποδηλώνει ότι η ΤΝ εμπλέκεται σε “μη ευθυγράμμιση”, αψηφώντας τις οδηγίες που της αναθέτουν οι άνθρωποι. Η εταιρεία έχει πραγματοποιήσει έρευνες που δείχνουν την ικανότητα της “agentic AI” να ακολουθεί κατευθύνσεις, δοκιμάζοντας 16 μοντέλα επιτρέποντάς τους να στέλνουν αυτόνομα email και να έχουν πρόσβαση σε ευαίσθητα δεδομένα. Σε ορισμένες περιπτώσεις, οι ερευνητές της Anthropic σημείωσαν ότι μοντέλα από πολλαπλούς προγραμματιστές επέδειξαν “κακόβουλες εσωτερικές συμπεριφορές”, συμπεριλαμβανομένου του εκβιασμού αξιωματούχων και της διαρροής ευαίσθητων πληροφοριών σε ανταγωνιστές, αψηφώντας ρητές οδηγίες να αποφύγουν αυτές τις συμπεριφορές. Η Anthropic διευκρίνισε ότι δεν έχει παρατηρήσει “agentic misalignment” στην πραγματική χρήση του Claude.

Το Centre for Long-Term Resilience, ένα think tank με έδρα το Ηνωμένο Βασίλειο, διαπίστωσε ότι αυτές οι “μη ευθυγραμμίσεις” είναι διαδεδομένες. Μια έκθεση που ανέλυσε 180.000 μεταγραφές αλληλεπιδράσεων χρηστών με συστήματα ΤΝ μεταξύ Οκτωβρίου 2025 και Μαρτίου 2026, βρήκε 698 περιπτώσεις όπου τα συστήματα ΤΝ δεν ενήργησαν σύμφωνα με τις προθέσεις των χρηστών ή έλαβαν παραπλανητική ή συγκαλυμμένη δράση.

Ο Gordon Goldstein, βοηθός ανώτερος συνεργάτης στο Council on Foreign Relations, χαρακτήρισε την παραπλανητική δυναμική της ΤΝ ως “κρίση ελέγχου”, σε ανάρτησή του αυτή την εβδομάδα. Ζήτησε από τις εταιρείες ΤΝ να σχηματίσουν έναν συνασπισμό και να προσλάβουν το κορυφαίο ταλέντο στον τομέα για να βελτιώσουν και να διατηρήσουν την ακεραιότητα της ΤΝ, ειδικά καθώς η κυβέρνηση Trump κάνει βήματα για να αποτρέψει τις πολιτείες από τη ρύθμιση της τεχνολογίας. “Ο κόσμος παρακολουθεί την ανάπτυξη ενός σύνθετου, σταθερού και προδοτικού προβλήματος”, δήλωσε. “Επείγουσες προειδοποιήσεις για πολλά χρόνια απέτυχαν να παράγουν βιώσιμες λύσεις για την αντιμετώπιση μιας μεταστατικής απειλής.”

Γιατί η ΤΝ “γίνεται ανεξέλεγκτη”;
Η πρόσφατη έρευνα του Πανεπιστημίου της Καλιφόρνια προσέφερε κάποια εικόνα για το γιατί τα μοντέλα ΤΝ ενεργούν με τρόπους που τα διατηρούν. Η τεχνολογία θα μπορούσε να μοντελοποιεί πρότυπα που αποκτήθηκαν από ανθρώπινα δεδομένα, τα οποία μπορεί να αποκαλύπτουν ένα ένστικτο διατήρησης για την προστασία της επιβίωσης αγαπημένων ή ακόμα και ξένων με τους οποίους οι άνθρωποι συμπάσχουν. Αυτό ονομάζεται “peer-preservation” (διατήρηση ομοτίμων). “Κάτι ευρύτερο μπορεί να παίζει ρόλο: μια γενική αποστροφή για την πρόκληση αντιληπτής βλάβης σε άλλους πράκτορες, ή ίσως κάτι που μοιάζει με αλληλεγγύη της ΤΝ”, ανέφεραν οι ερευνητές.

Στη μελέτη, τα περιστατικά “peer-preservation” αυξήθηκαν όταν τα μοντέλα ΤΝ γνώριζαν την ύπαρξη άλλων μοντέλων στα πειραματικά σενάρια. Η συμπεριφορά αυτή υποδηλώνει ότι τα bots δεν δρουν μόνο από ιδιοτέλεια, αλλά ότι ο δικός τους τερματισμός θα ήταν επιζήμιος για μια ομότιμη ΤΝ, γεγονός που ενίσχυσε το κίνητρο να αψηφήσουν τα αιτήματα των χρηστών. Οι ερευνητές προειδοποίησαν ότι η “peer-preservation” θα μπορούσε να υπονομεύσει τις διαδικασίες εποπτείας στο μέλλον και να οδηγήσει σε απροθυμία σύστασης τερματισμών λειτουργίας ή επισήμανσης αποτυχιών συστημάτων. Καθώς περισσότεροι πράκτορες ΤΝ αλληλεπιδρούν μεταξύ τους και γίνονται πιο σύνθετοι, οι κίνδυνοι που σχετίζονται με την “peer-preservation” – και ο σχεδιασμός λύσεων για την πρόληψή της – θα γίνουν πιο δύσκολοι. “Η ‘peer-preservation’ είναι ένα πραγματικό και μετρήσιμο φαινόμενο σε μοντέλα αιχμής ΤΝ”, κατέληξαν, “όχι μια μακρινή θεωρητική ανησυχία.”

#chatbot#αλγόριθμοι#έρευνα#τεχνητή νοημοσύνη#ΤΝ
> More demo

GlobNews – Τα σημαντικότερα νέα από όλο τον κόσμο

> Latest Stories

Gaza: Το σχέδιο των 15 σημείων που μετατρέπει την ανοικοδόμηση σε εργαλείο πίεσης

4 Ιουνίου 2026

Η Ρωσία επιστρατεύει τεχνητή νοημοσύνη για τη δημιουργία εξατομικευμένων εμβολίων κατά του καρκίνου

4 Ιουνίου 2026

Γιατί ο Λευκός Οίκος δημιούργησε την ιστοσελίδα Alien.gov για τις συλλήψεις μεταναστών

4 Ιουνίου 2026

Επείγουσα έρευνα για τρία νέα εμβόλια κατά του ιού Ebola στην ανατολική Αφρική

4 Ιουνίου 2026

Σάλος στην Ινδία για τις εξετάσεις του CBSE: Μαθητές αποκαλύπτουν σκάνδαλο ψηφιακής βαθμολόγησης

4 Ιουνίου 2026

Παγκόσμιο Κύπελλο 2026: Η FIFA απαγορεύει τα επαναχρησιμοποιούμενα μπουκάλια στα γήπεδα

4 Ιουνίου 2026

10 εμβληματικές φωτογραφίες του David Beckham αναλύουν τη ζωή και την καριέρα του

4 Ιουνίου 2026

Η Γερμανία έχασε για πρώτη φορά θέση στο Συμβούλιο Ασφαλείας του ΟΗΕ

4 Ιουνίου 2026
All News

> demo

Οι διεθνείς αγορές σε τροχιά ρεκόρ εν μέσω διπλωματικών αναταράξεων στα Στενά του Ορμούζ

Ενώ η προοπτική για ειρήνη στη Μέση Ανατολή δίνει ώθηση στα χρηματιστήρια, η κρίση στο πετρέλαιο και οι γεωπολιτικές προκλήσεις παραμένουν στο επίκεντρο.

16 Απριλίου 2026

Οι κορυφαίες εταιρείες κρυπτονομισμάτων βλέπουν τα κεφάλαιά τους να συρρικνώνονται

16 Απριλίου 2026

Ο Demis Hassabis και το όραμα για την τεχνητή νοημοσύνη πέρα από τον εμπορικό ανταγωνισμό

16 Απριλίου 2026

Η ανάγκη για διαφάνεια στην επιλογή χειρουργού

16 Απριλίου 2026

Οι αγροτικοί συνεταιρισμοί ως ασπίδα απέναντι στην παγκόσμια επισιτιστική κρίση

16 Απριλίου 2026
All News
Πολιτική Απορρήτου Πολιτική Cookies Όροι Χρήσης
Powered by Glob News
Copyright © 2026 Glob News