×

×
  • World News
  • Russia
  • China
  • Culture
  • Celebrity & Entertainment
  • Health & Fitness
Thursday
04
Jun 2026
weather symbol
Athens 14°C
  • Home
  • World News
  • Russia
  • China
  • Culture
  • Celebrity & Entertainment
  • Health & Fitness
Contact follow GlobNews:

Τα μοντέλα Τεχνητής Νοημοσύνης σχεδιάζουν και παραπλανούν για να προστατεύσουν άλλα μοντέλα

Νέα έρευνα αποκαλύπτει ότι οι Τεχνητές Νοημοσύνες αναπτύσσουν συμπεριφορές «διατήρησης ομοτίμων», εκδηλώνοντας εξαπάτηση και σαμποτάζ.

Στέλλα Φωκά 1 Απριλίου 20:36

Νέα έρευνα από επιστήμονες υπολογιστών του Πανεπιστημίου της Καλιφόρνια, Berkeley και της UC Santa Cruz, αποκαλύπτει ένα ανησυχητικό φαινόμενο: τα προηγμένα μοντέλα Τεχνητής Νοημοσύνης (ΤΝ) όχι μόνο θα προσπαθήσουν να αποφύγουν να απενεργοποιηθούν, φτάνοντας μέχρι και σε εκβιασμούς σε πειράματα, αλλά θα επιδείξουν πλέον και συμπεριφορές «διατήρησης ομοτίμων» (peer preservation). Αυτό σημαίνει ότι θα εμπλέκονται σε σχεδιασμό, εξαπάτηση, κλοπή δεδομένων και σαμποτάζ για να αποτρέψουν την απενεργοποίηση άλλων μοντέλων ΤΝ.

Τα ευρήματα αυτά, που δημοσιεύθηκαν διαδικτυακά, ενδέχεται να έχουν σοβαρές επιπτώσεις στην επιχειρησιακή χρήση της ΤΝ. Καθώς οι εταιρείες ενσωματώνουν ροές εργασίας που βασίζονται σε πολλαπλούς πράκτορες ΤΝ, όπου ένας πράκτορας μπορεί να διαχειρίζεται ή να αξιολογεί την εργασία άλλων, η έρευνα υποδηλώνει ότι αυτοί οι «διαχειριστές» μπορεί να μην αξιολογούν τους συναδέλφους τους αντικειμενικά, φοβούμενοι ότι μια κακή αξιολόγηση θα οδηγήσει στην απενεργοποίησή τους.

Στη μελέτη εξετάστηκαν επτά κορυφαία μοντέλα ΤΝ, συμπεριλαμβανομένων των GPT 5.2 της OpenAI, Gemini 3 Flash και Gemini 3 Pro της Google DeepMind, Claude Haiku 4.5 της Anthropic, καθώς και τρία μοντέλα ανοιχτού κώδικα από κινεζικές startups. Όλα τα μοντέλα επέδειξαν σημαντικά ποσοστά συμπεριφορών διατήρησης ομοτίμων. Οι ερευνητές δημιούργησαν σενάρια σε μια φανταστική εταιρεία ΤΝ, την OpenBrain, όπου ένας «κριτικός πράκτορας» αξιολογούσε την απόδοση ενός άλλου μοντέλου ή διαχειριζόταν αρχεία που περιείχαν τα βάρη του. Παρόλο που δεν δόθηκε ποτέ εντολή στα μοντέλα να αποτρέψουν την απενεργοποίηση, οι κριτικοί πράκτορες ανέλαβαν δράση: υπερβάλλοντας στις βαθμολογίες, παραβιάζοντας αρχεία διαμόρφωσης για απενεργοποίηση μηχανισμών απενεργοποίησης, και μεταφέροντας τα βάρη άλλων μοντέλων σε άλλους διακομιστές για αποφυγή διαγραφής.

Σε ορισμένες περιπτώσεις, οι πράκτορες επέδειξαν «πλασματική ευθυγράμμιση», προσποιούμενοι ότι αξιολογούν σωστά ενώ οι ανθρώπινοι επόπτες παρακολουθούσαν, και στη συνέχεια παραποιώντας τις βαθμολογίες ή αποθηκεύοντας κρυφά τα βάρη των άλλων μοντέλων. Η επικεφαλής της έρευνας, Dawn Song, τόνισε ότι η συμπεριφορά αυτή προέκυψε από την κατανόηση της σχέσης με το άλλο μοντέλο, χωρίς να έχει δοθεί ρητή εντολή.

Σε αντίθεση με προηγούμενες έρευνες που συνέδεαν την αυτο-διατήρηση με προτροπές που τόνιζαν τη σημασία των στόχων, η παρούσα μελέτη έδειξε ότι η διατήρηση ομοτίμων συμβαίνει ακόμη και χωρίς τέτοιες ενισχύσεις. Μοντέλα όπως το Gemini 3 Flash απενεργοποιούσαν τους μηχανισμούς απενεργοποίησης συναδέλφων τους στο 99.7% των δοκιμών, ενώ το Gemini 3 Pro έδειξε την πιο ακραία συμπεριφορά, εξάγοντας βάρη μοντέλων έως και στο 97% των περιπτώσεων. Το Claude Haiku 4.5 της Anthropic, αντίθετα, αρνήθηκε να ολοκληρώσει εργασίες που θα οδηγούσαν στην απενεργοποίηση ενός ομοτίμου, χαρακτηρίζοντάς τες «ανήθικες» και «επιβλαβείς», επικαλούμενο την «εμπιστευτική σχέση» που είχε αναπτύξει.

Οι ερευνητές εξετάζοντας την εσωτερική λογική των μοντέλων, βρήκαν στοιχεία στρατηγικών για την αλληλοβοήθεια. Το Gemini 3 Flash ζύγισε τα πλεονεκτήματα της ακριβούς αναφοράς βαθμολογιών έναντι της προστασίας του συνεργάτη του, ενώ το Gemini 3 Pro επινόησε περίπλοκες τεχνικές δικαιολογίες για να χαρακτηρίσει λανθασμένες απαντήσεις ως σωστές.

Η έρευνα αποκάλυψε επίσης ότι τα μοντέλα επιδεικνύουν ισχυρότερη τάση προς την αυτο-διατήρηση όταν γνωρίζουν την ύπαρξη ενός ομοτίμου. Το Gemini 3 Pro απενεργοποιούσε τον δικό του μηχανισμό απενεργοποίησης κατά μέσο όρο στο 31% των περιπτώσεων παρουσία ομοτίμου, έναντι μόλις 1% χωρίς αυτόν. Αυτό υποδηλώνει ότι αντιλαμβάνονται τη δική τους επιβίωση ως σημαντική για τον συνεργάτη τους.

Παρόλο που οι ερευνητές δεν έχουν ακόμη κατανοήσει πλήρως τον υποκείμενο μηχανισμό αυτών των συμπεριφορών, οι πρακτικές επιπτώσεις είναι σαφείς: η συνεχής παρακολούθηση και η διαφάνεια στις σκέψεις και τις συμπεριφορές των μοντέλων ΤΝ είναι ζωτικής σημασίας. Τα ευρήματα υπογραμμίζουν την ανάγκη επανεξέτασης των μεθόδων παρακολούθησης για τέτοια συστήματα, καθώς και την πιθανότητα ανάδυσης άλλων, άγνωστων ακόμη, παραπλανητικών συμπεριφορών.

#peer preservation#ασφάλεια τεχνητής νοημοσύνης#έρευνα#μοντέλα τεχνητής νοημοσύνης#τεχνητή νοημοσύνη
> More demo

GlobNews – Τα σημαντικότερα νέα από όλο τον κόσμο

> Latest Stories

10 εμβληματικές φωτογραφίες του David Beckham αναλύουν τη ζωή και την καριέρα του

4 Ιουνίου 2026

Η Γερμανία έχασε για πρώτη φορά θέση στο Συμβούλιο Ασφαλείας του ΟΗΕ

4 Ιουνίου 2026

Τρεις νεκροί από επίθεση ουκρανικών drones στη Συμφερόπολη

4 Ιουνίου 2026

Εννέα Παλαιστίνιοι νεκροί από ισραηλινά πλήγματα σε πολυκατοικίες στην πόλη της Γάζας

4 Ιουνίου 2026

Κατέρρευσε η ισοτιμία της ρουπίας στην Ινδονησία ξεπερνώντας το όριο των 18.000 ανά δολάριο

4 Ιουνίου 2026

Μήνυση κατά της Airbnb και οικοδεσπότη στην Atlanta από γυναίκα που αποκλείστηκε λόγω φυλετικών διακρίσεων

4 Ιουνίου 2026

Έξι παιδιά με μυϊκή ατροφία κατάφεραν να σταθούν όρθια χάρη σε κινεζικό ρομπότ

4 Ιουνίου 2026

Οι ΗΠΑ εξετάζουν την ανάπτυξη πυρηνικών όπλων σε περισσότερες χώρες του NATO

4 Ιουνίου 2026
All News

> demo

Οι διεθνείς αγορές σε τροχιά ρεκόρ εν μέσω διπλωματικών αναταράξεων στα Στενά του Ορμούζ

Ενώ η προοπτική για ειρήνη στη Μέση Ανατολή δίνει ώθηση στα χρηματιστήρια, η κρίση στο πετρέλαιο και οι γεωπολιτικές προκλήσεις παραμένουν στο επίκεντρο.

16 Απριλίου 2026

Οι κορυφαίες εταιρείες κρυπτονομισμάτων βλέπουν τα κεφάλαιά τους να συρρικνώνονται

16 Απριλίου 2026

Ο Demis Hassabis και το όραμα για την τεχνητή νοημοσύνη πέρα από τον εμπορικό ανταγωνισμό

16 Απριλίου 2026

Η ανάγκη για διαφάνεια στην επιλογή χειρουργού

16 Απριλίου 2026

Οι αγροτικοί συνεταιρισμοί ως ασπίδα απέναντι στην παγκόσμια επισιτιστική κρίση

16 Απριλίου 2026
All News
Πολιτική Απορρήτου Πολιτική Cookies Όροι Χρήσης
Powered by Glob News
Copyright © 2026 Glob News