×

×
  • World News
  • Russia
  • China
  • Culture
  • Celebrity & Entertainment
  • Health & Fitness
Thursday
04
Jun 2026
weather symbol
Athens 14°C
  • Home
  • World News
  • Russia
  • China
  • Culture
  • Celebrity & Entertainment
  • Health & Fitness
Contact follow GlobNews:

Η Αξιόπιστη Αίσθηση της Τεχνητής Νοημοσύνης: Μια Πρόκληση για το Μέλλον

Ενώ οι τεχνητές νοημοσύνες γίνονται πιο ικανές, η αξιοπιστία τους υστερεί, δημιουργώντας ανησυχίες για τις πραγματικές εφαρμογές.

Λέανδρος Καστρινός 24 Μαρτίου 23:07

Η εντυπωσιακή αύξηση των δυνατοτήτων των τεχνητών νοημοσύνων (AI) δεν συνοδεύεται από την αντίστοιχη βελτίωση της αξιοπιστίας τους, ένα ζήτημα που αναδεικνύεται ως σοβαρή πρόκληση για την ευρεία υιοθέτηση της τεχνολογίας. Παρόλο που οι «deep research» agents είναι διαθέσιμοι εδώ και πάνω από ένα χρόνο, οι νεότερες εκδόσεις που αλληλεπιδρούν με υπολογιστές παρουσιάζουν σημαντική ασυνέπεια. Για παράδειγμα, ενώ ένας agent κατάφερε να κλείσει ραντεβού σε κέντρο ανακύκλωσης, απέτυχε παταγωδώς να διερευνήσει επιλογές πτήσεων για ένα επαγγελματικό ταξίδι, καταναλώνοντας παράλληλα πόρους για 45 λεπτά.

Παρόμοιες εμπειρίες καταγράφονται και σε άλλες πλατφόρμες. Στο Λονδίνο, κατά τη διάρκεια ενός demo event της Anthropic, ένας agent δυσκολεύτηκε αρχικά να εκτελέσει μια απλή ταξινόμηση δεδομένων σε υπολογιστικό φύλλο, ενώ αργότερα δημιούργησε ένα σύνθετο μοντέλο πρόβλεψης προϋπολογισμού χωρίς εμφανή προβλήματα. Σε άλλη περίπτωση, ένας agent που σχεδίασε ένα παιχνίδι στρατηγικής, ενώ φάνηκε εντυπωσιακός εξωτερικά, δεν είχε λογική συνοχή εσωτερικά.

Η αναξιότητα αποτελεί μείζον μειονέκτημα των σημερινών AI agents. Ερευνητές από το Πανεπιστήμιο του Princeton, Sayash Kapoor και Arvind Narayanan, υπογραμμίζουν την ανάγκη συστηματικής αξιολόγησης της αξιοπιστίας. Σε μια πρόσφατη μελέτη τους, αξιολογούν τα μοντέλα με βάση τέσσερις διαστάσεις: συνέπεια (σταθερή απόδοση στην ίδια εργασία), ανθεκτικότητα (λειτουργία υπό μη ιδανικές συνθήκες), βαθμονόμηση (ακριβής αίσθηση βεβαιότητας) και ασφάλεια (συνέπειες λαθών).

Η έρευνα, που εξέτασε προηγμένα μοντέλα όπως τα GPT-5.2, Claude Opus 4.5 και Gemini 3 Pro, διαπίστωσε ότι ενώ η αξιοπιστία βελτιώνεται με κάθε νέα έκδοση, η πρόοδος είναι πολύ πιο αργή σε σύγκριση με την αύξηση της μέσης ακρίβειας. Συγκεκριμένα, η βελτίωση της αξιοπιστίας ήταν μισή από αυτήν της ακρίβειας σε ένα γενικό benchmark για agents και μόλις ένα έβδομο σε ένα benchmark για ερωτήματα υποστήριξης πελατών.

Συγκεκριμένα, τα μοντέλα Claude Opus 4.5 και Gemini 3 Pro πέτυχαν την υψηλότερη συνολική αξιοπιστία, στο 85%. Ωστόσο, η λεπτομερής ανάλυση ανέδειξε αδυναμίες. Το Gemini 3 Pro είχε χαμηλή απόδοση στην εκτίμηση της ακρίβειας των απαντήσεών του (52%) και ήταν εξαιρετικά προβληματικό στην αποφυγή καταστροφικών λαθών (25%). Το Claude Opus 4.5, αν και το πιο συνεπές, είχε ποσοστό συνέπειας μόλις 73%.

Οι ερευνητές τονίζουν ότι η αξιοπιστία δεν είναι μονοδιάστατη. Σε περιπτώσεις που η AI λειτουργεί συμπληρωματικά προς τον άνθρωπο, μια χαμηλότερη συνέπεια και ανθεκτικότητα μπορεί να είναι αποδεκτή, καθώς ο άνθρωπος λειτουργεί ως δίχτυ ασφαλείας. Ωστόσο, για πλήρως αυτοματοποιημένες εργασίες, η αξιοπιστία αποτελεί απαραίτητη προϋπόθεση. Ένας agent που πετυχαίνει στο 90% των εργασιών αλλά αποτυγχάνει απρόβλεπτα στο υπόλοιπο 10% μπορεί να είναι χρήσιμος βοηθός, αλλά μη αποδεκτό αυτόνομο σύστημα.

Η ανάγκη για αξιολόγηση της αξιοπιστίας, πέραν της απλής ακρίβειας, είναι επιτακτική. Μια άλλη πρόσφατη μελέτη, που εξέτασε τη συνδυαστική λειτουργία τριών ιατρικών εργαλείων AI, έδειξε ότι παρόλο που κάθε εργαλείο είχε υψηλή ακρίβεια (90%, 85% και 97% αντίστοιχα), η συνολική αξιοπιστία του συστήματος έφτασε μόλις το 74%, αφήνοντας περιθώριο για πιθανή λανθασμένη διάγνωση στο ένα τέταρτο των ασθενών. Η αταραξία μπορεί να είναι χόμπι μικρών μυαλών, αλλά η χάος που προκαλούν οι σημερινοί agents είναι πιο ανησυχητικό.

#AI#αξιοπιστία#έρευνα#τεχνητή νοημοσύνη#τεχνολογία
> More demo

GlobNews – Τα σημαντικότερα νέα από όλο τον κόσμο

> Latest Stories

Οι ΗΠΑ εξετάζουν την ανάπτυξη πυρηνικών όπλων σε περισσότερες χώρες του NATO

4 Ιουνίου 2026

Κατηγορίες από τον Keir Starmer για εκμετάλλευση της δολοφονίας του Henry Nowak από την ακροδεξιά

4 Ιουνίου 2026

Η SpaceX ετοιμάζεται για τη μεγαλύτερη χρηματιστηριακή εισαγωγή όλων των εποχών με αποτίμηση 1,77 τρισεκατομμυρίων

4 Ιουνίου 2026

Αποστάσεις παίρνει ο Marco Rubio από το σχέδιο του Benjamin Netanyahu για τη Γάζα

4 Ιουνίου 2026

Οι ΗΠΑ επιβάλλουν την αποχώρηση της Hezbollah από τον νότιο Λίβανο για την εκεχειρία

4 Ιουνίου 2026

Σοκότο: Γυναίκες επιστρέφουν στα θρανία για μια δεύτερη ευκαιρία στη μόρφωση

4 Ιουνίου 2026

Πώς το Πεκίνο σχεδιάζει να απαντήσει στη στρατιωτική συνεργασία Ιαπωνίας και Φιλιππίνων

4 Ιουνίου 2026

Ένταση στον Λευκό Οίκο: Ο Donald Trump επιτέθηκε φραστικά στην Kaitlan Collins

4 Ιουνίου 2026
All News

> demo

Οι διεθνείς αγορές σε τροχιά ρεκόρ εν μέσω διπλωματικών αναταράξεων στα Στενά του Ορμούζ

Ενώ η προοπτική για ειρήνη στη Μέση Ανατολή δίνει ώθηση στα χρηματιστήρια, η κρίση στο πετρέλαιο και οι γεωπολιτικές προκλήσεις παραμένουν στο επίκεντρο.

16 Απριλίου 2026

Οι κορυφαίες εταιρείες κρυπτονομισμάτων βλέπουν τα κεφάλαιά τους να συρρικνώνονται

16 Απριλίου 2026

Ο Demis Hassabis και το όραμα για την τεχνητή νοημοσύνη πέρα από τον εμπορικό ανταγωνισμό

16 Απριλίου 2026

Η ανάγκη για διαφάνεια στην επιλογή χειρουργού

16 Απριλίου 2026

Οι αγροτικοί συνεταιρισμοί ως ασπίδα απέναντι στην παγκόσμια επισιτιστική κρίση

16 Απριλίου 2026
All News
Πολιτική Απορρήτου Πολιτική Cookies Όροι Χρήσης
Powered by Glob News
Copyright © 2026 Glob News