Η απειλή των θέσεων εργασίας από την τεχνητή νοημοσύνη (ΤΝ) μπορεί τελικά να αποδειχθεί μια σταδιακή διαδικασία και όχι μια αιφνίδια ανατροπή. Παρόλο που οι εργαζόμενοι που έχουν πειραματιστεί με την ΤΝ στην καθημερινή τους εργασία ενδέχεται να αισθάνονται ανασφάλεια για το μέλλον, νέα δεδομένα από το MIT υποδηλώνουν ότι η τεχνολογία, παρά τις βελτιώσεις της, εξακολουθεί να αγγίζει μόνο χαμηλούς στόχους σε συγκεκριμένες εργασιακές διαδικασίες, ενώ παράλληλα μπορεί να κάνει σημαντικά λάθη.
Η έρευνα του MIT, που παρουσιάστηκε πρόσφατα, προσφέρει μια διαφορετική οπτική για την αυτοματοποίηση των θέσεων εργασίας. Αντί για μια γρήγορη δράση, η εικόνα που προκύπτει είναι αυτή ενός αργού, στοχαστικού κειμένου. Η ΤΝ βελτιώνεται σταδιακά στην ολοκλήρωση ποικίλων εργασιών σε διάφορους τομείς. Ωστόσο, η απόδοσή της στα περισσότερα σενάρια παρομοιάζεται με αυτή ενός απογοητευμένου ασκούμενου – εκπληρώνει τους ελάχιστους κανόνες, αλλά δυσκολεύεται να παράγει ποιοτικό αποτέλεσμα χωρίς ανθρώπινη παρέμβαση για βελτίωση.
Ερευνητές του MIT χρησιμοποίησαν 41 διαφορετικά μεγάλα γλωσσικά μοντέλα (LLMs), συμπεριλαμβανομένων εκδόσεων των Claude, Gemini και ChatGPT, για να αναλύσουν την απόδοση σε πάνω από 11.000 εργασίες, κυρίως βασισμένες σε κείμενο, για διάφορες επαγγελματικές θέσεις που έχουν καταγραφεί από το Υπουργείο Εργασίας. Οι παραγόμενες απαντήσεις βαθμολογήθηκαν από ανθρώπους με πραγματική εργασιακή εμπειρία στους αντίστοιχους τομείς. Ο στόχος ήταν να διαπιστωθεί πόσο συχνά ένας αντικαταστάτης ΤΝ θα μπορούσε να παράγει ένα αποδεκτό από έναν διευθυντή αποτέλεσμα χωρίς καμία ανθρώπινη επεξεργασία, και στη συνέχεια να αξιολογηθεί η ποιότητά του.
Οι ερευνητές διαπίστωσαν ότι η ΤΝ έχει γίνει πιο αξιόπιστη με την πάροδο των ετών για πολλούς τύπους εργασίας, αλλά εξακολουθεί να υστερεί όταν οι απαιτήσεις ή τα πρότυπα αυξάνονται. Η μελέτη του MIT χρησιμοποίησε μια κλίμακα βαθμολόγησης 1-9, όπου το 7 ορίστηκε ως “ελάχιστα επαρκές”, δηλαδή το έργο είναι χρήσιμο ως έχει και δεν απαιτεί επεξεργασία. Στα τέλη του 2025, τα μοντέλα ΤΝ πέτυχαν βαθμολογία 7 περίπου στο 65% των εργασιών.
Το πιο σημαντικό για τις εταιρείες που εξετάζουν το ενδεχόμενο αντικατάστασης μέρους του εργατικού δυναμικού τους με ΤΝ, είναι ότι τα δεδομένα του MIT υποδηλώνουν ότι η ΤΝ δυσκολεύεται να εκτελέσει πιο σύνθετες εργασίες. Ανεξάρτητα από τον χρόνο που είχε ένα μοντέλο ΤΝ για να ολοκληρώσει μια εργασία, η πιθανότητα επιτυχίας, όταν βαθμολογείται με ένα 9 ή “ανώτερη” ποιότητα, δεν ξεπέρασε ποτέ το 50%. Με άλλα λόγια, όταν μια εργασία απαιτεί πολλαπλά βήματα, δημιουργικότητα ή ακρίβεια, οι αντικαταστάτες ΤΝ είναι πιο πιθανό να αποτύχουν παρά να πετύχουν.
Αυτή η έρευνα ευθυγραμμίζεται με ορισμένες πτυχές της τρέχουσας αφήγησης υιοθέτησης της ΤΝ στην εταιρική Αμερική. Οι εταιρείες που χρησιμοποιούν ΤΝ τείνουν να αυτοματοποιούν επαναλαμβανόμενες εργασίες και θέσεις που παλαιότερα προορίζονταν για εισαρχικές βαθμίδες, ενώ κάποιες εξειδικευμένες δεξιότητες, ιδιαίτερα οι ψηφιακές, έχουν στην πραγματικότητα συνδεθεί με “μισθολογικά πριμ” (wage premiums). Αυτό αντικατοπτρίστηκε και στα δεδομένα του MIT, τα οποία έδειξαν χαμηλότερα μέσοι όροι επιτυχίας για εξειδικευμένους ρόλους σε νομικές και IT θέσεις, ενώ τα μοντέλα ΤΝ γενικά αντιμετώπιζαν ευκολότερα τις εργασίες που βασίζονταν σε κείμενο και σχετίζονταν με επαγγέλματα κατασκευών και συντήρησης.
Οι εταιρείες που έχουν πειραματιστεί με την πλήρη αυτοματοποίηση ορισμένων τμημάτων της εργασίας τους έχουν αντιμετωπίσει δυσκολίες. Πέρυσι, η Deloitte δημοσίευσε δύο εκθέσεις για κυβερνητικούς πελάτες στην Αυστραλία και τον Καναδά, οι οποίες περιείχαν ανακρίβειες. Μέσα ενημέρωσης, όπως το CNET και το Sports Illustrated, έχουν επίσης εντοπιστεί να χρησιμοποιούν ΤΝ για τη δημιουργία ανακριβών ιστοριών κάτω από ψεύτικα ονόματα. Δικηγόροι έχουν επίσης βασιστεί σε ΤΝ για την προετοιμασία των υπομνημάτων τους, με ένα δικηγορικό γραφείο να ζητά δημόσια συγγνώμη πέρυσι, αφού αποκαλύφθηκε ότι ψεύτικες, παραγόμενες από ΤΝ, παραπομπές είχαν συμβάλει σε μια αίτηση πτώχευσης σε μία από τις υποθέσεις τους.
Τα ανεπίσημα στοιχεία και τα δεδομένα του MIT υποδηλώνουν ότι η ΤΝ εξακολουθεί να απαιτεί ανθρώπινη παρέμβαση για τη μεγιστοποίηση των δυνατοτήτων της, αν και η τεχνολογία βελτιώνεται ραγδαία. Οι ερευνητές του MIT εκτιμούν ότι το ποσοστό επιτυχίας της ΤΝ στις αναλυόμενες εργασίες αυξήθηκε κατά 11 ποσοστιαίες μονάδες ετησίως, χάρη σε πιο ικανά μοντέλα.
Μέχρι το 2029, οι συγγραφείς εκτιμούν ότι τα περισσότερα μοντέλα ΤΝ θα είναι σε θέση να ολοκληρώσουν το 80% έως 95% των εργασιών που βασίζονται σε κείμενο στο επίπεδο “ελάχιστα επαρκές”. Εάν η ΤΝ θα μπορέσει ποτέ να κλιμακωθεί προς εξαιρετική ή ακόμη και άριστη απόδοση, παραμένει άγνωστο. “Η ευρεία αυτοματοποίηση, ιδιαίτερα σε τομείς με χαμηλή ανοχή σε σφάλματα, μπορεί να απέχει ακόμη αρκετά,” έγραψαν οι ερευνητές. Η ΤΝ μπορεί να είναι σε θέση να εκτελέσει την απολύτως βασική εργασία που σχετίζεται με σύνταξη, αποστολή email και αριθμητικές πράξεις, αλλά δεν έχει ακόμη φτάσει στην περιοχή της ανώτερης απόδοσης, όπου οι άνθρωποι εξακολουθούν να μπορούν να ξεχωρίσουν.