Μια νέα τάση αναδύεται στον κόσμο της τεχνολογίας, καθώς εταιρείες από νεοφυείς επιχειρήσεις μέχρι τεχνολογικούς γίγαντες επιδίδονται σε έναν αγώνα δρόμου για τα λεγόμενα «μοντέλα κόσμου». Πρόκειται για έναν τομέα που υπόσχεται να πάει την τεχνητή νοημοσύνη πέρα από την απλή επεξεργασία κειμένου, επιτρέποντάς της να μαθαίνει και να αντιλαμβάνεται τη φυσική πραγματικότητα.
Η Alibaba Group Holding παρουσίασε πρόσφατα το Happy Oyster, ένα μοντέλο που επιτρέπει τη δημιουργία και την αλληλεπίδραση σε εικονικούς κόσμους σε πραγματικό χρόνο. Μέσω του τμήματος Alibaba Token Hub (ATH), η εταιρεία υπόσχεται μια πιο «ζωντανή» εμπειρία, προσφέροντας δύο τρόπους λειτουργίας: έναν όπου ο χρήστης καθοδηγεί τη δημιουργία του κόσμου μέσω κειμένου και εικόνας, και έναν όπου μπορεί να εξερευνήσει το αποτέλεσμα. Σε αντίθεση με τα παραδοσιακά εργαλεία βίντεο, το Happy Oyster επιτρέπει τη συνεχή ροή οδηγιών, μετατρέποντας τη δημιουργία σε μια διαδραστική διαδικασία.
Την ίδια στιγμή, στο Σαν Φρανσίσκο, η World Labs —που συνιδρύθηκε από την καθηγήτρια του Stanford, Li Fei-Fei— παρουσίασε το Spark 2.0. Το εργαλείο αυτό εστιάζει στην τεχνική 3D Gaussian splatting, επιτρέποντας ακόμη και σε απλά smartphone να προβάλλουν λεπτομερή τρισδιάστατα περιβάλλοντα με εντυπωσιακή ταχύτητα. Όπως δήλωσε η Li Fei-Fei, το Spark 2.0 μπορεί πλέον να διαχειριστεί πάνω από 100 εκατομμύρια σημεία σε οποιαδήποτε συσκευή.
Καθώς τα γλωσσικά μοντέλα κυριαρχούν ακόμα στην ανάπτυξη της τεχνητής νοημοσύνης, οι ειδικοί του κλάδου, όπως ο βραβευμένος με Turing, Yann LeCun, θεωρούν πως τα μοντέλα κόσμου αποτελούν το επόμενο μεγάλο στοίχημα. Στην ίδια κατεύθυνση κινείται και η Tencent Holdings από το Shenzhen, η οποία λάνσαρε το δικό της μοντέλο, HY-World 2.0, δίνοντας έμφαση στη δημιουργία στοιχείων για την παραγωγή παιχνιδιών. Είναι σαφές ότι η επόμενη μάχη της τεχνητής νοημοσύνης θα δοθεί στο πεδίο της οπτικής και χωρικής κατανόησης του κόσμου μας.