Η Κίνα προετοιμάζεται για μια κομβική εβδομάδα στον χώρο της Τεχνητής Νοημοσύνης, καθώς μια σειρά από νέα μοντέλα, συμπεριλαμβανομένου ενός ισχυρού «κρυφού» ανταγωνιστή, αναμένεται να κάνει την εμφάνισή της. Οι εγχώριοι τεχνολογικοί γίγαντες είναι έτοιμοι να παρουσιάσουν τα κορυφαία τους προϊόντα, σε μια προσπάθεια να κερδίσουν την προσοχή των χρηστών.
Ο αγώνας δρόμου για την κυκλοφορία νέων μοντέλων πριν από την εορτή του Lunar New Year υπογραμμίζει τον έντονο παγκόσμιο ανταγωνισμό μεταξύ των κορυφαίων εταιρειών. Η εξέλιξη αυτή έρχεται μετά τις πρόσφατες, υψηλού προφίλ ανακοινώσεις από την Anthropic και την OpenAI στις Ηνωμένες Πολιτείες, σηματοδοτώντας μια ταχεία επιτάχυνση της προόδου στην Τεχνητή Νοημοσύνη στις αρχές του 2026.
Την Κυριακή, μέλος της ομάδας ανάπτυξης μοντέλων της Alibaba Cloud υπέβαλε αιτήσεις ενσωμάτωσης κώδικα (pull requests) σε ανοιχτές πλατφόρμες προγραμματιστών, όπως το Hugging Face και το GitHub. Οι αιτήσεις αυτές αφορούν την επόμενη γενιά μοντέλων της εταιρείας. Τέτοιες πλατφόρμες λειτουργούν ως διαδικτυακά αποθετήρια όπου οι προγραμματιστές μπορούν να μοιράζονται, να συνεργάζονται και να διαχειρίζονται κώδικα λογισμικού, καθιστώντας τον δημόσια προσβάσιμο για χρήση και τροποποίηση.
Το επίκεντρο αυτής της νέας οικογένειας μοντέλων είναι το πολυαναμενόμενο Qwen-3.5, η κυκλοφορία του οποίου αναμένεται σχεδόν ένα χρόνο μετά το Qwen-3. Το προηγούμενο μοντέλο της Alibaba, με έδρα το Hangzhou, συνέβαλε στην καθιέρωση του Qwen ως της πιο δημοφιλούς οικογένειας ανοιχτών μοντέλων παγκοσμίως κατά τη διάρκεια του 2025, χάρη στην ισχυρή του απόδοση, την ευνοϊκή άδεια χρήσης και το ευρύ φάσμα εφαρμογών του. Η Alibaba Cloud είναι η μονάδα τεχνητής νοημοσύνης και υπολογιστικού νέφους της Alibaba Group Holding, ιδιοκτήτριας της South China Morning Post.
Με βάση προκαταρκτικές πληροφορίες που αποκαλύφθηκαν κατά την υποβολή των αιτήσεων, το Qwen-3.5 θα περιλαμβάνει δύο μοντέλα – ένα με 9 δισεκατομμύρια παραμέτρους και ένα άλλο με 35 δισεκατομμύρια παραμέτρους. Για πρώτη φορά, θα διαθέτουν εγγενή υποστήριξη για πολυτροπικότητα. Οι παράμετροι αποτελούν τις μεταβλητές που κωδικοποιούν την «ευφυΐα» ενός μοντέλου και προσαρμόζονται κατά την εκπαίδευση. Γενικά, μεγαλύτερος αριθμός μεταβλητών σημαίνει ένα πιο ισχυρό μοντέλο, αν και απαιτεί περισσότερους υπολογιστικούς πόρους. Η πολυτροπική υποστήριξη σημαίνει ότι η Τεχνητή Νοημοσύνη μπορεί να κατανοεί και να επεξεργάζεται διαφορετικούς τύπους δεδομένων, όπως κείμενο, εικόνες και ήχο.
Τα δύο μοντέλα θα ενσωματώνουν επίσης την αρχιτεκτονική επόμενης γενιάς της εταιρείας, η οποία παρουσιάστηκε για πρώτη φορά τον Σεπτέμβριο σε ένα πειραματικό μοντέλο ονόματι Qwen3-Next. Τότε, η Alibaba το περιέγραψε ως το «μέλλον των αποδοτικών LLM» (large language models). Ο Zhou Peilin, ερευνητής Τεχνητής Νοημοσύνης στο Πανεπιστήμιο Επιστήμης και Τεχνολογίας του Χονγκ Κονγκ, πρόσθεσε ότι η αρχιτεκτονική «Next» χρησιμοποιεί μια καινοτόμο τεχνική που ονομάζεται «Gated DeltaNet» για να βελτιώσει την αποδοτικότητα με την οποία τα μοντέλα απομνημονεύουν και διατηρούν πληροφορίες.
Ένα άλλο σημαντικό θέμα συζήτησης στον κλάδο το Σαββατοκύριακο ήταν η κυκλοφορία την Παρασκευή, στην αγορά LLM OpenRouter, του «Pony Alpha». Αυτό το μοντέλο, που παρουσιάστηκε από τον άγνωστο δημιουργό του ως «μοντέλο θεμελίωσης επόμενης γενιάς», επιδεικνύει ισχυρή απόδοση σε κωδικοποίηση, συλλογισμό και role-play. Το OpenRouter είναι μια πλατφόρμα που επιτρέπει στους προγραμματιστές να έχουν πρόσβαση και να συγκρίνουν διάφορα LLM, συμπεριλαμβανομένων νέων ή πειραματικών μοντέλων, συχνά για να δοκιμάσουν την απόδοσή τους.
Οι εταιρείες Τεχνητής Νοημοσύνης περιστασιακά κυκλοφορούν τα νεότερα μοντέλα τους ανώνυμα στο OpenRouter για να δημιουργήσουν ενθουσιασμό και να συλλέξουν δεδομένα για τη βελτίωση της απόδοσης των μοντέλων πριν από την επίσημη κυκλοφορία τους.
Ονομάζοντας το «νέο stealth μοντέλο» στην ανακοίνωσή του στα μέσα κοινωνικής δικτύωσης, το Pony Alpha έγινε γρήγορα viral σε φόρουμ προγραμματιστών λόγω της ισχυρής του απόδοσης. Αυτό οδήγησε κάποιους να υποθέσουν ότι αναπτύχθηκε από μια κορυφαία αμερικανική εταιρεία, όπως η Anthropic, καθώς το ίδιο το μοντέλο δήλωνε κάτι τέτοιο όταν του ζητήθηκε από ορισμένους χρήστες.
Ωστόσο, μια πηγή ανέφερε στη South China Morning Post, υπό τον όρο της ανωνυμίας, ότι το μοντέλο είναι το GLM-5 της Zhipu AI (με έδρα το Πεκίνο), προσθέτοντας ότι η απόδοση και η ταχύτητα επεξεργασίας του μοντέλου θα βελτιωθούν περαιτέρω με την επίσημη κυκλοφορία του. Στην Τεχνητή Νοημοσύνη, η ταχύτητα επεξεργασίας αναφέρεται στο πόσο γρήγορα ένα μοντέλο μπορεί να επεξεργαστεί την είσοδο και να παράγει έξοδο, υποδεικνύοντας την αποδοτικότητα και την ανταπόκρισή του.
Την περασμένη εβδομάδα, παρατηρητικοί χρήστες της MiniMax, με έδρα τη Σαγκάη, εντόπισαν ότι η εταιρεία είχε αναφέρει ένα νέο μοντέλο, το M2.2, στον κώδικα της επίσημης ιστοσελίδας της. Μια άλλη ανώνυμη πηγή ανέφερε ότι το νέο μοντέλο θα είναι μια μικρή αναβάθμιση της προηγούμενης έκδοσης M2.1, με βελτιώσεις εστιασμένες στην κωδικοποίηση. Τόσο η Zhipu AI, γνωστή διεθνώς ως Z.ai, όσο και η MiniMax δεν απάντησαν άμεσα σε αιτήματα για σχόλια.
Η παροχή νέων κινεζικών μοντέλων έρχεται καθώς ο παγκόσμιος ανταγωνισμός μεταξύ των εταιρειών Τεχνητής Νοημοσύνης εντείνεται. Μια έκθεση του OpenRouter τον Δεκέμβριο διαπίστωσε ότι οι περισσότεροι χρήστες Τεχνητής Νοημοσύνης επέδειξαν αδύναμη πίστη σε συγκεκριμένα μοντέλα, με ένα ισχυρό πλεονέκτημα πρώτου κινούμενου να διατηρείται για τα πιο ισχυρά μοντέλα σε κάθε δεδομένη στιγμή που επιτυγχάνουν συγκεκριμένες τεχνικές καινοτομίες.
Στις Ηνωμένες Πολιτείες, οι πρόσφατες κυκλοφορίες του Claude Opus 4.6 της Anthropic και του GPT-5.3-Codex της OpenAI μέσα σε λίγες ώρες η μία από την άλλη προκάλεσαν συζητήσεις σχετικά με την «απογείωση» της προόδου στην Τεχνητή Νοημοσύνη παγκοσμίως, με κάποιους αναλυτές να εκφράζουν ανησυχίες ότι τα κίνητρα της αγοράς υπερισχύουν των πρακτικών ασφαλείας.