Ο τεχνολογικός κολοσσός Meta Platforms, σύμφωνα με αναφορές, χρησιμοποιεί ένα μοντέλο τεχνητής νοημοσύνης ανοιχτού κώδικα που αναπτύχθηκε από την Alibaba Group Holding, με σκοπό να αναζωογονήσει τις δικές της προσπάθειες στον τομέα της ΤΝ, κάτι που αποτελεί πιθανή νίκη για την κινεζική ΤΝ.
Σύμφωνα με δημοσίευμα του Bloomberg την Τετάρτη, η Meta, ιδιοκτήτρια του Facebook, χρησιμοποιούσε το μοντέλο Qwen της Alibaba, μαζί με άλλα μοντέλα ανοιχτού κώδικα από την Google και την OpenAI, ως μέρος της διαδικασίας εκπαίδευσης για ένα νέο μοντέλο με κωδική ονομασία Avocado, το οποίο αναμενόταν να κυκλοφορήσει την άνοιξη.
Το δημοσίευμα δεν διευκρίνιζε ποιο μοντέλο Qwen της Alibaba χρησιμοποιείται.
Το Bloomberg ανέφερε ότι το νέο μοντέλο της Meta θα σηματοδοτούσε μια απομάκρυνση από την προηγούμενη στρατηγική της για διάθεση των μοντέλων της ως ανοιχτού κώδικα, κάτι που σημαίνει ότι οι χρήστες θα μπορούσαν να έχουν πρόσβαση στο μοντέλο μόνο μέσω ενός επίσημου API. Η Meta δεν έχει ανακοινώσει επίσημα αλλαγή στη στρατηγική της ΤΝ, από τα μοντέλα Llama ανοιχτού κώδικα σε ένα κλειστό, εμπορικό μοντέλο.
Το Qwen είναι η πιο δημοφιλής σειρά μοντέλων μεγάλης γλώσσας ανοιχτού κώδικα παγκοσμίως, με πολλές επιχειρήσεις στις ΗΠΑ να χρησιμοποιούν το μοντέλο για την ανάπτυξη των δικών τους εφαρμογών. Ο Brian Chesky, συνιδρυτής και CEO της Airbnb, της εταιρείας που εδρεύει στο Σαν Φρανσίσκο και ειδικεύεται στην online κράτηση καταλυμάτων, δήλωσε ότι η εταιρεία “βασίζεται σε μεγάλο βαθμό” στα μοντέλα Qwen της Alibaba για να τροφοδοτήσει τον πελατοκεντρικό της πράκτορα τεχνητής νοημοσύνης. Η Alibaba κατέχει την εφημερίδα South China Morning Post.
Οι μετοχές της Alibaba υποχώρησαν 1,7% στο Χονγκ Κονγκ την Πέμπτη.
Οι προσπάθειες της Meta στον τομέα της ΤΝ έχουν δεχθεί έντονο έλεγχο, μετά την εντατική προσπάθεια της εταιρείας το καλοκαίρι να προσελκύσει ταλέντα από ανταγωνιστικές εταιρείες, συμπεριλαμβανομένων αναφορών για μπόνους υπογραφής που έφταναν τα 100 εκατομμύρια δολάρια.
Το νέο μοντέλο Avocado αναπτύσσεται από τη νέα ερευνητική μονάδα ΤΝ της Meta, TBD Lab, σύμφωνα με το δημοσίευμα του Bloomberg. Η μονάδα αποτελείται από ακριβοπληρωμένους ερευνητές και ηγείται από τον νέο επικεφαλής ΤΝ της Meta, Alexandr Wang, ο οποίος εντάχθηκε μετά την εξαγορά της εταιρείας του από τη Meta έναντι 14,3 δισεκατομμυρίων δολαρίων.
Αξίζει να σημειωθεί ότι το δημοσίευμα του Bloomberg ανέφερε ότι το TBD Lab “αποστάζει” (distilling) το Qwen και τα άλλα μοντέλα ανοιχτού κώδικα για να εκπαιδεύσει το νέο του μοντέλο. Αυτή η αμφιλεγόμενη πρακτική αναφέρεται στους προγραμματιστές ΤΝ που χρησιμοποιούν την έξοδο άλλων μοντέλων για να εκπαιδεύσουν και να βελτιώσουν γρήγορα τα δικά τους μοντέλα.
Ενώ δεν είναι τεχνικά παράνομη, η πρακτική αυτή δεν είναι επιθυμητή στον κλάδο της ΤΝ. Η OpenAI νωρίτερα φέτος επέπληξε την κινεζική start-up DeepSeek για την απόσταξη των αποτελεσμάτων των μοντέλων της, μετά την κυκλοφορία του μοντέλου R1 τον Ιανουάριο.
Τα μοντέλα Llama της Meta πρωτοστάτησαν στο παγκόσμιο τοπίο ανοιχτού κώδικα μετά την κυκλοφορία τους στις αρχές του 2023. Πριν από την άνοδο της DeepSeek και των μοντέλων Qwen της Alibaba φέτος, τα μοντέλα Llama ήταν η προεπιλεγμένη επιλογή για τους προγραμματιστές παγκοσμίως για τη δημιουργία προσαρμοσμένων εφαρμογών, συμπεριλαμβανομένης της Κίνας.
Ωστόσο, η χλιαρή κυκλοφορία του Llama 4 τον Απρίλιο προκάλεσε μια θεμελιώδη επανεξέταση στη στρατηγική ΤΝ της Meta, συμπεριλαμβανομένης μιας πιθανής στροφής προς κλειστά μοντέλα.
Ο Su Lian Jye, επικεφαλής αναλυτής στην Omdia, δήλωσε ότι η είδηση υποδεικνύει ότι το χάσμα μεταξύ Κίνας και ΗΠΑ στην ΤΝ έχει στενέψει περαιτέρω, ενώ προειδοποίησε τους παρατηρητές να μην υποτιμούν τη Meta με βάση αυτή την έκθεση.
“Η Alibaba αναμένεται να είναι μια σημαντική δύναμη στην παραγωγική ΤΝ”, δήλωσε. “Η κοινότητα ανοιχτού κώδικα της εταιρείας ενισχύεται συνεχώς και είναι έτοιμη να αμφισβητήσει τους τρεις κορυφαίους δυτικούς hyperscalers.”