Κινέζοι επιστήμονες παρουσίασαν έναν οπτικό επεξεργαστή που αποδείχθηκε πάνω από εκατό φορές ταχύτερος και ενεργειακά αποδοτικότερος από το κορυφαίο υλικό τεχνητής νοημοσύνης της Nvidia, ιδιαίτερα σε παραγωγικές εργασίες όπως η παραγωγή βίντεο και η σύνθεση εικόνων.
Ο επεξεργαστής LightGen, ο οποίος αναπτύχθηκε από ομάδα ερευνητών του Πανεπιστημίου Jiao Tong της Σαγκάης και του Πανεπιστημίου Tsinghua, αξιοποιεί την ταχύτητα του φωτός για την εκτέλεση σύνθετων εργασιών τεχνητής νοημοσύνης. Με πάνω από 2 εκατομμύρια φωτονικά νευρώνια ενσωματωμένα σε ένα συμπαγές τσιπ, το LightGen είναι ικανό να παράγει εικόνες υψηλής ανάλυσης, συμπεριλαμβανομένων τρισδιάστατων σκηνών, καθώς και βίντεο.
Η έρευνα, με επικεφαλής τον καθηγητή Chen Yitong από το Πανεπιστήμιο Jiao Tong της Σαγκάης, δημοσιεύτηκε στο επιστημονικό περιοδικό Science. Ο Chen δήλωσε ότι το LightGen μπορεί να “κλιμακωθεί περαιτέρω” και “παρέχει έναν νέο τρόπο σύνδεσης νέων αρχιτεκτονικών επεξεργαστών με την καθημερινή, σύνθετη τεχνητή νοημοσύνη, χωρίς απώλεια απόδοσης και με ταχύτητα και αποδοτικότητα τάξεις μεγέθους μεγαλύτερες, για βιώσιμη τεχνητή νοημοσύνη”.
Καθώς η τεχνητή νοημοσύνη εξελίσσεται ραγδαία, η παραγωγική τεχνητή νοημοσύνη μπορεί πλέον να δημιουργεί ρεαλιστικές εικόνες, ακόμα και βίντεο, αλλά απαιτεί τεράστια υπολογιστική ισχύ και καταναλώνει μεγάλες ποσότητες ενέργειας. Ως αποτέλεσμα, οι επιστήμονες στρέφονται στην φωτονική υπολογιστική, καθώς οι συμβατικοί ηλεκτρονικοί επεξεργαστές φτάνουν στα όριά τους.
Οι παραδοσιακοί υπολογιστές βασίζονται στη ροή ηλεκτρονίων για την αποστολή και επεξεργασία πληροφοριών, ενώ η φωτονική υπολογιστική χρησιμοποιεί παλμούς λέιζερ αντί για ηλεκτρόνια, εκτελώντας πράξεις με την ταχύτητα του φωτός. Τα οπτικά σήματα προσφέρουν επίσης το πλεονέκτημα της ελαχιστοποίησης της κατανάλωσης ενέργειας και της παροχής ταχέων απαντήσεων στα αιτήματα των χρηστών.
Ωστόσο, παρόλο που τα συστήματα φωτονικής υπολογιστικής έχουν δείξει δυναμικές σε συγκεκριμένες εργασίες, στο παρελθόν δυσκολεύονταν να διαχειριστούν εργασίες παραγωγικής τεχνητής νοημοσύνης υψηλής πολυπλοκότητας – όπως η σύνθεση εικόνων και η παραγωγή βίντεο – λόγω περιορισμών στην υπολογιστική τους αρχιτεκτονική και ανεπαρκώς ανεπτυγμένων αλγορίθμων εκπαίδευσης.
Η ομάδα του LightGen επικεντρώθηκε στην ανάπτυξη τριών τομέων: κατασκευή μιας νέας αρχιτεκτονικής, ανάπτυξη ενός καινοτόμου αλγορίθμου εκπαίδευσης και παροχή στον επεξεργαστή υψηλής πυκνότητας ενσωμάτωσης. Αρχιτεκτονικά, η ομάδα δημιούργησε έναν “οπτικό λανθάνοντα χώρο” – παρόμοιο με έναν επεκτάσιμο “κόμβο αυτοκινητόδρομου” για το φως – όπου τα δεδομένα μπορούν να ρέουν ταχύτατα στην πιο συμπαγή τους μορφή, επιτρέποντας την αποδοτική συμπίεση και ανακατασκευή πληροφοριών.
Επιπλέον, οι ερευνητές ανέπτυξαν έναν αλγόριθμο παραγωγικής εκπαίδευσης που, σε σύγκριση με τις συμβατικές εκδοχές, αφαίρεσε την ανάγκη για τεράστια σύνολα επισημασμένων δεδομένων. Αντίθετα, χρησιμοποίησαν έναν αλγόριθμο μη επιβλεπόμενης εκπαίδευσης που επέτρεψε στο LightGen να μάθει και να δημιουργήσει αναγνωρίζοντας στατιστικά πρότυπα στα δεδομένα, παρόμοια με τη διαδικασία ανθρώπινης μάθησης.
Η ομάδα ενσωμάτωσε πάνω από 2 εκατομμύρια φωτονικά “νευρώνια” σε ένα τσιπ 136,5 τετραγωνικών χιλιοστών, κατασκευάζοντας ένα εξελιγμένο δίκτυο ικανό να χειριστεί την παραγωγή εικόνων υψηλής ανάλυσης. Πειράματα ανέδειξαν κάποιες από τις δυνατότητες του LightGen, συμπεριλαμβανομένης της παραγωγής εικόνων ζώων σε ανάλυση 512×512 pixel με ποικίλες κατηγορίες, χρώματα, εκφράσεις και φόντα, οι οποίες ήταν πλούσιες σε λεπτομέρειες και λογικά σωστές.
Η μελέτη αναφέρει: “Το LightGen υλοποίησε πειραματικά παραγωγή εικόνων υψηλής ανάλυσης, μείωση θορύβου [καθιστώντας κοκκώδεις εικόνες πιο καθαρές και ευκρινείς], μεταφορά στυλ, τρισδιάστατη παραγωγή και χειρισμό.”
Σε μια συντηρητική εκτίμηση, το LightGen επέτυχε ταχύτητα υπολογιστικής συστήματος 3,57×10⁴ Tera Operations Per Second (TOPS) και ενεργειακή απόδοση 6,64×10² TOPS/watt. Αυτό σήμαινε ότι η συνολική του απόδοση ξεπερνούσε αυτή κορυφαίων ηλεκτρονικών επεξεργαστών, όπως ο A100 της Nvidia, κατά περισσότερο από εκατό φορές.
“Η βελτίωση στην ταχύτητα υπολογιστικής και την ενεργειακή απόδοση του LightGen αντιστοιχούσε καλά με τη μετρημένη πειραματικά συνολική μείωση στον χρόνο και το κόστος ενέργειας, όταν το LightGen επέτυχε πειραματικά ποιότητα παραγωγής συγκρίσιμη με αυτή των πραγματικών ηλεκτρονικών μοντέλων τεχνητής νοημοσύνης στην Nvidia A100”, αναφέρεται στην εργασία.
Οι ερευνητές δήλωσαν ότι το LightGen θα μπορούσε να σηματοδοτήσει μια σημαντική αλλαγή στο υλικό που χρησιμοποιείται για την παραγωγική τεχνητή νοημοσύνη, καθιστώντας την φωτονική υπολογιστική μια βασική πλατφόρμα ικανή να εκτελεί ανεξάρτητα σύνθετες δημιουργικές εργασίες. Πρόσθεσαν ότι η εξαιρετική ενεργειακή του απόδοση προσφέρει επίσης έναν πρακτικό δρόμο για την αντιμετώπιση των αυξανόμενων ενεργειακών απαιτήσεων της υπολογιστικής τεχνητής νοημοσύνης.