Η ByteDance, η μητρική εταιρεία του TikTok, έκανε μια εντυπωσιακή κίνηση κυκλοφορώντας την τελευταία της έκδοση τεχνητής νοημοσύνης για βίντεο, το Seedance 2.0. Αυτό το νέο μοντέλο έχει προκαλέσει αίσθηση στον χώρο της τεχνολογίας και της παραγωγής βίντεο, καθώς ο ανταγωνισμός μεταξύ των τεχνολογικών κολοσσών της Κίνας στον τομέα των εφαρμογών AI εντείνεται.
Το Seedance 2.0, το οποίο βρίσκεται ακόμα σε beta έκδοση και είναι διαθέσιμο σε επιλεγμένους χρήστες της πλατφόρμας AI βίντεο της ByteDance, Jimeng AI, προσφέρει βελτιωμένη ρεαλιστικότητα στα βίντεο, καθιστώντας δύσκολη τη διάκριση μεταξύ περιεχομένου που δημιουργείται από AI και της πραγματικότητας. Χαρακτηρίζεται επίσης από πιο ομαλές κινήσεις της κάμερας και βελτιωμένη οπτική συνέπεια, σύμφωνα με τους πρώτους χρήστες.
Ο ενθουσιασμός γύρω από αυτή την εξέλιξη έχει οδηγήσει σε άνοδο των μετοχών ορισμένων κινεζικών εταιρειών μέσων ενημέρωσης και εφαρμογών AI. Αναλυτές εκφράζουν αισιοδοξία ότι η τεχνητή νοημοσύνη μπορεί να αξιοποιηθεί περαιτέρω για να ωφελήσει τον παραδοσιακό κινηματογράφο και τη δημιουργία περιεχομένου. Συγκεκριμένα, οι μετοχές της εταιρείας παραγωγής Huace Media και του κατασκευαστή βιντεοπαιχνιδιών Perfect World σημείωσαν αύξηση περίπου 7% και 10% αντίστοιχα τη Δευτέρα, ενώ ο εκδοτικός οίκος COL Group έφτασε στο ημερήσιο όριο τιμής του 20%.
Το Seedance 2.0 υποστηρίζει επίσης πολυτροπική εισαγωγή, δηλαδή μπορεί να δημιουργεί περιεχόμενο από κείμενο, εικόνες, ήχο και βίντεο. Αυτό το καθιστά ένα εύχρηστο αλλά και ισχυρό εργαλείο για τη δημιουργία βίντεο κλιπ, τα οποία παραδοσιακά θα απαιτούσαν επαγγελματικές δεξιότητες παραγωγής και επεξεργασίας βίντεο.
Έχει κεντρίσει ευρεία προσοχή και έχει λάβει πρώιμους επαίνους, με τους δοκιμαστές να εκφράζουν τον θαυμασμό τους για την ικανότητά του να δημιουργεί ρεαλιστικούς χαρακτήρες και να παρέχει βελτιωμένο και ακριβή έλεγχο στην επεξεργασία τμημάτων του βίντεο. “Με τις βελτιώσεις ρεαλισμού, αισθάνομαι ότι είναι πολύ δύσκολο να καταλάβεις αν ένα βίντεο έχει δημιουργηθεί από AI”, δήλωσε ο Wang Lei, ένας προγραμματιστής από την επαρχία Γκουανγκντόνγκ της νότιας Κίνας.
Ο Wang περιέγραψε τη χρήση απλών προτροπών κειμένου για την παραγωγή ενός βίντεο 10 δευτερολέπτων που κατέγραφε την ιστορία της ανθρωπότητας από τους προϊστορικούς χρόνους έως τη σύγχρονη εποχή, επαινώντας το αποτέλεσμα ως “ομαλό στην αφήγηση με κινηματογραφική μεγαλοπρέπεια”. Απέδωσε την επιτυχία του μοντέλου στους τεράστιους πόρους βίντεο που είναι διαθέσιμοι μέσω του Douyin – της μεγαλύτερης εφαρμογής βίντεο μικρής διάρκειας της Κίνας και αντίστοιχου του TikTok – βοηθώντας την ByteDance στην εκπαίδευση του μοντέλου.
Ορισμένοι Κινέζοι επιχειρηματίες τεχνολογίας το επαινούν. Ο Feng Ji, ιδρυτής και διευθύνων σύμβουλος της Game Science, της εταιρείας ανάπτυξης του κινεζικού blockbuster παιχνιδιού Black Myth: Wukong, με έδρα το Hangzhou, δήλωσε ότι είναι το “καλύτερο μοντέλο δημιουργίας βίντεο στον πλανήτη”.
Ο Feng προέβλεψε ότι οι εξελίξεις στο AI βίντεο θα μειώσουν το εμπόδιο για οποιονδήποτε να δημιουργεί επαγγελματικής εμφάνισης περιεχόμενο με χαμηλό κόστος, φέρνοντας σεισμικές αλλαγές σε παραδοσιακούς οργανισμούς και ροές εργασίας στον τομέα του περιεχομένου βίντεο. Ωστόσο, προειδοποίησε ότι τέτοια πρόοδος θα μπορούσε επίσης να οδηγήσει στην εξάπλωση των deepfakes – εικόνες, βίντεο και ήχοι που απεικονίζουν πραγματικούς ανθρώπους – και να εγείρει θέματα εμπιστοσύνης.
Οι χρήστες έχουν μοιραστεί δημιουργίες που κυμαίνονται από τηλεοπτικές διαφημίσεις μέχρι κινηματογραφικά κλιπ, όπου χαρακτήρες αντικαθίστανται από τα δικά τους πρόσωπα.
Αναλυτές της Kaiyuan Securities έγραψαν σε ερευνητική σημείωση την Κυριακή ότι το Seedance 2.0 θα μπορούσε να βοηθήσει τους τομείς των AI manga, των σύντομων δραμάτων και των ταινιών να αποκτήσουν ορμή στην εμπορευματοποίηση. “Δίνοντας στους χρήστες ακριβή έλεγχο περιεχομένου σε επίπεδο ‘σκηνοθέτη’, [το Seedance 2.0] αναμένεται να υιοθετηθεί ευρέως αρχικά στους τομείς AI manga και σύντομων δραμάτων, μειώνοντας το κόστος και βελτιώνοντας την αποδοτικότητα προς όφελος εταιρειών με μεγάλες συμμετοχές σε πνευματική ιδιοκτησία ή κίνηση”, αναφέρεται στη σημείωση.
Ένας ειδικός στην παραγωγή βίντεο στο Πεκίνο, ο οποίος ζήτησε να μην κατονομαστεί καθώς δεν ήταν εξουσιοδοτημένος να μιλήσει με τα μέσα ενημέρωσης, δήλωσε ότι το μοντέλο έχει πλέον φτάσει σε ένα σημείο με τη δυνατότητα να διαταράξει την παραδοσιακή βιομηχανία. Πρόσθεσε ότι, καθώς η AI γίνεται ταχύτατα ευέλικτη στη γλώσσα οπτικοακουστικών μέσων και στα ειδικά εφέ – κάτι που θα μπορούσε να αποτελέσει κέρδος για τη βιομηχανία – αυτό που απομένει για τους δημιουργούς είναι να επικεντρωθούν στη δημιουργικότητα και την έκφραση του περιεχομένου.
Οι κινεζικές εταιρείες τεχνολογίας ανταγωνίζονται σθεναρά στον τομέα του AI βίντεο. Η πρόοδος της ByteDance ήρθε λίγες ημέρες αφότου η ανταγωνίστρια Kuaishou Technology αποκάλυψε τη σειρά μοντέλων της Kling 3.0, συμπεριλαμβανομένου του Kling Video 3.0, το οποίο υποστηρίζει επίσης πολυτροπική εισαγωγή και εξαγωγή σε μορφές περιεχομένου κειμένου, εικόνας, ήχου και βίντεο με απλοποιημένη ροή εργασίας που στοχεύει στη βιομηχανική χρήση.