Η ByteDance, η μητρική εταιρεία του TikTok, παρουσίασε το νέο της μοντέλο δημιουργίας εικόνων με τεχνητή νοημοσύνη, το οποίο, όπως αναφέρει, είναι πιο προσιτό από τον δημοφιλή Nano Banana image editor της Google. Αυτή η εξέλιξη έρχεται σε μια περίοδο που ο ανταγωνισμός στον τομέα της Τεχνητής Νοημοσύνης (AI) μεταξύ Κίνας και ΗΠΑ εντείνεται.
Η νέα πρόταση της ByteDance, το Seedream 5.0, αντιμετώπισε άμεσο ανταγωνισμό από την Alibaba Cloud, η οποία επίσης αποκάλυψε το δικό της μοντέλο παραγωγής εικόνων, το Qwen-Image-2.0, την Τρίτη.
Σύμφωνα με ανάρτηση στον επίσημο λογαριασμό του CapCut στο X, η κινεζική εταιρεία ByteDance δήλωσε ότι το Seedream 5.0 διαθέτει ισχυρότερες δυνατότητες συλλογισμού, βελτιωμένη ακρίβεια και ενισχυμένο έλεγχο επεξεργασίας, επιτρέποντάς της να ανταγωνιστεί το Nano Banana της Google με χαμηλότερο κόστος. “Σκεφτείτε το Nano Banana Pro, αλλά πολύ φθηνότερα”, ανέφερε χαρακτηριστικά η ανάρτηση. Η ByteDance έχει διαθέσει το μοντέλο για δοκιμαστική χρήση (beta testing) στις πλατφόρμες της, Jimeng και CapCut.
Η ενισχυμένη ικανότητα συλλογισμού του Seedream επιτρέπει στο μοντέλο να κατανοεί και να ακολουθεί καλύτερα τις οδηγίες κειμένου από τους χρήστες για τη δημιουργία επιθυμητών εικόνων. Ταυτόχρονα, οι βελτιωμένοι έλεγχοι επεξεργασίας – μια λειτουργία που συνέβαλε στην παγκόσμια δημοτικότητα του Nano Banana Pro της Google – δίνουν τη δυνατότητα στους χρήστες να διορθώνουν συγκεκριμένα μέρη μιας εικόνας, χωρίς να χρειάζεται να την ξαναδημιουργήσουν από την αρχή.
Σε μια δοκιμή που πραγματοποιήθηκε από δημοσιογράφο της South China Morning Post, το Seedream 5.0 της ByteDance, προσβάσιμο μέσω της πλατφόρμας CapCut, ερμήνευσε το αίτημα “μια χιονισμένη νύχτα με αίσθηση ηρεμίας”, δημιουργώντας μια μοναχική, φωτισμένη από ένα αχνό φως εξωτερικό φωτιστικό, μία σκεπασμένη με χιόνι κατοικία, κάτω από ένα μουντό βράδυ. Μια δεύτερη οδηγία κειμένου, που ζητούσε από το μοντέλο να σβήσει το εξωτερικό φως και να ανάψει ένα αχνό φως στο εσωτερικό του σπιτιού, παρήγαγε επίσης το επιθυμητό αποτέλεσμα.
Η Alibaba Cloud, η μονάδα cloud computing του Alibaba Group Holding, κυκλοφόρησε το Qwen-Image-2.0, το πρώτο της μοντέλο που ενσωματώνει λειτουργίες δημιουργίας και επεξεργασίας εικόνων για μια πιο ομαλή εμπειρία χρήστη. Το μοντέλο υιοθέτησε μια ελαφριά αρχιτεκτονική για ταχύτερη δημιουργία και, σύμφωνα με την εταιρεία, απέδωσε καλύτερα από το Nano Banana Pro της Google στην απόδοση κινεζικών χαρακτήρων.
Η ByteDance παρουσίασε το νέο της μοντέλο δημιουργίας εικόνων αμέσως μετά την παρουσίαση του Seedance 2.0, του μοντέλου βίντεο που έκανε πρεμιέρα το Σαββατοκύριακο με μεγάλη επιτυχία, καθώς ο τεχνολογικός κλάδος συζητούσε έντονα την ικανότητά του να δημιουργεί ρεαλιστικά βίντεο που θόλωναν τα όρια μεταξύ των δημιουργιών AI και της πραγματικότητας. Αναλυτές εκτιμούν ότι η πρόοδος της ByteDance στην παραγωγή βίντεο με AI θα μπορούσε να απελευθερώσει παραγωγικότητα σε παραδοσιακές ταινίες και δημιουργία βίντεο περιεχομένου.
Τα νέα μοντέλα εικόνων της ByteDance και της Alibaba θα μπορούσαν να χρησιμοποιηθούν τόσο σε προσωπικά όσο και σε επαγγελματικά σενάρια, μειώνοντας το εμπόδιο για μεμονωμένους χρήστες ή επιχειρήσεις που θέλουν να παράγουν επαγγελματικής εμφάνισης εικόνες.