Η startup τεχνητής νοημοσύνης Deeptune άντλησε 43 εκατομμύρια δολάρια σε χρηματοδότηση Series A, ποσό που θα διατεθεί για τη δημιουργία “προπονητικών γυμναστηρίων” για AI agents. Η επένδυση ηγήθηκε από την Andreessen Horowitz, με τη συμμετοχή των 776, Abstract Ventures και Inspired Capital, καθώς και επενδυτών όπως ο ερευνητής της OpenAI, Noam Brown.
Η Deeptune εστιάζει στην ανάπτυξη περιβαλλόντων υψηλής πιστότητας για την ενισχυτική μάθηση (RL), τα οποία προσομοιώνουν τις καθημερινές ροές εργασίας διαφόρων επαγγελμάτων, όπως λογιστές, εκπρόσωποι εξυπηρέτησης πελατών και μηχανικοί DevOps. Ο στόχος είναι οι AI agents να μπορούν να μαθαίνουν να διαχειρίζονται σύνθετες εργασίες μέσω δημοφιλών εργαλείων όπως το Slack, το Salesforce και άλλα συστήματα διαχείρισης εισιτηρίων, χρηματοοικονομικών και παρακολούθησης. “Ουσιαστικά, δημιουργούμε προσομοιώσεις ψηφιακής εργασίας που μοιάζουν με τον χώρο εργασίας ενός λογιστή, ενός δικηγόρου ή ενός μηχανικού λογισμικού”, δήλωσε ο συνιδρυτής και CEO, Tim Lupo.
Ο Lupo παρομοιάζει τα σημερινά μοντέλα AI με πιλότους που “έχουν διαβάσει μόνο βιβλία ή έχουν παρακολουθήσει βίντεο”. “Δεν θα αφήνατε έναν πιλότο που έχει μόνο διαβάσει βιβλία ή έχει παρακολουθήσει βίντεο να πετάξει ένα αεροπλάνο. Θα τον βάζατε σε έναν προσομοιωτή πτήσης”, είπε. “Αυτό που χτίζουμε είναι ουσιαστικά οι προσομοιωτές πτήσης για την τεχνητή νοημοσύνη που εκτελεί εργασίες σε όλη την οικονομία.”
Η στρατηγική της Deeptune αντικατοπτρίζει μια ευρύτερη στροφή στην AI, από την εκπαίδευση σε στατικά δεδομένα μεγάλης κλίμακας από το διαδίκτυο, στη διεξαγωγή ενισχυτικής μάθησης μεγάλης κλίμακας σε συνθετικά και διαδραστικά περιβάλλοντα. Αυτή η κατεύθυνση είναι εμφανής σε πρόσφατες εργασίες για RL agents που χρησιμοποιούν εργαλεία στην Microsoft, καθώς και στον agent της OpenAI που χρησιμοποιεί υπολογιστές. Η παγκόσμια αγορά ενισχυτικής μάθησης, συμπεριλαμβανομένων εργαλείων και περιβαλλόντων, αναμένεται να αυξηθεί από περίπου 11,6 δισεκατομμύρια δολάρια το 2025 σε πάνω από 90 δισεκατομμύρια δολάρια έως το 2034, σύμφωνα με την ResearchAndMarkets.
“Αντί να βασίζονται κυρίως σε δεδομένα που έχουν επισημανθεί από ανθρώπους, τα μοντέλα μαθαίνουν μέσω αλληλεπίδρασης, εκτελώντας δοκιμές, λαμβάνοντας δράσεις και λαμβάνοντας ανταμοιβές σε δυναμικά περιβάλλοντα που λειτουργούν σαν χώρος παιχνιδιού”, δήλωσε ο Marco Mascorro, συνεργάτης στην Andreessen Horowitz. “Η Deeptune έχει δημιουργήσει μια πλατφόρμα που επιτρέπει αυτήν τη μετατόπιση, βοηθώντας κορυφαία εργαστήρια να εκπαιδεύουν και να αξιολογούν αυτές τις συμπεριφορές με αξιόπιστο και επεκτάσιμο τρόπο. Ο Tim και η ομάδα έχουν βαθιά κατανόηση και εμπειρία συνεργασίας με ερευνητικά εργαστήρια αιχμής στην AI για αυτά τα προβλήματα.”
Η εταιρεία αναφέρει ότι έχει δημιουργήσει εκατοντάδες τέτοια προπονητικά γυμναστήρια για κορυφαία εργαστήρια AI, και τα περιβάλλοντά της έχουν ήδη συμβάλει σε πρόσφατες εξελίξεις στις δυνατότητες “χρήσης υπολογιστών” των agents, ξεπερνώντας την απλή απάντηση ερωτήσεων για την εκτέλεση πολυεπίπεδων ροών εργασίας σε πραγματικό λογισμικό. “Ήμασταν η πρώτη εταιρεία που κατασκεύασε ένα περιβάλλον πριν από λίγο παραπάνω από ένα χρόνο, και κανείς δεν ήξερε πραγματικά αν θα λειτουργούσε”, δήλωσε ο Lupo. “Τώρα ξέρουμε ότι λειτουργούν απίστευτα καλά.” Σύμφωνα με τον ίδιο, οτιδήποτε μπορεί να αποσταχθεί σε ένα περιβάλλον, “από την επεξεργασία ενός βίντεο μέχρι τη δημιουργία ενός LBO στο Excel”, είναι κάτι που η AI μπορεί να μάθει.
Αυτή η ανάγκη μετατρέπει τα περιβάλλοντα ενισχυτικής μάθησης σε μια “καυτή νέα κατηγορία υποδομών”, με μεγάλα εργαστήρια να εξετάζουν δαπάνες άνω του ενός δισεκατομμυρίου δολαρίων για τέτοια περιβάλλοντα και τους υφιστάμενους παίκτες στην επισήμανση δεδομένων να αγωνίζονται να αναπτύξουν τις δικές τους προσφορές.
Καθώς οι επενδυτές, συμπεριλαμβανομένου του Marc Andreessen, προειδοποιούν ότι οι εταιρείες AI “ξεμένουν” από ανθρώπινα δεδομένα υψηλής ποιότητας και μελέτες να προβλέπουν ότι τα δημόσια δεδομένα του διαδικτύου για εκπαίδευση ενδέχεται να εξαντληθούν μέσα στην επόμενη δεκαετία, η Deeptune παρουσιάζει τους προσομοιωμένους χώρους εργασίας της ως έναν τρόπο δημιουργίας πλούσιας, ειδικής για εργασίες εμπειρίας για τα μοντέλα – επιτρέποντάς τους να εξασκηθούν μέσα σε ρεαλιστικά εταιρικά περιβάλλοντα, αντί να κάνουν απλώς “scraping” από το δημόσιο διαδίκτυο. “Πιστεύω ότι αυτό θα γίνει ο κύριος πυρήνας των δεδομένων γενικά: πώς μπορούμε να δημιουργήσουμε πραγματικά ρεαλιστικά περιβάλλοντα που να μοιάζουν με τις επιχειρήσεις στις οποίες [τα μοντέλα] μπορεί να αναπτυχθούν”, είπε ο Lupo.
Η ομάδα, που αποτελείται από περίπου 20 άτομα και εργάζεται εντός της εταιρείας, εδρεύει στη Νέα Υόρκη και περιλαμβάνει μηχανικούς και χειριστές από εταιρείες όπως Anthropic, Scale AI, Palantir, Hebbia, Glean και Retool. Ο Lupo χαρακτηρίζει τη Νέα Υόρκη ως μια σκόπιμη επιλογή και ένα πλεονέκτημα για την προσέλκυση προσωπικού: “Αν θέλεις να είσαι στη Νέα Υόρκη και θέλεις να δουλέψεις στην αιχμή της AI ή στην AGI, η Deeptune είναι ένα από τα ελάχιστα μέρη που μπορείς να ενταχθείς, και πιθανώς το μόνο πρώιμου σταδίου μέρος που μπορείς να ενταχθείς”, είπε. “Το καθοριστικό πρόβλημα των επόμενων πέντε ετών είναι, πώς μπορούμε να κάνουμε τα μοντέλα να λειτουργούν όχι μόνο σε σταθερές εξετάσεις, αλλά στον ακατάστατο, πραγματικό κόσμο… αυτό είναι που δουλεύουμε εδώ.”