Η GOOGLE εντυπωσιάζει με το Veo 2, την απάντησή της στο Sora της OpenAI

Το τμήμα Deepming της GOOGLE παρουσίασε τη δεύτερη γενιά του μοντέλου παραγωγής βίντεο Veo, με δυνατότητα δημιουργίας βίντεο διάρκειας έως δύο λεπτών σε ανάλυση 4K, απλά με μια προτροπή κειμένου. Οι προδιαγραφές αυτές ξεπερνούν κατά έξι φορές τη διάρκεια και τέσσερις φορές την ανάλυση των βίντεο που παράγει το μοντέλο Sora της OpenAI.

Στην παρούσα φάση, το Veo 2 είναι διαθέσιμο μέσω της πειραματικής πλατφόρμας VideoFX της GOOGLE, με περιορισμούς στα οκτώ δευτερόλεπτα διάρκειας και ανάλυση 720p. Η πρόσβαση στην πλατφόρμα γίνεται μέσω λίστας αναμονής, με την εταιρεία να προγραμματίζει διεύρυνση της πρόσβασης τις επόμενες εβδομάδες.

Σύμφωνα με τον Eli Collins, η εταιρεία θα συνεχίσει να βελτιώνει το μοντέλο βάσει των σχολίων που δέχεται από τους χρήστες, με στόχο την ενσωμάτωση των δυνατοτήτων του Veo 2 στο οικοσύστημα εφαρμογών και υπηρεσιών της GOOGLE.

Today, we’re announcing Veo 2: our state-of-the-art video generation model which produces realistic, high-quality clips from text or image prompts. 🎥

We’re also releasing an improved version of our text-to-image model, Imagen 3 - available to use in ImageFX through… pic.twitter.com/h6ejHaMUM4
— Google DeepMind (@GoogleDeepMind) December 16, 2024

Το νέο μοντέλο παρουσιάζει βελτιωμένη κατανόηση της φυσικής, με καλύτερη απόδοση της ρευστοδυναμικής και των εφέ φωτισμού και σκίασης. Επιπλέον, προσφέρει ευκρινέστερα βίντεο με πιο καθαρές υφές και εικόνες που διατηρούν την ποιότητά τους κατά την κίνηση.

Ο έλεγχος της εικονικής κάμερας έχει επίσης βελτιωθεί, επιτρέποντας ακριβέστερη τοποθέτηση του φακού. Ωστόσο, το Veo 2 εξακολουθεί να αντιμετωπίζει προκλήσεις στη συνοχή και τη συνέπεια των παραγόμενων βίντεο.

Παράλληλα με το νέο video μοντέλο, η GOOGLE ανακοίνωσε βελτιώσεις στο μοντέλο δημιουργίας εικόνων, Imagen 3, το οποίο είναι διαθέσιμο στην πλατφόρμα ImageFX. Οι βελτιώσεις περιλαμβάνουν φωτεινότερες εικόνες με μεγαλύτερη λεπτομέρεια, καθώς και πρόσθετες περιγραφικές προτάσεις βάσει λέξεων-κλειδιών.

Εκπρόσωπος της GOOGLE επιβεβαίωσε ότι το Veo 2 θα διατεθεί στην πλατφόρμα Vertex AI μόλις η εταιρεία καταφέρει να φέρει σε πέρας την επέκταση της διαθεσιμότητάς του σε χρήστες και άλλων χωρών. Για την ώρα σ’ αυτό πρόσβαση έχουν μόνο οι χρήστες από ΗΠΑ και όχι αυτοί από την Ε.Ε.