Η OPENAI λανσάρει το Sora 2 με βελτιωμένη προσομοίωση φυσικών νόμων και δυνατότητα cameos

2 ημέρες πριν
Το Sora 2 προσφέρει συγχρονισμένη δημιουργία ήχου και βίντεο με υποστήριξη πολλαπλών λήψεων

Το νέο μοντέλο Sora 2 της OPENAI που δημιουργεί βίντεο απλά με μια προτροπή κειμένου, επικεντρώνεται στη βελτιωμένη προσομοίωση φυσικών νόμων και στη δημιουργία συνεπούς περιεχομένου σε πολλαπλές λήψεις. Η εταιρεία λανσάρει ταυτόχρονα μια κοινωνική εφαρμογή για iOS που επιτρέπει στους χρήστες να δημιουργούν cameos με τη δική τους εμφάνιση και φωνή.

Η OPENAI παρουσιάζει το Sora 2 ως σημαντική αναβάθμιση από τα πρώιμα demos προς ένα σύστημα που προσομοιώνει καλύτερα την αιτία και το αποτέλεσμα. Το μοντέλο σχεδιάστηκε να αναπαράγει καταστάσεις αποτυχίας και να τηρεί τους καθημερινούς φυσικούς νόμους που αναμένουν οι δημιουργοί, ενσωματώνοντας παράλληλα συγχρονισμένο διάλογο και sound design που ακολουθούν τις εντολές με μεγαλύτερη ακρίβεια.

Σύμφωνα με την εταιρεία, το Sora 2 διαχειρίζεται σενάρια που προηγουμένως δημιουργούσαν προβλήματα στους video generators, όπως ολυμπιακού επιπέδου γυμναστική και τούμπες σε paddleboard που σέβονται την άνωση και την ακαμψία. Ενώ παλαιότερα μοντέλα θα μπορούσαν να "τηλεμεταφέρουν" μια μπάλα μπάσκετ που αστόχησε μέσα στο καλάθι, το Sora 2 την αφήνει να αναπηδήσει από τη στεφάνη ή το ταμπλό. Η OPENAI χαρακτηρίζει την εξέλιξη ως βήμα προς έναν "γενικού σκοπού προσομοιωτή κόσμου".

Οι εντολές μπορούν πλέον να καλύπτουν πολλαπλές λήψεις διατηρώντας την κατάσταση της σκηνής, τη συνέχεια των χαρακτήρων και το blocking. Η εταιρεία υπογραμμίζει τη βελτιωμένη ακολουθία οδηγιών σε ρεαλιστικά, κινηματογραφικά και anime στυλ. Για παραγωγική χρήση, η δυνατότητα μεταφράζεται σε λιγότερες διακοπές συνέχειας κατά την εξέλιξη μιας σκηνής και μεγαλύτερη αξιοπιστία κατά την επανάληψη λήψεων.

Το Sora 2 μπορεί να δημιουργεί ήχους για χρήση στο παρασκήνιο, ομιλία και εφέ σε συγχρονισμό με τα οπτικά στοιχεία, όλα μέσα σε ένα ενιαίο σύστημα που ελέγχεται με prompts. Για γρήγορο previs, animatics ή περιεχόμενο κοινωνικών δικτύων, η συγκεκριμένη λειτουργία μειώνει την ανάγκη για ξεχωριστά εργαλεία ήχου.

Μια σημαντική νέα δυνατότητα επιτρέπει στους χρήστες να "ανεβάσουν" τον εαυτό τους. Μετά από μια σύντομη καταγραφή, το μοντέλο μπορεί να εισάγει την εμφάνιση και τη φωνή ενός ατόμου σε δημιουργημένες σκηνές με αξιοσημείωτη πιστότητα. Η OPENAI αναφέρει ότι η τεχνολογία γενικεύεται σε οποιονδήποτε άνθρωπο, ζώο ή αντικείμενο. Ο έλεγχος παραμένει στον κάτοχο του cameo, ο οποίος μπορεί να ανακαλέσει την πρόσβαση και να αφαιρέσει βίντεο που περιλαμβάνουν την ομοιότητά του.

Παράλληλα με το μοντέλο, η OPENAI λανσάρει μια εφαρμογή iOS με το όνομα Sora, διαθέσιμη μόνο στις Ηνωμένες Πολιτείες και τον Καναδά με σύστημα προσκλήσεων. Το feed είναι προσαρμοσμένο στα άτομα που ακολουθείτε και στις δημιουργίες που ενδέχεται να εμπνεύσουν τα δικά σας βίντεο. Η εταιρεία ισχυρίζεται ότι δίνει έμφαση σε μη εθιστικό σχεδιασμό, προαιρετικά controls εξατομίκευσης, ελέγχους ευημερίας και γονικό έλεγχο που μπορεί να περιορίσει το scrolling και να διαχειριστεί τα άμεσα μηνύματα για εφήβους.

Το προηγούμενο Sora 1 Turbo παραμένει διαθέσιμο, ενώ οι παλαιότερες δημιουργίες διατηρούνται στις βιβλιοθήκες των χρηστών. Η νέα πλατφόρμα στοχεύει να προσφέρει ένα περιβάλλον όπου οι δημιουργοί μπορούν να πειραματιστούν με τεχνητή νοημοσύνη στη δημιουργία βίντεο, διατηρώντας παράλληλα τον έλεγχο της προσωπικής τους εικόνας και φωνής.