Το Sora της OpenAI μετατρέπει κείμενο σε βίντεο και μας αφήνει με το στόμα ανοιχτό

1 μήνας πριν
sora ai image with mammoths

Η OpenAI, ηγέτιδα εταιρεία στον τομέα της τεχνητής νοημοσύνης, κάνει την είσοδό της και στο πεδίο της παραγωγής βίντεο, με την αποκάλυψη του πρώτου της μοντέλου κειμένου σε βίντεο, το Sora. Το Sora ξεχωρίζει για την ικανότητά του να δημιουργεί περιεχόμενο που κρίνεται εντυπωσιακά ρεαλιστικό και σίγουρα δεν θυμίζει σε τίποτα παρόμοιες προσπάθειες που είδαμε ακόμα και πριν από 10 μήνες, δείγμα του τρελού ρυθμού με τον οποίο εξελίσσεται η συγκεκριμένη AI τεχνολογία.

Η ανακοίνωση αυτή έρχεται μετά την κυκλοφορία αντίστοιχων εργαλείων από ανταγωνιστές όπως το Stability AI ωστόσο, η OpenAI φαίνεται να έχει δώσει έμφαση στην ποιότητα πριν την επίσημη κυκλοφορία του προϊόντος της. Σύμφωνα με την επίσημη σελίδα, το Sora μπορεί να παράγει "ρεαλιστικές και φανταστικές σκηνές" από ένα απλό κείμενο που απλά περιγράφει το τι θέλει να δημιουργηθεί σε βίντεο μορφή.

Το Sora διαθέτει τεχνολογία που του επιτρέπει να κατανοεί πώς άνθρωποι και αντικείμενα αντιδρούν στον φυσικό κόσμο, επιτρέποντάς του να δημιουργεί σκηνές με πολλαπλούς ανθρώπους, διάφορους τύπους κινήσεων, εκφράσεις προσώπου, υφές και αντικείμενα με υψηλό επίπεδο λεπτομέρειας. Τα παραγόμενα βίντεο αποφεύγουν την πλαστική όψη ή τις εφιαλτικές μορφές που παρατηρούνται σε άλλο περιεχόμενο AI.

Το Sora είναι επίσης πολυμορφικό, καθώς οι χρήστες θα μπορούν να ανεβάσουν μια στατική εικόνα για να χρησιμεύσει ως βάση για ένα βίντεο. Το περιεχόμενο της εικόνας θα αναβιώσει με έμφαση στις λεπτομέρειες. Μπορεί επίσης να πάρει ένα υπάρχον βίντεο και να το επεκτείνει ή να συμπληρώσει τα καρέ που λείπουν, δυνατότητες που μόνο να τις διαβάζουμε ακούγονται απλά εκπληκτικές.

Παρόλο που το Sora εντυπωσιάζει, σε κάθε περίπτωση δεν είναι τέλειο. Η OpenAI παραδέχεται ότι το μοντέλο της έχει αδυναμίες, όπως τη δυσκολία στην προσομοίωση της φυσικής κίνησης των αντικειμένων, τη σύγχυση αριστερά και δεξιά, καθώς και την παρερμηνεία στιγμών αιτίας και αποτελέσματος. Για παράδειγμα, αν κάποιος δαγκώσει ένα μπισκότο, το Sora εμφανίζει το μπισκότο όπως και πριν χωρίς κάποια άλλα σημάδια δαγκώματος.

Η εταιρεία σκοπεύει να συνεργαστεί με την ομάδα "red teamers", που αποτελείται από ειδικούς του κλάδου, για να αξιολογήσει κρίσιμους τομείς για πιθανές βλάβες ή κινδύνους. Στόχος και των δύο είναι να διασφαλίσουν ότι το Sora δεν θα παράγει ψευδείς πληροφορίες, μισαλλόδοξο περιεχόμενο ή να έχει οποιαδήποτε μορφή προκατάληψης. Επιπλέον, η OpenAI θα εφαρμόσει έναν ταξινομητή κειμένου για να απορρίπτει ερεθίσματα που παραβιάζουν την πολιτική της, όπως αιτήματα για σεξουαλικό περιεχόμενο, βίαια βίντεο και παρόμοια.

Δεν υπάρχει ακόμη επίσημη ανακοίνωση για την ημερομηνία λανσαρίσματος του Sora.