Ένα από τα κύρια σημεία του ενδιαφέροντος στην πρόσφατη παρουσίαση του νέου μοντέλου τεχνητής νοημοσύνης μεγάλης γλωσσικής κατανόησης (LLM) Gemini από τη GOOGLE, ήταν το βίντεο "Hands-on with Gemini".
Ωστόσο, εκπρόσωπος της GOOGLE αποκάλυψε στο Bloomberg πως το συγκεκριμένο βίντεο δεν γυρίστηκε σε πραγματικό χρόνο. Στην πραγματικότητα, η φωνητική αλληλεπίδραση με το Gemini που ακούν οι θεατές προστέθηκε σε μεταγενέστερο στάδιο παραγωγής.
Ο διευθύνων σύμβουλος της GOOGLE, Σουντάρ Πιτσάι, είχε μοιραστεί το συγκεκριμένο βίντεο πρόσφατα, τονίζοντας ότι ο καλύτερος τρόπος να γίνουν αντιληπτές οι αξιοσημείωτες δυνατότητες του Gemini είναι να τις δει κανείς σε δράση.
Ωστόσο, μία ένδειξη ότι τα πράγματα δεν ήταν όπως φαίνονταν υπήρχε στην περιγραφή του βίντεο στο YouTube. Εκεί αναφερόταν σε υποσημείωση πως "για αυτή την επίδειξη, η καθυστέρηση έχει ελαχιστοποιηθεί και οι απαντήσεις του Gemini έχουν συντμηθεί χάριν συντομίας”.
Ωστόσο, αυτή η διευκρίνιση θα μπορούσε να θεωρηθεί ως υποβάθμιση ή παραπλάνηση της πραγματικότητας. Το βίντεο δεν ήταν απλώς συντομευμένο αλλά δεν υπήρχε καμία πραγματική αλληλεπίδραση κατά τα γυρίσματα. Σύμφωνα με τον εκπρόσωπο της GOOGLE που μίλησε στο Bloomberg, το hands-on βίντεο ήταν φτιαγμένο “χρησιμοποιώντας στατικά καρέ και κείμενα-ερωτήματα”.
Επομένως, το Gemini απαντούσε μόνο σε prompt κειμένου και στατικές εικόνες που είχαν ανέβει. Η συζήτηση με το άτομο να μιλάει, να ζωγραφίζει και να αλληλεπιδρά με διάφορα αντικείμενα φαίνεται πως είχε στηθεί αποκλειστικά για τις ανάγκες της επίδειξης.
Εξετάζοντας ξανά το βίντεο υπό το πρίσμα των διευκρινίσεων, η αρχική εντύπωση ενός φυσικού συνομιλητή που είχαν ίσως οι θεατές, ξεκινά να «ξεθωριάζει».
Ο VP της GOOGLE DeepMind, Oriol Vinyals, δήλωσε πως το βίντεο επιδεικνύει το δυναμικό της εμπειρίας multi-modal αλληλεπίδρασης που μπορεί να δημιουργηθεί με το Gemini, με στόχο να εμπνεύσει προγραμματιστές. Ωστόσο και αυτός δέχθηκε κριτική γιατί επανέλαβε πως το βίντεο ήταν αληθινό και απλώς συντμημένο.
Υπάρχει πάντως η ελπίδα το συγκεκριμένο βίντεο της GOOGLE να κινητοποιήσει προγραμματιστές στο να αναπτύξουν το Gemini ώστε να λειτουργεί ακριβώς όπως στην επίδειξη. Διαφορετικά, ενδέχεται να δημιουργηθεί αίσθημα απογοήτευσης στο κοινό που παρακολούθησε το βίντεο.