Η πρώτη εφαρμογή που ενσωματώνει τις ικανότητες αναγνώρισης εικόνας του GPT-4 χαρακτηρίστηκε από χρήστες με προβλήματα όρασης ως κάτι "που τους αλλάζει τη ζωή”.
Η Be My Eyes, μια δανέζικη startup, εφάρμοσε το μοντέλο τεχνητής νοημοσύνης σε μια νέα λειτουργία για τυφλά ή άτομα με μερική όραση. Με την ονομασία "Virtual Volunteer", το εργαλείο αναγνώρισης αντικειμένων μπορεί να απαντήσει σε ερωτήσεις σχετικά με οποιαδήποτε εικόνα που του αποστέλλεται.
Φαντάσου, για παράδειγμα, ότι ένας χρήστης πεινάει. Θα μπορούσε απλώς μέσω του smartphone του να φωτογραφίσει ένα συστατικό και να ζητήσει σχετικές συνταγές.
Αν προτιμά να φάει έξω, μπορεί να ανεβάσει την εικόνα ενός χάρτη και να λάβει οδηγίες για ένα εστιατόριο. Κατά την άφιξη, μπορεί να τραβήξει μια φωτογραφία του μενού και να ακούσει τις επιλογές. Αν στη συνέχεια θέλει να χάσει τις προστιθέμενες θερμίδες σε ένα γυμναστήριο, μπορεί να χρησιμοποιήσει την κάμερα του smartphone του για να βρει έναν ελεύθερο διάδρομο.
«Ξέρω ότι βρισκόμαστε αυτή τη στιγμή στη μέση μιας διαφημιστικής εκστρατείας για την τεχνητή νοημοσύνη όμως αρκετοί από τους χρήστες που δοκιμάζουν την εφαρμογή, χρησιμοποίησαν τη φράση ότι "τους άλλαξε τη ζωή" όταν περιέγραφαν το προϊόν», αναφέρει ο Mike Buckley, ο διευθύνων σύμβουλος της By My Eyes.
«Η εφαρμογή δίνει την ευκαιρία να φέρει σημαντικές αλλαγές και να ενδυναμώσει την κοινότητα με πρωτοφανείς πόρους για την καλύτερη πλοήγηση σε φυσικά περιβάλλοντα, την αντιμετώπιση καθημερινών αναγκών και την απόκτηση μεγαλύτερης ανεξαρτησίας».
Το Virtual Volunteer εκμεταλλεύεται στην ουσία μια αναβάθμιση της υπηρεσίας της OpenAI. Σε αντίθεση με τις προηγούμενες εκδόσεις των περίφημων γλωσσικών μοντέλων της εταιρείας, το GPT-4 είναι πολυμορφικό, πράγμα που σημαίνει ότι μπορεί να αναλύει τόσο εικόνες όσο και κείμενο που εισάγει ο χρήστης.
Η Be My Eyes άδραξε την ευκαιρία να δοκιμάσει τη νέα λειτουργία. Ενώ τα συστήματα μετατροπής κειμένου σε εικόνα δεν είναι κάτι καινούργιο, η νεοσύστατη επιχείρηση δεν είχε ποτέ προηγουμένως πειστεί για την απόδοση του λογισμικού.
«Από τα πάρα πολλά λάθη μέχρι την αδυναμία συνομιλίας, τα εργαλεία που ήταν διαθέσιμα στην αγορά δεν ήταν εξοπλισμένα για να λύσουν πολλές από τις ανάγκες της κοινότητάς μας», δηλώνει ο Buckley. «Η αναγνώριση εικόνας που προσφέρει το GPT-4 είναι ανώτερη και τα αναλυτικά και συνομιλιακά επίπεδα που τροφοδοτούνται από το OpenAI αυξάνουν την αξία και τη χρησιμότητα εκθετικά».
Το Be My Eyes υποστήριζε προηγουμένως τους χρήστες του αποκλειστικά με ανθρώπινους εθελοντές. Σύμφωνα με την OpenAI, η νέα λειτουργία μπορεί να δημιουργήσει το ίδιο επίπεδο πλαισίου και κατανόησης. Όμως αν ο χρήστης δεν λάβει καλή απάντηση ή απλά προτιμά μια ανθρώπινη σύνδεση, μπορεί πάντα να καλέσει έναν εθελοντή.
Παρά τα πολλά υποσχόμενα πρώιμα αποτελέσματα, ο Buckley επιμένει ότι η δωρεάν υπηρεσία θα αναπτυχθεί με προσοχή. Όσοι δοκιμάζουν την υπηρεσία που βρίσκεται σε beta έκδοση, καθώς και η ευρύτερη κοινότητα, θα διαδραματίσουν κεντρικό ρόλο στον καθορισμό αυτής της διαδικασίας. Ο ίδιος ο Buckley πιστεύει ότι η πλατφόρμα θα παρέχει στους χρήστες τόσο υποστήριξη όσο και ευκαιρίες. Το Be My Eyes θα βοηθήσει επίσης σύντομα τις επιχειρήσεις να εξυπηρετήσουν καλύτερα τους πελάτες τους, δίνοντας προτεραιότητα στην προσβασιμότητα.
«Είναι ασφαλές να πούμε ότι η τεχνολογία θα μπορούσε να δώσει στους ανθρώπους που είναι τυφλοί ή έχουν χαμηλή όραση όχι μόνο περισσότερη δύναμη, αλλά και μια πλατφόρμα ώστε να μοιράζονται ακόμα περισσότερα από τα ταλέντα τους με τον υπόλοιπο κόσμο», λέει ο Buckley. «Για μένα, αυτή είναι μια απίστευτα συναρπαστική δυνατότητα».