APPLE:διευκρινίζει τη χρήση δεδομένων στην ανάπτυξη AI|G BLOG

Στον απόηχο μιας πρόσφατης έκθεσης που αποκάλυψε ότι πολλές εταιρείες χρησιμοποίησαν δεδομένα από μεταγραφές (transcripts) βίντεο του YouTube για την εκπαίδευση των συστημάτων τεχνητής νοημοσύνης τους, η APPLE έσπευσε να ξεκαθαρίσει τη θέση της σχετικά με τη χρήση και τα μελλοντικά σχέδια για το OpenELM, ένα μοντέλο που εκπαιδεύτηκε με τα αμφιλεγόμενα δεδομένα Pile.

Αφού η εταιρεία επανέλαβε τη δέσμευσή της στα δικαιώματα των δημιουργών και των εκδοτών, τόνισε ότι προσφέρει στους ιστότοπους τη δυνατότητα να εξαιρεθούν από τη χρήση των δεδομένων τους για την εκπαίδευση της APPLE Intelligence, μιας τεχνολογίας που παρουσιάστηκε στο WWDC 2024 και αναμένεται να ενσωματωθεί στο iOS 18.

Η APPLE επιβεβαίωσε ότι για την εκπαίδευση των μοντέλων της, συμπεριλαμβανομένης της επερχόμενης APPLE Intelligence, χρησιμοποιεί δεδομένα υψηλής ποιότητας. Αυτά περιλαμβάνουν αδειοδοτημένα δεδομένα από εκδότες, εικόνες αποθεμάτων και ορισμένα δημόσια διαθέσιμα δεδομένα από το διαδίκτυο. Ωστόσο, τα δεδομένα μεταγραφής του YouTube δεν προορίζονται για δημόσια χρήση, αν και δεν είναι σαφές αν είναι πλήρως κρυμμένα από την κοινή θέα.

Όσον αφορά το OpenELM, η APPLE διευκρίνισε ότι πρόκειται για ένα ερευνητικό εργαλείο που χρησιμοποιείται για τη μελέτη των μοντέλων γλώσσας. Σε μια σχετική δημοσίευση, οι ερευνητές της εταιρείας αναφέρουν ότι το μοντέλο εκπαιδεύτηκε με δεδομένα Pile. Ωστόσο, η APPLE τόνισε ότι το OpenELM προορίζεται αποκλειστικά για ερευνητικούς σκοπούς και δεν χρησιμοποιείται για να τροφοδοτήσει λειτουργίες τεχνητής νοημοσύνης σε οποιαδήποτε συσκευή της εταιρείας, συμπεριλαμβανομένων των iPhone, iPad και Mac.

Επιπλέον, η APPLE ανακοίνωσε ότι δεν σχεδιάζει να αναπτύξει μελλοντικές εκδόσεις του OpenELM. Η απόφαση αυτή μπορεί να προσφέρει κάποια ανακούφιση στους δημιουργούς περιεχομένου του YouTube, των οποίων τα δεδομένα χρησιμοποιήθηκαν χωρίς άδεια στο σύνολο δεδομένων Pile και κατ' επέκταση στο OpenELM.

Παρόλα αυτά, το ζήτημα της αρχικής συλλογής και χρήσης των δεδομένων από την EleutherAI, η οποία παρείχε το Pile, παραμένει ανοιχτό. Η εταιρεία φαίνεται να συνέλεξε δεδομένα από το YouTube χωρίς την άδεια της πλατφόρμας ή των δημιουργών, και στη συνέχεια τα διέθεσε σε εταιρείες όπως η APPLE.

Το επόμενο βήμα του YouTube σχετικά με αυτό το ζήτημα παραμένει άγνωστο. Ωστόσο, η APPLE έχει ξεκαθαρίσει ότη η χρήση του OpenELM ήταν μια εφάπαξ ενέργεια και ότι τα συγκεκριμένα δεδομένα δεν θα αποτελέσουν ποτέ μέρος της APPLE Intelligence.

Η υπόθεση αυτή αναδεικνύει τα περίπλοκα ζητήματα ηθικής και δεοντολογίας που προκύπτουν στην ανάπτυξη συστημάτων τεχνητής νοημοσύνης, ιδιαίτερα όσον αφορά τη χρήση και την προέλευση των δεδομένων εκπαίδευσης.