Το o1 της OpenAI λύνει σύνθετα προβλημάτα γρήγορα

Το νέο μοντέλο τεχνητής νοημοσύνης της OpenAI, με την ονομασία o1, υπόσχεται να φέρει επανάσταση στον τρόπο που τα συστήματα AI επιλύουν πολύπλοκα προβλήματα. Σύμφωνα με την εταιρεία, το o1 αποτελεί το πρώτο μέλος μιας νέας σειράς μοντέλων "συλλογισμού" που έχουν εκπαιδευτεί να απαντούν σε πιο σύνθετες ερωτήσεις, ταχύτερα από έναν άνθρωπο.

Ο Jerry Tworek, επικεφαλής έρευνας της OpenAI, δήλωσε ότι η εκπαίδευση πίσω από το o1 είναι θεμελιωδώς διαφορετική από τους προκατόχους του. Το μοντέλο έχει εκπαιδευτεί χρησιμοποιώντας έναν εντελώς νέο αλγόριθμο βελτιστοποίησης και ένα νέο σύνολο δεδομένων εκπαίδευσης ειδικά προσαρμοσμένο για αυτό. Σε αντίθεση με τα προηγούμενα μοντέλα GPT που εκπαιδεύτηκαν να μιμούνται μοτίβα από τα δεδομένα εκπαίδευσής τους, το o1 εκπαιδεύτηκε να επιλύει προβλήματα μόνο του χρησιμοποιώντας μια τεχνική γνωστή ως ενισχυτική μάθηση.

Η OpenAI υποστηρίζει ότι το o1 είναι πιο ακριβές από τους προκατόχους του. Ο Tworek ανέφερε ότι το μοντέλο παρουσιάζει λιγότερες "ψευδαισθήσεις" (hallucinations), αν και το πρόβλημα εξακολουθεί να υπάρχει. Το κύριο χαρακτηριστικό που διαφοροποιεί το o1 από το GPT-4o είναι η ικανότητά του να αντιμετωπίζει πολύπλοκα προβλήματα, όπως προγραμματισμός και μαθηματικά, πολύ καλύτερα από τους προκατόχους του, ενώ παράλληλα εξηγεί το συλλογισμό του.

Ο Bob McGrew, επικεφαλής ερευνητικός αξιωματικός της OpenAI, ανέφερε ότι το o1 ξεπέρασε τις προσωπικές του επιδόσεις στο τεστ μαθηματικών AP, παρά το γεγονός ότι ο ίδιος είχε δευτερεύουσα ειδίκευση στα μαθηματικά στο κολέγιο. Επιπλέον, το o1 πέτυχε εντυπωσιακή βαθμολογία 83% σε εξεταστική δοκιμασία για τη Διεθνή Μαθηματική Ολυμπιάδα, ενώ το GPT-4o είχε επιτύχει μόνο 13%.

Σε διαγωνισμούς προγραμματισμού γνωστούς ως Codeforces, το o1 έφτασε στο 89ο εκατοστημόριο των συμμετεχόντων. Η OpenAI ισχυρίζεται ότι η επόμενη ενημέρωση του μοντέλου θα έχει επιδόσεις παρόμοιες με αυτές των διδακτορικών φοιτητών σε απαιτητικές εργασίες αξιολόγησης στη φυσική, τη χημεία και τη βιολογία.

Ωστόσο, το o1 δεν είναι εξίσου ικανό με το GPT-4o σε πολλούς τομείς. Δεν τα πάει τόσο καλά σε θέματα που απαιτούν γνώσεις για τον κόσμο και δεν έχει τη δυνατότητα να περιηγηθεί στο διαδίκτυο ή να επεξεργαστεί αρχεία και εικόνες.

Η διεπαφή του o1 έχει σχεδιαστεί για να δείχνει τα βήματα συλλογισμού καθώς το μοντέλο σκέφτεται. Χρησιμοποιεί φράσεις όπως "Είμαι περίεργος για", "Σκέφτομαι" και "Ας δω", δημιουργώντας την ψευδαίσθηση της ανθρώπινης σκέψης. Ο Tworek διευκρίνισε ότι η OpenAI δεν εξισώνει τη σκέψη του μοντέλου AI με την ανθρώπινη σκέψη, αλλά η διεπαφή έχει σχεδιαστεί για να δείξει πώς το μοντέλο αφιερώνει περισσότερο χρόνο στην επεξεργασία και εμβαθύνει στην επίλυση προβλημάτων.

Το o1 διατίθεται μαζί με μια μικρότερη και φθηνότερη έκδοση, το o1-mini. Οι χρήστες του ChatGPT Plus και Team έχουν πρόσβαση και στα δύο μοντέλα από σήμερα, ενώ οι χρήστες Enterprise και Edu θα αποκτήσουν πρόσβαση την επόμενη εβδομάδα. Η OpenAI σχεδιάζει να παρέχει πρόσβαση στο o1-mini σε όλους τους δωρεάν χρήστες του ChatGPT, αν και δεν έχει ανακοινωθεί ακόμη ημερομηνία κυκλοφορίας.

Η πρόσβαση των προγραμματιστών στο o1 είναι αρκετά ακριβή. Στο API, το o1-preview κοστίζει 15 δολάρια ανά 1 εκατομμύριο tokens εισόδου και 60 δολάρια ανά 1 εκατομμύριο tokens εξόδου. Συγκριτικά, το GPT-4o κοστίζει 5 δολάρια ανά 1 εκατομμύριο tokens εισόδου και 15 δολάρια ανά 1 εκατομμύριο tokens εξόδου.

Για την OpenAI, το o1 αντιπροσωπεύει ένα βήμα προς τον ευρύτερο στόχο της για τεχνητή νοημοσύνη παρόμοια με την ανθρώπινη. Ο McGrew τόνισε ότι η εταιρεία έχει αφιερώσει πολλούς μήνες στην ανάπτυξη ικανοτήτων συλλογισμού, καθώς πιστεύει ότι αυτό αποτελεί το κρίσιμο σημείο για την πρόοδο προς επίπεδα νοημοσύνης παρόμοια με τα ανθρώπινα.