Η εταιρεία λανσάρισε μία νέα ιστοσελίδα για να αποκαλύψει το «Κώδικας ως Πολιτικές» (CAP, Code as Policies), όπου προτροπές/εντολές γραμμένες σε απλά αγγλικά μπορούν να ερμηνευτούν/μεταφραστούν σε προγράμματα παραγωγής γλωσσικών μοντέλων (LMPs) γραμμένα σε κώδικα Python.
Το CAP είναι ο διάδοχος του PaLM-SayCan, ένα πρότζεκτ που με παρόμοιο τρόπο επέτρεπε τον χειρισμό ενός φυσικού βοηθητικού ρομπότ μέσω εντολών σε απλά αγγλικά. Το CAP υπόσχεται να επιτρέψει την εκτέλεση πιο περίπλοκων εργασιών με αυξημένη ακρίβεια, κατά μέρος επειδή θα επιτρέπει στις μηχανές να γράφουν τον δικό τους κώδικα.
Σε μια ανάρτηση στο επίσημο blog της Google για τη διάθεση του CAP, ο ασκούμενος στο τμήμα ερευνών της Google, Jacky Liang και ο επιστημονικός ερευνητής Andy Zeng περιγράφουν τo κίνητρο για την ανάπτυξη της τεχνολογίας και τι μπορεί να σημαίνει για το μέλλον.
«Τι θα γινόταν αν μετά από οδηγίες/εντολές που δόθηκαν από ανθρώπους, τα ρομπότ μπορούσαν να γράψουν αυτόνομα τον δικό τους κώδικα για να αλληλοεπιδράσουν με τον κόσμο; [...] Με τις εντολές φυσικής γλώσσας, τα τρέχοντα γλωσσικά μοντέλα μπορούν όχι μόνο να προχωρήσουν στη σύνταξη κώδικα αλλά, όπως ανακαλύψαμε, κώδικα που μπορεί επίσης να ελέγξει τις ίδιες τις ενέργειες του ρομπότ».
Σε δοκιμές που πραγματοποιήθηκαν, οι ερευνητές της Google έδειξαν ότι τα ρομπότ μπορούσαν να «σχεδιάσουν ένα εξάγωνο 5 εκατοστών στη μέση» (ενός λευκού πίνακα) και «να βάλουν τουβλάκια οριζόντια σε μία γραμμή στο άνω τμήμα» (σε ένα οριοθετημένο τετράγωνο).
Στην εργασία τους με τίτλο «Κώδικας ως Πολιτικές: Προγράμματα Γλωσσικών Μοντέλων για Ενσωματωμένο Έλεγχο» η ομάδα του πρότζεκτ κατέληξε στο συμπέρασμα ότι το CAP δεν έχει επί του παρόντος την ικανότητα να ανταπεξέλθει σε ιδιαίτερα αφηρημένες ή σύνθετες εντολές ή να αντιληφθεί περιγραφές για τροχιές. Η προσέγγιση της ομάδας δεν έλαβε επίσης υπόψη την τροφοδοσία αδύνατων εντολών μέσω του CAP.
Θεωρητικά, η φύση ανοικτού κώδικα της «ρομποτοκεντρικής» εφαρμογής των LMPs στην Python θα μπορούσε να οδηγήσει στην ταχύτερη εφαρμογή λύσεων σε τέτοια ζητήματα. Η ιστοσελίδα για το CAP προσφέρει διάφορα releases μέσω του Github καθώς και ένα διαδραστικό demo μέσω του Google Colab που περιγράφει πως τα ρομπότ «γράφουν» κώδικα ως απάντηση/ανταπόκριση σε εντολές.