Γιατί τόσος χαμός μ'αυτό το DEEPSEEK;

"Γιατί τόσο σούσουρο για τη DEEPSEEK και στην τελική, τι είναι αυτή η εταιρεία που έχω βαρεθεί να ακούω τις τελευταίες ημέρες;", σε ακούμε να λες. Διάβασε και θα καταλάβεις!

Η κινεζική startup DEEPSEEK, θυγατρική της χρηματιστηριακής εταιρείας HIGH-FLYER, έχει αναπτύξει ένα μοντέλο τεχνητής νοημοσύνης που ανταγωνίζεται τους παγκόσμιους κολοσσούς με κλάσμα του κόστους, προκαλώντας αναταραχή στη Wall Street και πτώση στις μετοχές εταιρειών όπως η META και η NVIDIA.

Η βασική καινοτομία της DEEPSEEK έγκειται στην αποδοτική χρήση υπολογιστικών πόρων. Το μοντέλο DEEPSEEK-V3 αναπτύχθηκε χρησιμοποιώντας μόλις 2.000 τσιπ NVIDIA, σε αντίθεση με τα 16.000 που απαιτούν συνήθως οι μεγάλες εταιρείες. Το συνολικό κόστος υπολογιστικής ισχύος ανήλθε σε μόλις 6 εκατομμύρια δολάρια, ποσό δέκα φορές μικρότερο από αυτό που δαπάνησε η META για το τελευταίο της μοντέλο.

Οι τεχνικές επιδόσεις του DEEPSEEK-V3 είναι εντυπωσιακές. Σύμφωνα με τυποποιημένα τεστ αξιολόγησης, το μοντέλο μπορεί να απαντά σε ερωτήσεις, να επιλύει λογικά προβλήματα και να γράφει κώδικα με την ίδια αποτελεσματικότητα όπως τα κορυφαία συστήματα της αγοράς. Η εταιρεία εφαρμόζει μια καινοτόμο προσέγγιση "μείγματος ειδικών", που επιτρέπει την αποδοτικότερη επεξεργασία δεδομένων ελαχιστοποιώντας τις καθυστερήσεις στη μεταφορά πληροφοριών.

Η απάντηση της OPENAI ήρθε με το μοντέλο o3, που εστιάζει στη "λογική σκέψη" για προβλήματα μαθηματικών, επιστήμης και προγραμματισμού. Ωστόσο, η DEEPSEEK αντέδρασε γρήγορα παρουσιάζοντας στις 20 Ιανουαρίου το δικό της μοντέλο λογικής σκέψης, το R1, το οποίο εντυπωσίασε την τεχνολογική κοινότητα. Και όχι μόνο για τις επιδόσεις του αλλά με το γεγονός ότι η εταιρεία ανάπτυξής του το παρέχει εντελώς δωρεάν σε όλους ως open-source λογισμικό, κάτι που εκτόξευσε τη δημοφιλία του.

Σύμφωνα με τον Tim Dettmers, ερευνητή στο Ινστιτούτο Τεχνητής Νοημοσύνης Allen και καθηγητή στο Carnegie Mellon, η μεθοδολογία της DEEPSEEK μπορεί να αναπαραχθεί από οποιαδήποτε εταιρεία. Αυτό υποδηλώνει ότι η τεχνολογία AI ενδέχεται να μετατραπεί σε ένα τυποποιημένο εμπορικό προϊόν με πολλούς παρόμοιους προμηθευτές.

Η εταιρεία έχει συγκεντρώσει μια ομάδα ταλαντούχων νέων ερευνητών από κορυφαία κινεζικά πανεπιστήμια, προσφέροντας ανταγωνιστικούς μισθούς και ευκαιρίες συμμετοχής σε πρωτοποριακά ερευνητικά έργα. Υπό την ηγεσία του κινέζου επιχειρηματία Liang Wenfeng, η DEEPSEEK έχει αναπτύξει διάφορα μοντέλα μεγάλης κλίμακας, με το πρώτο της chatbot να κυκλοφορεί στις 10 Ιανουαρίου.

Οι εξελίξεις αυτές έχουν προκαλέσει έντονο προβληματισμό στη Silicon Valley. Ο Marc Andreessen, επιφανής επενδυτής τεχνολογίας, χαρακτήρισε τη DEEPSEEK ως τη "στιγμή Σπούτνικ της τεχνητής νοημοσύνης", υπονοώντας ότι μπορεί να αλλάξει δραματικά τις ισορροπίες στον κλάδο, όπως συνέβη με τον διαστημικό ανταγωνισμό.

Η επίδραση στην αγορά ήταν άμεση, με τις μετοχές τεχνολογικών εταιρειών να σημειώνουν σημαντική πτώση, καθώς οι επενδυτές επαναξιολογούν τις προοπτικές των αμερικανικών εταιρειών στον τομέα της τεχνητής νοημοσύνης.