THEPOWERGAME
Στοιχεία αποδεικνύουν πως η κινεζική DeepSeek χρησιμοποίησε μοντέλα της OpenAI για να εκπαιδεύσει ανταγωνιστικό μοντέλο ανοικτού κώδικα, το οποίο φέρεται να έχει κατασκευαστεί με αισθητά χαμηλότερο κόστος. Η OpenAI αποκάλυψε στους Financial Times πως βρέθηκαν ίχνη «διύλισης» που υποψιάζεται πως προέρχονται από την DeepSeek. Προ ημερών, η κινεζική νεοφυής εταιρεία (start-up) κλόνισε την πεποίθηση πως πρέπει να δαπανηθούν δισεκατομμύρια δολάρια σε μοντέλα αναπαραγωγικής τεχνητής νοημοσύνης. Στις αρχές της εβδομάδας, η αβεβαιότητα αυτή οδήγησε σε μαζικές ρευστοποιήσεις ενός τρισ. δολαρίων, κυρίως, από τους τεχνολογικούς κολοσσούς των ΗΠΑ.
Εάν οι υποψίες της OpenAI είναι βάσιμες και ευσταθούν τότε αυτό σημαίνει πως η DeepSeek έχει παραβιάσει τα πνευματικά δικαιώματα των μοντέλων της εταιρείας που εδρεύει στο Σαν Φρανσίσκο, προκαλώντας πανικό στις διεθνείς αγορές με την κυκλοφορία του R1 στις 20 Ιανουαρίου. Το συγκεκριμένο μοντέλο βρέθηκε μέσα σε λίγα 24ώρα στην κορυφή του AppStore της Apple καθώς έχει την ιδιότητα να φιλτράρει πρώτα τις απαντήσεις για να είναι πιο ολοκληρωμένες με μια μέθοδο συλλογιστικής.
Τέλη Δεκεμβρίου, η DeepSeek είχε ήδη παρουσιάσει το V3, ισχυριζόμενη πως χρειάστηκαν λιγότερα από έξι εκατ. δολάρια για να κατασκευαστεί και μάλιστα μέσα σε δυο μήνες, σύμφωνα με το CBS News. Υποτίθεται πως το R1 τροφοδοτείται από το V3 που είναι μεγάλο γλωσσικό μοντέλο, αναφέρει η Business Plus. Το γεγονός πως τα μοντέλα αυτά είναι ανοικτού κώδικα σημαίνει, επίσης, πως επιτρέπουν στους πάντες να τα μελετήσουν, να τα αντιγράψουν και να βελτιώσουν τις δυνατότητες τους.
Η «διύλιση» είναι μια τεχνική που χρησιμοποιείται για να αναβαθμιστούν οι επιδόσεις μικρότερων μοντέλων στην τεχνητή νοημοσύνη με την αξιοποίηση στοιχείων από μεγαλύτερα και πιο ικανά μοντέλα, επιτρέποντας έτσι να επιτευχθούν ανάλογα αποτελέσματα σε συγκεκριμένες εργασίες και με χαμηλότερο κόστος. Είναι κοινή πρακτική στην τεχνολογία. Όμως εγείρονται φόβοι πως η DeepSeek την χρησιμοποίησε για να δημιουργήσει ένα ανταγωνιστικό μοντέλο, παραβιάζοντας τα πνευματικά δικαιώματα των μοντέλων της OpenAI. Το γεγονός, επίσης, πως τα μοντέλα της DeepSeek είναι ανοικτού κώδικα μπορεί να σημαίνει πως στοιχεία από το ChatGPT της OpenAI είναι ανοικτά σε «κοινή θέα» την ώρα που η πολιτική της εταιρείας είναι αντίθετη.
Η OpenAI μαζί με την Microsoft διερεύνησαν από πέρσι λογαριασμούς που θεωρούν πως ανήκουν στην DeepSeek. Οι λογαριασμοί αυτοί χρησιμοποιούσαν την Διασύνδεση Προγραμματισμού Εφαρμογών (API) της OpenAI και μπλοκαρίστηκαν με την υποψία πως παραβίαζαν τους «όρους χρήσης». Οι πληροφορίες αυτές ήρθαν στο φως της δημοσιότητας πρώτα από το Bloomberg. Αναφορά στην πιθανότητα να έχουν χρησιμοποιηθεί μοντέλα τεχνητής νοημοσύνης της OpenAI έκανε, επίσης, ο πρόεδρος των ΗΠΑ, Ντόναλντ Τραμπ.
Μερίδα αναλυτών έχουν, επίσης, επισημάνει πως το μοντέλο V3 της DeepSeek απαντούσε με τρόπο που υποδείκνυε πως είχε «εκπαιδευτεί» από το GhatGPT-4 της OpenAI. «Είναι κοινή πρακτική για τις νεοφυείς εταιρείες και τους ακαδημαϊκούς να χρησιμοποιούν στοιχεία από μεγάλα γλωσσικά μοντέλα (LLMs), όπως το ChatGPT, για να εκπαιδεύσουν ένα άλλο μοντέλο», δήλωσε ο Ρίτγουικ Γκούπτα, υποψήφιος διδακτορικού στην ΑΙ, στο Πανεπιστήμιο Μπέρκλεϊ της Καλιφόρνια, στους Financial Times.
Διαβάστε επίσης
Οι 7 ανατροπές στα ακίνητα το 2025
Η χρηματοδότηση καθυστερεί τις επεκτάσεις του Μετρό
Ο Τραμπ, ο Σολτς και οι νέες ενεργειακές προκλήσεις μετά τις κάλπες της 23ης Φεβρουαρίου