Όσα περιμένουμε να έχει το ChatGPT-5 της OpenAI

Παρόλο που το πιο πρόσφατο μοντέλο της OpenAI, το GPT-4o, ανέβασε σημαντικά τον πήχη του μεγάλου γλωσσικού μοντέλου (LLM), η νεοφυής εταιρεία εργάζεται ήδη πάνω στο επόμενο μοντέλο-ναυαρχίδα της, το GPT-5.

Πριν από την ανοιξιάτικη εκδήλωση με την ανακοίνωση του GPT-4o, σύμφωνα με το ZDnet, πολλοί ήλπιζαν ότι η εταιρεία θα λανσάρει το πολυαναμενόμενο GPT-5. Για να περιορίσει τις εικασίες, ο διευθύνων σύμβουλος, Σαμ Άλτμαν, δημοσίευσε στο X: «not gpt-5, not a search engine».

We’ll be streaming live on https://t.co/OcO6MLUYGH at 10AM PT Monday, May 13 to demo some ChatGPT and GPT-4 updates.

— OpenAI (@OpenAI) May 10, 2024

Τώρα, μόλις δύο εβδομάδες αργότερα, σε ένα blog που μιλά για μια νέα Επιτροπή Ασφάλειας και Προστασίας που σχηματίστηκε από το διοικητικό συμβούλιο της OpenAI για να προτείνει αποφάσεις για την ασφάλεια και την προστασία, η startup επιβεβαίωσε ότι δούλευει πάνω στο επόμενο μοντέλο ναυαρχίδα της, πιθανότατα αναφερόμενη στο διάδοχο του GPT-4, GPT-5.

«Η OpenAI ξεκίνησε πρόσφατα την εκπαίδευση του επόμενου μοντέλου της και αναμένουμε ότι τα συστήματα που θα προκύψουν θα μας φέρουν στο επόμενο επίπεδο δυνατοτήτων στην πορεία μας προς την AGI (τεχνητή γενική νοημοσύνη)», ανέφερε η εταιρεία σε ανάρτηση στο blog της.

Παρόλο που μπορεί να περάσουν μήνες, αν όχι περισσότερο, μέχρι το GPT-5 να είναι διαθέσιμο για τους πελάτες -τα LLM μπορεί να χρειαστούν πολύ χρόνο για να εκπαιδευτούν- το ZDnet δημοσιεύει εικασίες για το τι θα μπορεί να κάνει το μοντέλο επόμενης γενιάς της OpenAI, ταξινομημένες από το λιγότερο συναρπαστικό στο πιο συναρπαστικό.

OpenAI: Καλύτερη ακρίβεια στο ChatGPT-5

Ακολουθώντας τις τάσεις του παρελθόντος, μπορούμε να περιμένουμε ότι το GPT-5 θα γίνει πιο ακριβής στις απαντήσεις της, καθώς θα εκπαιδευτεί σε περισσότερα δεδομένα. Τα γενετικά μοντέλα τεχνητής νοημοσύνης εξαρτώνται από τα δεδομένα εκπαίδευσης για να τροφοδοτήσουν τις απαντήσεις που παρέχουν. Επομένως, όσο περισσότερα δεδομένα χρησιμοποιούνται για την εκπαίδευση ενός μοντέλου, τόσο καλύτερη είναι η ικανότητα του μοντέλου να παράγει συνεκτικό περιεχόμενο, οδηγώντας σε καλύτερες επιδόσεις.

Σε κάθε μοντέλο που έχει κυκλοφορήσει μέχρι στιγμής, ο όγκος των δεδομένων εκπαίδευσης έχει αυξηθεί. Για παράδειγμα, αναφορές αναφέρουν ότι το GPT-3.5 εκπαιδεύτηκε σε 175 δισεκατομμύρια παραμέτρους, ενώ το GPT-4 εκπαιδεύτηκε σε 1 τρισεκατομμύριο. Πιθανότατα θα δούμε ακόμη μεγαλύτερο άλμα για το GPT-5.

Αυξημένη πολυτροπικότητα

Στην πρόβλεψη των δυνατοτήτων του GPT-5, μπορούμε να εξετάσουμε τις διαφορές μεταξύ κάθε σημαντικού μοντέλου-ναυαρχίδας μετά το GPT-3.5, συμπεριλαμβανομένων των GPT-4 και GPT-4o. Με κάθε αναβάθμιση, το μοντέλο γινόταν πιο έξυπνο και «καυχιόταν» για βελτιώσεις, συμπεριλαμβανομένων της τιμής, της ταχύτητας, του μήκους πλαισίου και της πολυτροπικότητας.

Το GPT-3.5 μπορεί να εισάγει και να εξάγει μόνο κείμενο. Με το GPT-4 Turbo, οι χρήστες μπορούν να εισάγουν κείμενο και εικόνα για να λαμβάνουν κείμενο. Με το GPT-4o, οι χρήστες μπορούν να εισάγουν έναν συνδυασμό κειμένου, ήχου, εικόνας και βίντεο και να λαμβάνουν οποιονδήποτε συνδυασμό εξόδων κειμένου, ήχου και εικόνας.

Ακολουθώντας αυτή την τάση, το επόμενο βήμα για το GPT-5 θα μπορούσε να είναι η δυνατότητα εξόδου βίντεο. Τον Φεβρουάριο, η OpenAI παρουσίασε το μοντέλο Sora που μετατρέπει το κείμενο σε βίντεο, το οποίο μπορεί να ενσωματωθεί στο GPT-5 για την παραγωγή βίντεο.

Η ικανότητα αυτόνομης δράσης (AGI)

Δεν υπάρχει αμφιβολία ότι τα chatbots είναι εντυπωσιακά εργαλεία τεχνητής νοημοσύνης ικανά να βοηθήσουν τους ανθρώπους σε πολλές εργασίες, όπως η δημιουργία κώδικα, τύπων Excel, δοκιμίων, βιογραφικών σημειωμάτων, εφαρμογών, διαγραμμάτων, πινάκων και άλλων. Ωστόσο, υπάρχει μια αυξανόμενη επιθυμία για τεχνητή νοημοσύνη που γνωρίζει τι θέλετε να γίνει και μπορεί να το κάνει με ελάχιστες οδηγίες – ένα δόγμα της τεχνητής γενικής νοημοσύνης ή AGI.

Το GPT-5 είναι απίθανο να είναι πλήρως ικανό για AGI, αλλά θα μπορούσε να είναι ικανό να χρησιμοποιεί αυτόνομους τρόπους για την επίτευξη ενός τελικού στόχου, συλλογιζόμενο τι πρέπει να γίνει, σχεδιάζοντας πώς να το κάνει και εκτελώντας την εργασία.

Για παράδειγμα, σε ένα ιδανικό σενάριο, θα μπορούσατε να ζητήσετε από το GPT-5, να «παραγγείλει ένα χάμπουργκερ από τα McDonald’s για μένα». Το μοντέλο τεχνητής νοημοσύνης θα μπορούσε στη συνέχεια να χρησιμοποιήσει agents για να ολοκληρώσει μια σειρά εργασιών που περιλαμβάνουν το άνοιγμα του ιστότοπου της McDonald’s και την εισαγωγή της παραγγελίας σας, της διεύθυνσης και του τρόπου πληρωμής. Το μόνο για το οποίο θα πρέπει να ανησυχείτε είναι να φάτε το μπέργκερ.

Το Rabbit προσπαθεί να επιτύχει κάτι παρόμοιο, δημιουργώντας ένα gadget που μπορεί να χρησιμοποιήσει agents για να δημιουργήσει μια εμπειρία χωρίς επαφή με εργασίες στον πραγματικό κόσμο, όπως η κράτηση ενός Uber ή η παραγγελία φαγητού. Το R1 του Rabbit έχει εξαντληθεί σε πωλήσεις πολλές φορές, παρά το γεγονός ότι δεν μπορεί να εκτελέσει τις πιο προηγμένες εργασίες που αναφέρθηκαν παραπάνω.

Ως το επόμενο σύνορο της AI, η AGI θα μπορούσε να αναβαθμίσει πλήρως το είδος της βοήθειας που λαμβάνουμε από την AI και να αλλάξει εντελώς τον τρόπο με τον οποίο σκεφτόμαστε τους βοηθούς.

Διαβάστε επίσης:

Bulgari: Η πολυτελέστερη συλλογή στην επέτειο των 140 χρόνων

Κάννες: Τα ρολόγια που εντυπωσίασαν στο “κόκκινο χαλί”

BloombergNEF: Σχεδόν 215 τρισ. θα κοστίσει στον πλανήτη το καθαρό μηδέν μέχρι το 2050