THEPOWERGAME
Οι πράκτορες Τεχνητής Νοημοσύνης (AI agents) θεωρούνται το επόμενο μεγάλο βήμα στον τομέα της τεχνητής νοημοσύνης, αλλά δεν υπάρχει μια ακριβής και ξεκάθαρη οριστική περιγραφή για το τι ακριβώς είναι. Μέχρι στιγμής, δεν υπάρχει συμφωνία σχετικά με το τι ακριβώς συνιστά έναν πράκτορα ΤΝ, αναφέρει το TechCrunch.
Και εξηγεί: Στην απλούστερη μορφή του, ένας πράκτορας ΑΙ μπορεί να περιγραφεί ως ένα λογισμικό, που υποστηρίζεται από τεχνητή νοημοσύνη και εκτελεί μια σειρά από εργασίες για εσάς, όπως θα έκανε στο παρελθόν ένας υπάλληλος εξυπηρέτησης πελατών, ένας εργαζόμενος σε τμήμα Ανθρώπινου Δυναμικού ή ένας υπάλληλος υποστήριξης IT. Ωστόσο, μπορεί να εμπλέκεται σε οποιοδήποτε είδος εργασίας. Του ζητάτε να κάνει κάτι, και το εκτελεί για εσάς, πολλές φορές διασχίζοντας πολλαπλά συστήματα και υπερβαίνοντας την απλή απάντηση ερωτήσεων.
Για παράδειγμα, η Perplexity κυκλοφόρησε τον περασμένο μήνα έναν πράκτορα ΑΙ, που βοηθάει τους ανθρώπους με τις αγορές τους για τις γιορτές. Επίσης, η Google ανακοίνωσε την προηγούμενη εβδομάδα τον πρώτο της πράκτορα ΑΙ, με την ονομασία Project Mariner, ο οποίος μπορεί να χρησιμοποιηθεί για την αναζήτηση πτήσεων και ξενοδοχείων, την αγορά ειδών για το σπίτι, την εύρεση συνταγών και άλλες εργασίες.
Πράκτορες ΑΙ: Οι διαφορετικές οπτικές των τεχνολογικών κολοσσών
Ακούγεται αρκετά απλό, ωστόσο, περιπλέκεται λόγω της έλλειψης σαφήνειας. Ακόμη και μεταξύ των τεχνολογικών κολοσσών, δεν υπάρχει συναίνεση. Η Google, για παράδειγμα, τους βλέπει ως βοηθούς που βασίζονται σε συγκεκριμένες εργασίες, όπως παροχή βοήθειας σε προγραμματιστές για τον προγραμματισμό, υποστήριξη σε marketers για τη δημιουργία χρωματικών συνδυασμών ή βοήθεια επαγγελματιών IT στην επίλυση προβλημάτων μέσω αναζήτησης δεδομένων καταγραφής.
Για την Asana, ένας πράκτορας μπορεί να λειτουργεί σαν ένας επιπλέον εργαζόμενος, αναλαμβάνοντας συγκεκριμένες εργασίες όπως θα έκανε ένας καλός συνάδελφος. Η Sierra, μια startup που ιδρύθηκε από τον πρώην συν-CEO της Salesforce, Bret Taylor, και τον ειδικό της Google, Clay Bavor, βλέπει τους πράκτορες ΑΙ ως εργαλεία εμπειρίας πελάτη, που βοηθούν τους χρήστες να επιτύχουν ενέργειες που ξεπερνούν κατά πολύ τις δυνατότητες των παλαιότερων chatbots και αντιμετωπίζουν πιο σύνθετα προβλήματα.
Αυτή η έλλειψη μιας συνολικής και σαφούς ορισμού αφήνει περιθώρια για σύγχυση σχετικά με το τι ακριβώς είναι αυτοί οι πράκτορες και τι θα κάνουν. Παρόλα αυτά, ανεξάρτητα από τον τρόπο που ορίζονται, οι πράκτορες ΑΙ στοχεύουν να βοηθούν στην ολοκλήρωση εργασιών με αυτοματοποιημένο τρόπο, περιορίζοντας στο ελάχιστο την ανθρώπινη παρέμβαση.
Η Rudina Seseri, ιδρύτρια και διευθύνουσα εταίρος της Glasswing Ventures, σημειώνει ότι βρισκόμαστε ακόμα σε αρχικό στάδιο, κάτι που εξηγεί την έλλειψη συμφωνίας. «Δεν υπάρχει ένας ενιαίος ορισμός για το τι είναι ένας πράκτορας Τεχνητής Νοημοσύνης. Ωστόσο, η πιο συχνή άποψη είναι ότι ένας πράκτορας είναι ένα ευφυές σύστημα λογισμικού σχεδιασμένο να αντιλαμβάνεται το περιβάλλον του, να συλλογίζεται πάνω σε αυτό, να λαμβάνει αποφάσεις και να αναλαμβάνει δράσεις για την επίτευξη συγκεκριμένων στόχων με αυτονομία», δήλωσε η Seseri στο TechCrunch.
Λέει ότι χρησιμοποιούν μια σειρά από τεχνολογίες Τεχνητής Νοημοσύνης (AI) για να το πετύχουν αυτό. «Αυτά τα συστήματα ενσωματώνουν διάφορες τεχνικές AI/ML, όπως η επεξεργασία φυσικής γλώσσας, η μηχανική μάθηση και η υπολογιστική όραση, ώστε να λειτουργούν σε δυναμικούς τομείς, είτε αυτόνομα είτε σε συνεργασία με άλλους πράκτορες και ανθρώπινους χρήστες».
Ο Aaron Levie, συνιδρυτής και CEO της Box, αναφέρει ότι με την πάροδο του χρόνου, καθώς η Τεχνητή Νοημοσύνη (AI) γίνεται πιο ικανή, οι πράκτορες ΑΙ θα μπορούν να κάνουν πολύ περισσότερα για λογαριασμό των ανθρώπων και ήδη υπάρχουν δυναμικές που θα οδηγήσουν σε αυτή την εξέλιξη.
«Με τους πράκτορες ΑΙ, υπάρχουν πολλαπλά στοιχεία σε έναν αυτοενισχυόμενο κύκλο, ο οποίος θα συμβάλει δραματικά στη βελτίωση των δυνατοτήτων τους τόσο βραχυπρόθεσμα όσο και μακροπρόθεσμα: η σχέση τιμής/απόδοσης των GPU, η αποδοτικότητα των μοντέλων, η ποιότητα και η ευφυΐα των μοντέλων, καθώς και οι βελτιώσεις στα πλαίσια και την υποδομή της ΤΝ», έγραψε πρόσφατα ο Levie στο LinkedIn.
Αυτή είναι μια αισιόδοξη άποψη για την τεχνολογία, που προϋποθέτει ότι θα υπάρξει ανάπτυξη σε όλους αυτούς τους τομείς, κάτι που δεν είναι απαραίτητα δεδομένο. Ο Rodney Brooks, πρωτοπόρος στη ρομποτική από το MIT, επεσήμανε σε μια πρόσφατη συνέντευξή του στο TechCrunch ότι η ΤΝ αντιμετωπίζει πολύ πιο δύσκολα προβλήματα σε σχέση με άλλες τεχνολογίες και δεν θα εξελιχθεί απαραίτητα με την ίδια ταχύτητα, όπως για παράδειγμα οι επεξεργαστές σύμφωνα με τον νόμο του Moore.
«Όταν ένας άνθρωπος βλέπει ένα σύστημα ΤΝ να εκτελεί μια εργασία, τείνει να τη γενικεύει αμέσως σε παρόμοια πράγματα και να εκτιμά την ικανότητα του συστήματος, όχι μόνο στην εκτέλεση της συγκεκριμένης εργασίας, αλλά και στη συνολική του επάρκεια», ανέφερε ο Brooks στη συνέντευξη. «Συνήθως είναι υπερβολικά αισιόδοξοι, επειδή βασίζονται σε ένα μοντέλο ανθρώπινης απόδοσης σε μια εργασία».
Το πρόβλημα είναι ότι η διασύνδεση μεταξύ συστημάτων είναι δύσκολη, κάτι που περιπλέκεται περαιτέρω από το γεγονός ότι ορισμένα παλαιότερα συστήματα στερούνται βασικής πρόσβασης μέσω API. Παρότι παρατηρούνται σταθερές βελτιώσεις, όπως ανέφερε ο Levie, η δυνατότητα του λογισμικού να αποκτά πρόσβαση σε πολλαπλά συστήματα και να επιλύει προβλήματα που προκύπτουν κατά τη διαδικασία μπορεί να αποδειχθεί πιο δύσκολη από ό,τι πολλοί φαντάζονται.
Αν αυτό ισχύει, τότε όλοι ίσως υπερεκτιμούν το τι θα έπρεπε να μπορούν να κάνουν οι πράκτορες ΤΝ. Ο David Cushman, ερευνητής στο HFS Research, βλέπει τη σημερινή γενιά bots περισσότερο όπως η Asana: ως βοηθούς που υποστηρίζουν τους ανθρώπους στην ολοκλήρωση συγκεκριμένων εργασιών, με στόχο την επίτευξη στρατηγικών στόχων που ορίζονται από τον χρήστη. Η πρόκληση είναι να μπορέσει μια μηχανή να διαχειριστεί ενδεχόμενα σενάρια με έναν πραγματικά αυτοματοποιημένο τρόπο, και είναι ξεκάθαρο ότι δεν είμαστε ακόμα κοντά σε αυτό το σημείο.
«Πιστεύω ότι είναι το επόμενο βήμα», είπε. «Είναι εκεί που η ΤΝ θα λειτουργεί ανεξάρτητα και αποτελεσματικά σε μεγάλη κλίμακα. Σε αυτό το πλαίσιο, οι άνθρωποι θα θέτουν κατευθυντήριες γραμμές και όρια και θα εφαρμόζουν πολλαπλές τεχνολογίες για να αφαιρέσουν τον άνθρωπο από τη διαδικασία — σε αντίθεση με τη μέχρι τώρα φιλοσοφία της συμμετοχής του ανθρώπου με τη Γενεσιουργό ΤΝ (GenAI)», ανέφερε. Το βασικό σημείο, όπως είπε, είναι να επιτρέψουμε στον πράκτορα ΤΝ να αναλάβει και να εφαρμόσει πραγματική αυτοματοποίηση.
Ο Jon Turow, συνεργάτης στην Madrona Ventures, τονίζει ότι αυτό θα απαιτήσει τη δημιουργία μιας υποδομής για πράκτορες ΤΝ, δηλαδή ενός τεχνολογικού stack σχεδιασμένου ειδικά για τη δημιουργία πρακτόρων (ανεξάρτητα από το πώς αυτοί ορίζονται). Σε πρόσφατη ανάρτησή του σε blog, ο Turow παρουσίασε παραδείγματα πρακτόρων ΤΝ που ήδη λειτουργούν και ανέλυσε πώς κατασκευάζονται σήμερα.
Σύμφωνα με την άποψη του Turow, η αυξανόμενη εξάπλωση των πρακτόρων Τεχνητής Νοημοσύνης (AI agents) —αν και αναγνωρίζει ότι ο ορισμός τους παραμένει ασαφής— απαιτεί μια τεχνολογική υποδομή όπως κάθε άλλη τεχνολογία. «Όλα αυτά σημαίνουν ότι η βιομηχανία μας έχει δουλειά να κάνει για να κατασκευάσει υποδομές που θα υποστηρίζουν τους πράκτορες ΤΝ και τις εφαρμογές που βασίζονται σε αυτούς», έγραψε στο άρθρο του.
«Με την πάροδο του χρόνου, η δυνατότητα συλλογισμού θα βελτιώνεται σταδιακά, τα εξελιγμένα μοντέλα θα αναλαμβάνουν μεγαλύτερο μέρος των ροών εργασίας, και οι προγραμματιστές θα θέλουν να επικεντρώνονται στο προϊόν και τα δεδομένα — τα στοιχεία που τους διαφοροποιούν. Θα επιθυμούν μια υποκείμενη πλατφόρμα που “απλά δουλεύει” με κλίμακα, απόδοση και αξιοπιστία».
Ένα άλλο σημαντικό σημείο είναι ότι, πιθανότατα, θα χρειαστούν πολλαπλά μοντέλα αντί για ένα μοναδικό Μεγάλο Γλωσσικό Μοντέλο (LLM) για να λειτουργήσουν οι πράκτορες, κάτι που έχει νόημα αν τους δούμε ως μια συλλογή διαφορετικών εργασιών. «Δεν πιστεύω ότι οποιοδήποτε μεμονωμένο, δημόσια διαθέσιμο, μονολιθικό Μεγάλο Γλωσσικό Μοντέλο μπορεί επί του παρόντος να διαχειριστεί πράκτορες. Δεν νομίζω ότι μπορούν ακόμη να κάνουν την πολυβηματική συλλογιστική που θα με ενθουσίαζε για το μέλλον των πρακτόρων. Νομίζω ότι πλησιάζουμε, αλλά δεν είμαστε εκεί ακόμα», είπε ο Fred Havemeyer, επικεφαλής έρευνας ΤΝ και λογισμικού στις ΗΠΑ για τη Macquarie US Equity Research.
«Πιστεύω ότι οι πιο αποτελεσματικοί πράκτορες θα είναι πιθανότατα συλλογές πολλαπλών διαφορετικών μοντέλων με ένα στρώμα δρομολόγησης που θα κατευθύνει αιτήματα ή εντολές στο πιο κατάλληλο μοντέλο. Θα είναι σαν έναν ενδιαφέρον [αυτοματοποιημένο] επιτηρητή που αναθέτει αρμοδιότητες», πρόσθεσε.
Τελικά, για τον Havemeyer, ο στόχος της βιομηχανίας είναι να φτάσει σε ένα σημείο όπου οι πράκτορες θα λειτουργούν ανεξάρτητα. «Σκεπτόμενος το μέλλον των πρακτόρων, θέλω να δω —και ελπίζω να δω— πράκτορες που είναι πραγματικά αυτόνομοι, ικανοί να λαμβάνουν αφηρημένους στόχους και να χαράσσουν όλα τα ενδιάμεσα βήματα πλήρως ανεξάρτητα», είπε στο TechCrunch.
Ωστόσο, η πραγματικότητα είναι ότι βρισκόμαστε ακόμα σε μια μεταβατική περίοδο όσον αφορά τους πράκτορες ΤΝ, και δεν γνωρίζουμε πότε θα φτάσουμε στο ιδανικό σημείο που περιέγραψε ο Havemeyer. Ενώ όσα έχουμε δει μέχρι τώρα αποτελούν σαφώς ένα ελπιδοφόρο βήμα προς τη σωστή κατεύθυνση, χρειάζονται ακόμα σημαντικές πρόοδοι και ανακαλύψεις για να λειτουργήσουν οι πράκτορες ΤΝ όπως οραματίζονται σήμερα. Είναι σημαντικό να κατανοήσουμε ότι δεν έχουμε φτάσει ακόμη εκεί.
Διαβάστε επίσης
Εισφορές: Τι αλλάζει από 1ης Ιανουαρίου για 1,6 εκατ. επαγγελματίες & αγρότες
Γαλλία: Η σύνθεση της νέας κυβέρνησης Φρανσουά Μπαϊρού
Irida Al Technologies: Η διεθνής επέκταση και η δασοπροστασία