THEPOWERGAME
Ο κινεζικός τεχνολογικός γίγαντας Alibaba λάνσαρε την Παρασκευή ένα νέο μοντέλο τεχνητής νοημοσύνης (AI) που, σύμφωνα με την εταιρεία, μπορεί να κατανοεί εικόνες και να πραγματοποιεί πιο σύνθετες συνομιλίες από τα προηγούμενα προϊόντα της εταιρείας, καθώς ο παγκόσμιος αγώνας για την ηγεσία στην τεχνολογία εντείνεται.
H Alibaba δήλωσε ότι τα δύο νέα του μοντέλα, Qwen-VL και Qwen-VL-Chat, θα είναι ανοικτού κώδικα – που σημαίνει ότι ερευνητές, ακαδημαϊκοί και εταιρείες παγκοσμίως μπορούν να τα χρησιμοποιήσουν για να δημιουργήσουν τις δικές τους εφαρμογές τεχνητής νοημοσύνης χωρίς να χρειάζεται να εκπαιδεύσουν τα δικά τους συστήματα, εξοικονομώντας έτσι χρόνο και έξοδα.
Όπως σημειώνει το CNBC, η Alibaba δήλωσε ότι το Qwen-VL μπορεί να απαντήσει σε ερωτήματα ανοικτού τύπου που σχετίζονται με διάφορες εικόνες και να δημιουργήσει λεζάντες εικόνων. Το Qwen-VL-Chat εν τω μεταξύ εξυπηρετεί πιο «σύνθετη αλληλεπίδραση», σύμφωνα με την Alibaba, όπως η σύγκριση πολλαπλών εισόδων εικόνας και η απάντηση σε πολλούς γύρους ερωτήσεων. Ορισμένες εργασίες που η Alibaba αναφέρει ότι το Qwen-VL-Chat μπορεί να εκτελέσει περιλαμβάνουν τη συγγραφή ιστοριών και τη δημιουργία εικόνων με βάση τις φωτογραφίες που εισάγει ένας χρήστης, καθώς και την επίλυση μαθηματικών εξισώσεων που εμφανίζονται σε μια εικόνα.
Ένα παράδειγμα που έδωσε η Alibaba είναι μια εισαγωγή που περιλαμβάνει μια νοσοκομειακή πινακίδα στην κινεζική γλώσσα. Η τεχνητή νοημοσύνη μπορεί να απαντήσει σε ερωτήσεις σχετικά με τις τοποθεσίες ορισμένων τμημάτων του νοσοκομείου ερμηνεύοντας την εικόνα της πινακίδας.
Μέχρι στιγμής, ένα μεγάλο μέρος της δημιουργικής Τεχνητής Νοημοσύνης – όπου η τεχνολογία παράγει απαντήσεις με βάση τις ανθρώπινες εισόδους – έχει επικεντρωθεί στην απάντηση σε κείμενο. Η τελευταία έκδοση του ChatGPT της OpenAI έχει επίσης τη δυνατότητα να κατανοεί εικόνες και να απαντά σε κείμενο, όπως το Qwen-VL-Chat.
Τα δύο τελευταία μοντέλα της Alibaba βασίζονται στο μεγάλο γλωσσικό μοντέλο της εταιρείας που ονομάζεται Tongyi Qianwen, το οποίο κυκλοφόρησε νωρίτερα φέτος. Ένα LLM είναι ένα μοντέλο τεχνητής νοημοσύνης που εκπαιδεύεται σε τεράστιες ποσότητες δεδομένων και υποστηρίζει εφαρμογές chatbot.
Η εταιρεία με έδρα την Χανγκζού άνοιξε αυτό το μήνα δύο άλλα μοντέλα ΤΝ. Αν και δεν θα αποφέρει στην Alibaba τέλη αδειοδότησης, η διανομή ανοικτού κώδικα θα βοηθήσει την εταιρεία να αποκτήσει περισσότερους χρήστες για το μοντέλο AI της – σε μια εποχή που το τμήμα cloud της εταιρείας επιδιώκει να αναζωπυρώσει την ανάπτυξη, καθώς ετοιμάζεται να εισαχθεί στο χρηματιστήριο.