THEPOWERGAME
![Τεχνητή Νοημοσύνη © PIXABAY](https://www.powergame.gr/wp-content/uploads/2021/07/artificial-intelligence-3382507_1280-910x521.jpg)
Την κυκλοφορία του Llama-Krikri-8B για την υποστήριξη της ελληνικής γλώσσας στην εποχή της τεχνητής νοημοσύνης παρουσιάζει το Ινστιτούτο Επεξεργασίας του Λόγου (ΙΕΛ) του Ερευνητικού Κέντρου Αθηνά με αφορμή την Παγκόσμια Ημέρα της Ελληνικής Γλώσσας σήμερα Σάββατο 9 Φεβρουαρίου. Πρόκειται για ένα νέο μεγάλο γλωσσικο μοντέλο που έχει σχεδιαστεί ειδικά για την ελληνική γλώσσα βάσει του Llama 3.1-8B της Meta.
Το Llama-Krikri αποτελεί τη φυσική συνέχεια της προσπάθειας του ΙΕΛ να υποστηρίξει την ελληνική γλώσσα στην εποχή της τεχνητής νοημοσύνης, μετά την επιτυχία του Meltemi, του πρώτου ανοιχτού μεγάλου γλωσσικού μοντέλου για την παραγωγή ελληνικών κειμένων. Με άδεια Llama 3.1 Community License Agreement, το Llama-Krikri ενδυναμώνει τόσο την ερευνητική κοινότητα όσο και τις επιχειρήσεις που επιθυμούν να αναπτύξουν τεχνολογίες αιχμής με επίκεντρο τη γλώσσα μας.
Όπως περιγράφει το ΙΕΛ, κύρια χαρακτηριστικά του Llama-Krikri είναι:
- Βασίζεται στο γλωσσικό μοντέλο Llama 3.1-8B της Meta και έχει εκπαιδευτεί σε μεγάλου όγκου ποιοτικά γλωσσικά δεδομένα, για να προσαρμοστεί στις ιδιαιτερότητες της ελληνικής γλώσσας.
- Διαθέτει 8 δισεκατομμύρια παραμέτρους, επιτρέποντας προηγμένες γλωσσικές δυνατότητες χωρίς υψηλές υπολογιστικές απαιτήσεις.
- Υποστηρίζει τόσο τη σύγχρονη ελληνική όσο και την αγγλική γλώσσα, ενώ επιπλέον μπορεί να επεξεργάζεται πολυτονικό κείμενο και αρχαία ελληνικά. Μπορεί επίσης να επεξεργαστεί κείμενα σε επτά ακόμα γλώσσες τις οποίες υποστηρίζει το Llama-3.1.
- Προσφέρει μήκος συμφραζομένων (contextlength) 128k tokens, σε σύγκριση με τα 8k tokens του Μελτεμιού, επιτρέποντας μεγαλύτερο εύρος κατανόησης και απαντήσεων.
- Σε σχέση με το Meltemi, παρουσιάζει σημαντικές βελτιώσεις στην ακρίβεια όσον αφορά την παραγωγή φυσικής γλώσσας αλλά και κώδικα, προσφέροντας αναβαθμισμένες δυνατότητες στους χρήστες του.
Το Llama-Krikri αποτελεί ένα σημαντικό βήμα προς την ενίσχυση της ελληνικής γλώσσας στον ψηφιακό κόσμο, συνδέοντας τη γλωσσική κληρονομιά με τις πιο σύγχρονες εξελίξεις της τεχνητής νοημοσύνης.
Οι χρήστες μπορούν να δοκιμάσουν το νέο μοντέλο στο https://chat.ilsp.gr ή να το κατεβάσουν από το Hugging Face (θεμελιώδες μοντέλο Llama-Krikri-8B-Base και διαλογικό μοντέλο Llama-Krikri-8B-Instruct).
Διαβάστε επίσης
Έκρηξη ενδιαφέροντος για τα παλιά και διατηρητέα ακίνητα του κέντρου
Σπίτι μου 2: “Καραμπόλες” στις αιτήσεις από τα λιγοστά σπίτια στην αγορά
Ποιες προκλήσεις φρενάρουν την ανάπτυξη της πυρηνικής ενέργειας στην Ελλάδα