Η μηχανική μετάφραση είναι ένα σχεδόν λυμένο πρόβλημα

Ο Vasco Pedro πάντοτε πίστευε ότι, παρά την άνοδο της τεχνητής νοημοσύνης (AI), το να μεταφράζουν οι μηχανές γλώσσες τόσο καλά όσο οι επαγγελματίες μεταφραστές, θα χρειαζόταν να έχουν έναν άνθρωπο στο βρόχο. Τότε είδε τα αποτελέσματα ενός διαγωνισμού που διεξήγαγε η Unbabel, η νεοφυής επιχείρησή του με έδρα τη Λισαβόνα, αντιπαραβάλλοντας το τελευταίο μοντέλο τεχνητής νοημοσύνης με τους μεταφραστές της εταιρεία του.

«Είπα… όχι, τελειώσαμε», λέει. «Οι άνθρωποι τέλειωσαν με τη μετάφραση». Ο κ. Pedro εκτιμά ότι η ανθρώπινη εργασία αντιπροσωπεύει σήμερα περίπου το 95% της παγκόσμιας μεταφραστικής βιομηχανίας. Στα επόμενα τρία χρόνια, πιστεύει, ότι η ανθρώπινη συμμετοχή θα μειωθεί σχεδόν στο μηδέν.

Δεν αποτελεί έκπληξη ότι οι κατασκευαστές μοντέλων τεχνητής νοημοσύνης είναι αισιόδοξοι, αλλά η αισιοδοξία τους φαίνεται να δικαιολογείται. Η μηχανική μετάφραση έχει γίνει τόσο αξιόπιστη και πανταχού παρούσα τόσο γρήγορα που πολλοί χρήστες δεν την βλέπουν πλέον. Οι πρώτες μεταφράσεις από υπολογιστή επιχειρήθηκαν πριν από 70 και πλέον χρόνια, όταν ένας υπολογιστής της IBM προγραμματίστηκε με ένα λεξιλόγιο 250 αγγλικών και ρωσικών λέξεων και έξι γραμματικούς κανόνες. Αυτή η «βάσει κανόνων» προσέγγιση αντικαταστάθηκε τη δεκαετία του 1990 από μια «στατιστική» προσέγγιση, βασισμένη στην επεξεργασία μεγάλων συνόλων δεδομένων, η οποία όταν το Google Translate ξεκίνησε το 2006, εξακολουθούσε να είναι η τελευταία λέξη της τεχνολογίας. Ο τομέας όμως εκτοξεύτηκε το 2016, όταν η Google μεταπήδησε σε μια «νευρωνική» μηχανή – τον πρόγονο των σημερινών μεγάλων γλωσσικών μοντέλων (LLM). Η επιρροή ήταν αμφίδρομη: όταν τα LLM έγιναν καλύτερα, βελτιώθηκε και η μηχανική μετάφραση.

Στη δοκιμή της Unbabel, οι μεταφραστές και η μηχανή κλήθηκαν να μεταφράσουν τα πάντα, από απλά κείμενα μέχρι σύνθετες νομικές συμβάσεις και τα αρχαϊκά αγγλικά μιας παλιάς μετάφρασης των «Εις εαυτόν» του Μάρκου Αυρήλιου. Το μοντέλο Τεχνητής Νοημοσύνης της Unbabel στάθηκε στο ύψος του. Αξιολογούμενο με βάση τα Multidimensional Quality Metrics, ένα πλαίσιο που παρακολουθεί την ποιότητα της μετάφρασης, οι άνθρωποι ήταν καλύτεροι από τις μηχανές εάν γνώριζαν άπταιστα και τις δύο γλώσσες και ήταν ειδικοί στο υλικό που μεταφράζεται (για παράδειγμα, εξειδικευμένοι νομικοί μεταφραστές που ασχολούνται με συμβάσεις). Ωστόσο, το προβάδισμα ήταν μικρό, λέει ο κ. Pedro, ο οποίος προσθέτει ότι είναι δύσκολο να δούμε πώς, σε δύο ή τρία χρόνια από τώρα, οι μηχανές δεν θα ξεπεράσουν εντελώς τους ανθρώπους.

Ο Marco Trombetti, επικεφαλής της Translated, με έδρα τη Ρώμη, δημιούργησε ένα διαφορετικό μέτρο για την ποιότητα των μηχανικών μεταφράσεων, που ονομάζεται Time to Edit (TTE). Πρόκειται για τον χρόνο που χρειάζεται ένας μεταφραστής για να ελέγξει ένα κείμενο που παράγεται από μια μηχανή. Όσο περισσότερα λάθη υπάρχουν στο μετάφρασμα, τόσο πιο αργά προχωράει ο άνθρωπος. Μεταξύ 2017 και 2022 ο TTE μειώθηκε από τρία δευτερόλεπτα ανά λέξη σε δύο στις δέκα πιο μεταφρασμένες γλώσσες. Ο κ. Trombetti προβλέπει ότι μέσα στα επόμενα δύο χρόνια θα πέσει στο ένα δευτερόλεπτο. Σε αυτό το σημείο, ο άνθρωπος προσθέτει ελάχιστα στη διαδικασία για τις περισσότερες εργασίες εκτός από αυτό που η Madeleine Clare Elish, επικεφαλής της υπεύθυνης τεχνητής νοημοσύνης στο Google Cloud, αποκαλεί «ηθική ζώνη λάθους»: ένα πρόσωπο που θα αναλάβει την ευθύνη όταν τα πράγματα πάνε στραβά, αλλά χωρίς καμία λογική προσδοκία βελτίωσης των αποτελεσμάτων.

Το πρόβλημα της μετάφρασης μιας πρότασης σε μια άλλη είναι «σχεδόν λυμένο» γι’ αυτές τις γλώσσες «υψηλού δυναμικού» με τα περισσότερα δεδομένα εκπαίδευσης, λέει ο Isaac Caswell, ερευνητής στο Google Translate. Ωστόσο, το να προχωρήσουμε πέρα από αυτό και να κάνουμε τη μηχανική μετάφραση τόσο καλή όσο ένας πολύγλωσσος άνθρωπος – ιδιαίτερα για τις μικρότερες γλώσσες που δεν έχουν πληθώρα διαθέσιμων δεδομένων εκπαίδευσης – θα είναι ένα πολύ δυσκολότερο έργο.

Οι σύνθετες μεταφράσεις αντιμετωπίζουν τα ίδια προβλήματα που ταλαιπωρούν τα LLM γενικά. Χωρίς την ικανότητα να σχεδιάζουν, να ανατρέχουν στη μακροπρόθεσμη μνήμη, να αντλούν από πραγματικές πηγές ή να αναθεωρούν το αποτέλεσμά τους, ακόμα και τα καλύτερα μεταφραστικά εργαλεία δυσκολεύονται με εκτενή βιβλία ή με εργασίες ακριβείας, όπως η διατήρηση ενός μεταφρασμένου τίτλου σε όλο το κείμενο. Ακόμα και εργασίες που ο άνθρωπος θεωρεί ασήμαντες, εξακολουθούν να τα οδηγούν σε αδιέξοδο. Για παράδειγμα, «ξεχνούν» μεταφράσεις για στατικές φράσεις όπως τα ονόματα καταστημάτων για παράδειγμα, μεταφράζοντάς τες εκ νέου, και συχνά με διαφορετικό τρόπο, κάθε φορά που τις συναντούν. Κάποιες φορές επίσης αυτοσχεδιάζουν πληροφορίες που δεν έχουν να τις ταιριάζουν στις γραμματικές δομές της γλώσσας-στόχου. «Για να έχεις την τέλεια μετάφραση, πρέπει επίσης να έχεις νοημοσύνη ανθρώπινου επιπέδου», λέει ο κ. Caswell. Χωρίς να είσαι ικανός ποιητής, είναι δύσκολο να μεταφράσεις ένα χαϊκού.

Αυτό βέβαια προϋποθέτει ότι οι χρήστες μπορούν να συμφωνήσουν τι είναι η τέλεια μετάφραση. Η μετάφραση είναι εδώ και καιρό ένας αγώνας μεταξύ «διαφάνειας» και «πιστότητας» – η επιλογή μεταξύ της μετάφρασης των προτάσεων ακριβώς όπως είναι στην πρωτότυπη γλώσσα ή ακριβώς όπως τις αισθάνεται το κοινό-στόχος. Μια διαφανής μετάφραση θα άφηνε μια ιδιωματική φράση ως έχει, αφήνοντας τους αγγλόφωνους να ακούσουν έναν Πολωνό να απορρίπτει ένα πρόβλημα λέγοντας «δεν είναι ούτε το τσίρκο μου, ούτε οι μαϊμούδες μου»- μια πιστή μπορεί να φτάσει ακόμα και στο σημείο να αλλάξει ολόκληρες πολιτισμικές αναφορές, ώστε οι Αμερικανοί να μην αιφνιδιαστούν από το «football-shaped», που χρησιμοποιείται για να περιγράψει ένα σφαιρικό αντικείμενο.

Ακόμα και αν υπήρχε μια επιλογή για την εναλλαγή μεταξύ διαφάνειας και πιστότητας, η τελειοποίηση της διεπαφής ενός τέτοιου συστήματος θα απαιτούσε τη βοήθεια της τεχνητής νοημοσύνης. Η μετάφραση μεταξύ γλωσσών μπορεί μερικές φορές να απαιτεί περισσότερες πληροφορίες από αυτές που υπάρχουν στο κείμενο: για παράδειγμα, για να μεταφράσει κάποιος το «μου αρέσεις» από τα αγγλικά στα ιαπωνικά, πρέπει να γνωρίζει το φύλο του ομιλητή, τη σχέση του με το άτομο στο οποίο απευθύνεται και ιδανικά το όνομά του για να αποφύγει την χρήση της αγενούς λέξης «εσύ». Ένας τέλειος μηχανικός μεταφραστής θα πρέπει να είναι σε θέση να ερμηνεύει και να αναπαράγει όλες αυτές τις λεπτές αποχρώσεις της γλώσσας και τους γραμματικούς τύπους.

Η προσθήκη τετραγωνιδίων ελέγχου και επιλογών σε μια διεπαφή θα προκαλούσε σύγχυση στους χρήστες. Στην πράξη, επομένως, ένας τέλειος μηχανικός μεταφραστής θα είναι ανθρώπινου επιπέδου τόσο στην ποιότητα της παραγωγής του όσο και στη μέθοδο εισαγωγής των πληροφοριών. Η απαίτηση να γίνονται συμπληρωματικές ερωτήσεις, να γνωρίζει κανείς πότε πρέπει να ανταλλάσσει τη διαφάνεια με την πιστότητα και να καταλαβαίνει τι εξυπηρετεί μια μετάφραση, σημαίνει ότι η προηγμένη μηχανική μετάφραση θα χρειάζεται περισσότερες πληροφορίες από το αρχικό κείμενο, λέει ο Jarek Kutylowski, ιδρυτής της DeepL, μιας γερμανικής νεοφυούς επιχείρησης. «Αν μπορούμε να δούμε τη διεύθυνση που στέλνετε το email, ίσως και το ιστορικό της συνομιλίας, μπορούμε να πούμε «Άρα, αυτό το άτομο είναι το αφεντικό σας» και να προσαρμόσουμε το κείμενο ανάλογα». (Το DeepL συνεργάζεται με τον Economist για την παροχή μεταφράσεων στο “Espresso”, μια εφαρμογή ροής πρωτόλειων ειδήσεων, η οποία είναι δωρεάν για φοιτητές).

Στη συνέχεια, υπάρχει το ζήτημα των γλωσσών «περιορισμένων πόρων», όπου η έλλειψη γραπτού κειμένου σημαίνει ότι η ακρίβεια των μεταφράσεων δεν βελτιώνεται από τις ανακαλύψεις των LLM που έχουν μεταμορφώσει την υπόλοιπη βιομηχανία. Σε αυτές τις περιπτώσεις, δοκιμάζονται προσεγγίσεις που απαιτούν λιγότερα δεδομένα. Μια ομάδα της Google, για παράδειγμα, δημιούργησε ένα σύστημα για να προσθέσει μετάφραση από ομιλία σε ομιλία για 15 αφρικανικές γλώσσες. Αντί να εκπαιδεύεται σε gigabytes δεδομένων ήχου, μαθαίνει να διαβάζει γραπτές λέξεις με τον ίδιο τρόπο που θα το έκανε ένα παιδί, συσχετίζοντας ήχους ομιλίας με ακολουθίες χαρακτήρων σε γραπτή μορφή.

Η ζωντανή μετάφραση είναι επίσης στα σκαριά. Το DeepL εγκαινίασε τον Νοέμβριο ένα σύστημα μετάφρασης από φωνή σε φωνή, προσφέροντας διερμηνεία για προσωπικές συνομιλίες και συνομιλίες μέσω βίντεο με πολλά μέλη. Η Unbabel, εν τω μεταξύ, έχει επιδείξει μια συσκευή ικανή να διαβάζει μικρές μυϊκές κινήσεις στους καρπούς ή τα φρύδια και να τις συνδυάζει με κείμενο που παράγεται από ένα LLM, ώστε να επιτρέπει την επικοινωνία χωρίς να χρειάζεται να μιλάμε ή να πληκτρολογούμε. Η εταιρεία σκοπεύει να ενσωματώσει την τεχνολογία σε μια βοηθητική συσκευή για άτομα με κινητική νευροπάθεια που δεν μπορούν πλέον να μιλήσουν μόνα τους.

Παρά την πρόοδο, και το δικό του ρόλο σε αυτή, ο κ. Caswell ελπίζει ότι η αξία της ομιλίας άλλων γλωσσών δεν θα εξαφανιστεί εντελώς. «Τα μεταφραστικά εργαλεία είναι πολύ χρήσιμα για την πλοήγηση στον κόσμο, αλλά δεν παύουν να είναι εργαλεία», λέει. «Δεν μπορούν να αντικαταστήσουν την ανθρώπινη εμπειρία της εκμάθησης μιας γλώσσας από την άποψη της πραγματικής κατανόησης της καταγωγής των άλλων και του πώς είναι να προέρχεσαι από διαφορετικό τόπο».

© 2024 The Economist Newspaper Limited. All rights reserved. Άρθρο από τον Economist, το οποίο μεταφράστηκε και δημοσιεύθηκε με επίσημη άδεια από την www.powergame.gr. Το πρωτότυπο άρθρο, στα αγγλικά, βρίσκεται στο www.economist.com

Διαβάστε επίσης

Τα κέρδη Βορίδη από τη διαγραφή Σαμαρά, η σκέψη για αγορά νέου πρωθυπουργικού τζετ και ο επικίνδυνος εφησυχασμός για τα γαλλικά ομόλογα

Κώστας Πηλαδάκης: Ο επιχειρηματίας με τα χρέη των 200 εκατ. ευρώ

Πώς η Ελλάδα θα κερδίσει το παιχνίδι της γεωθερμίας: Τα SOS και οι ευκαιρίες