Η διερμηνεία και η μετάφραση της ζωντανής ομιλίας είναι πολύ πιο δύσκολη από την απλή μετάφραση γραπτού κειμένου. Αντίθετα με τους ανθρώπινους εγκεφάλους, οι μηχανές συνήθως πρέπει να περάσουν από τρεις ξεχωριστές φάσεις για να μετατρέψουν την προφορική επικοινωνία από τη μία γλώσσα στην άλλη.
Αρχικά, η ομιλία θα πρέπει να ερμηνευτεί από τη μηχανή και να μεταγραφεί σε κείμενο, το οποίο στη συνέχεια θα μεταφραστεί στην επιλεγμένη διάλεκτο, πριν μπει σε μία μηχανή κειμένου προς ομιλία που θα την μετατρέψει και θα την εκφωνήσει.
Αρχικά, η ομιλία θα πρέπει να ερμηνευτεί από τη μηχανή και να μεταγραφεί σε κείμενο, το οποίο στη συνέχεια θα μεταφραστεί στην επιλεγμένη διάλεκτο, πριν μπει σε μία μηχανή κειμένου προς ομιλία που θα την μετατρέψει και θα την εκφωνήσει.
Τώρα, η Google εργάζεται σε μία πιο φυσική μέθοδο από ομιλία σε ομιλία που ονομάζεται Translatotron, η οποία δεν χρειάζεται ενδιάμεση επεξεργασία για μετάφραση. Η ερμηνεία της ζωντανής ομιλίας δεν είναι κάτι καινούργιο, αφού η Google την υποστηρίζει στην εφαρμογή Translate από το 2011, και πρόσφατα έγινε διαθέσιμη στον Assistant.
Ωστόσο, το Translatotron παρέχει άμεση ερμηνεία ομιλίας σε ομιλία, εξαλείφει τους μεσάζοντες, λειτουργεί ταχύτερα, μειώνει τα λάθη που θα μπορούσαν να προκύψουν κατά τη μετατροπή και μπορεί να αγνοήσει ακόμη και λέξεις που δεν χρειάζεται να μεταφραστούν.
Εντυπωσιακό είναι επίσης ότι το Translatotron μπορεί να διατηρήσει τη φωνή του αρχικού ομιλητή στη μεταφρασμένη γλώσσα, κάνοντας την ομιλία πιο φυσική.
Στην πραγματικότητα όμως αυτό το πείραμα είναι ακόμη υπό ανάπτυξη. Για παράδειγμα, τα τρέχοντα αποτελέσματα εξακολουθούν να είναι πιο αργά από την cascade μετάφραση και μερικά αποτελέσματα είναι ακατανόητα.
Επιπλέον, αν και το Translatotron μπορεί να μιμηθεί τη φωνή του αρχικού ομιλητή αυτό ακούγεται πολύ ρομποτικό, αφύσικο και αργό. Ας μην ξεχνάμε όμως ότι η άμεση μετάφραση ομιλίας σε ομιλία βρίσκεται σε αρχικό στάδιο, οπότε το μέλλον είναι πολλά υποσχόμενο.
Ωστόσο, το Translatotron παρέχει άμεση ερμηνεία ομιλίας σε ομιλία, εξαλείφει τους μεσάζοντες, λειτουργεί ταχύτερα, μειώνει τα λάθη που θα μπορούσαν να προκύψουν κατά τη μετατροπή και μπορεί να αγνοήσει ακόμη και λέξεις που δεν χρειάζεται να μεταφραστούν.
Εντυπωσιακό είναι επίσης ότι το Translatotron μπορεί να διατηρήσει τη φωνή του αρχικού ομιλητή στη μεταφρασμένη γλώσσα, κάνοντας την ομιλία πιο φυσική.
Στην πραγματικότητα όμως αυτό το πείραμα είναι ακόμη υπό ανάπτυξη. Για παράδειγμα, τα τρέχοντα αποτελέσματα εξακολουθούν να είναι πιο αργά από την cascade μετάφραση και μερικά αποτελέσματα είναι ακατανόητα.
Επιπλέον, αν και το Translatotron μπορεί να μιμηθεί τη φωνή του αρχικού ομιλητή αυτό ακούγεται πολύ ρομποτικό, αφύσικο και αργό. Ας μην ξεχνάμε όμως ότι η άμεση μετάφραση ομιλίας σε ομιλία βρίσκεται σε αρχικό στάδιο, οπότε το μέλλον είναι πολλά υποσχόμενο.