Google Translate: kunstmatige intelligentie is de weg naar perfectie

Google Translate is niet meer weg te denken tegenwoordig. Het is zelfs een van Google’s meest gebruikte diensten. In 2006, toen de service werd gelanceerd, kon er alleen vanuit het Engels naar het Arabisch vertaald worden en andersom. Nu meer dan 10 jaar later gooien dagelijks een half miljard mensen meer dan 140 miljard woorden door de vertaalmachine waaronder Nederlands en sinds twee jaar ook Fries.

Verrassend Fries

En juist het enthousiasme van Friezen over hun taal heeft Google flink verrast. Wanneer Google een nieuwe taal toevoegt aan hun vertaalservice hebben ze daar hulp bij nodig van de sprekers.

In 2015 nam de gepensioneerde woordenboekenschrijver Anne Dykstra contact op met Google. Dykstra leverde de vertalingen aan en Google besloot om de Friese taal toe te voegen aan hun repertoire. En dat ging in een rap tempo! Binnen een week vertaalden honderden Friezen één miljoen woorden, er werden zelfs vertaalmarathons georganiseerd in Friesland.

Blauwdruk voor nieuwe talen

Sindsdien is het Fries het voorbeeld geworden voor andere talen. De baas van Google, Barak Turovsky, legt uit: “Onlangs ging het in Kazachstan net zo. Ik e-mailde een groep van 300 mensen daar met als doel twee miljoen woorden in het Kazachs vertaald te krijgen. In enkele dagen stroomden er 300.000 woorden per dag binnen. Landelijke media in Kazachstan pikten het op en toen werd het een zaak van nationale trots.”

Bizarre vertalingen

Toch vertaalt Google Translate nog steeds niet vlekkeloos, alhoewel de kwaliteit van de vertalingen wel al ontzettend is verbeterd in vergelijking met een aantal jaren geleden. Er werd nogal eens de plank misgeslagen bij het vertalen van langere zinnen waardoor er bizarre vertalingen ontstonden. Eén woord per keer vertalen geeft daarentegen goede resultaten.

Volgens Turovsky is het niet vreemd dat er af en toe gekke vertalingen langskwamen. “Lange tijd konden onze systemen moeilijk lange zinnen aan en dat levert inderdaad soms rare vertalingen op.” Sinds Google in 2016 gebruik is gaan maken van kunstmatige intelligentie en zelflerende machines, is ook de kwaliteit van de vertalingen opvallend verbeterd. Zo kostte het eerst tot drie jaar om Google Translate een nieuwe taal aan te leren. Nu lukt dat al binnen negen maanden.

Verbeterde Nederlandse vertalingen

Dankzij deze kunstmatige intelligentie is ook de kwaliteit van Nederlandse vertalingen sinds april 2017 met ruim de helft verbeterd. Voor bepaalde talen bedraagt de kwaliteitsverhoging 85 procent. “Dat lukt doordat onze software zinnen in delen van vijf woorden knipt, zodat de vertaling veel accurater wordt. Verder kijken we naar onderliggende verbanden en context.”

Maar er is meer! Tegenwoordig gebruikt Google een andere handigheid: drie talen worden aan elkaar verknoopt. Een van de drie talen bevat veel data en de andere twee talen niet. Ook hier komt kunstmatige intelligentie weer op de hoek kijken, want dankzij deze technologie kunnen de twee talen met minder data gigantisch verbeteren. Google heeft zo Thai en Vietnamees verbeterd door deze twee talen aan het Pools te koppelen.

Niet 100% perfect

Hoe vooruitstrevend de technologieën ook zijn die Google gebruikt, er zijn nog veel vertalingen die niet perfect zijn. En dat kan ook niet anders, want de menselijke taal is zeer complex. Turovsky legt uit dat het jaren in beslag neemt om vertalingen te perfectioneren. “Nuances die een kind intuïtief oppikt, zijn voor computers beduidend lastiger. Als het al lukt om alle finesses te vangen.” Google ondersteunt ruim 100 talen. “Dat zijn 10.000 mogelijke combinaties. Zelfs voor Google vergt dat enorm veel computerkracht.”

Dat betekent dat vertalingen nog steeds afhankelijk zijn van menselijke inzet. Zie je een verkeerde vertaling op Google, dan kun je ze een mailtje sturen en jouw suggestie doorgeven. De vertaalexperts bij Google controleren deze suggesties en zorgen ervoor dat deze verbeteringen eventueel in Google Translate terechtkomen.

Bron: AD


Top