Chatten zonder taalbarrières met Skype Translator

© PXimport

Chatten zonder taalbarrières met Skype Translator

Geplaatst: 10 juli 2015 - 11:05

Aangepast: 14 december 2022 - 15:24

Richard Veenstra

In het sciencefictionboek Hitchhiker's Guide to the Galaxy worden alle intergalactische talen direct vertaald door een klein visje dat in je oor gepropt is. Skype Translator vertaalt binnenkort live chats, kunnen we onze woordenboeken in de toekomst thuis laten liggen?

Skype Translator zorgde eind vorig jaar voor een internet-hype. Het programma kan namelijk live je Skype-gesprekken vertalen. Op dit moment is het programma alleen als preview beschikbaar, maar later dit jaar zal het officieel verschijnen. Een gesprek met Skype Translator is wel even wennen, aangezien het programma als een digitale tolk fungeert en je dus even moet wachten tot de automatische tolk jouw tekst heeft vertaald en je verhaal aan de andere persoon heeft verteld. Skype Translator is een logische volgende stap na automatische vertaalprogramma's en -diensten als Google Translate en BabelFish, maar hoe werkt dit nu precies? Lees ook: Zo chat je zonder pottenkijkers.

Spraakherkenning

Skype Translator lijkt direct uit de toekomst te komen en is vrij geavanceerd, maar toch komt het concept niet helemaal uit de lucht vallen. Eigenlijk is het programma een slimme combinatie van drie verschillende technieken: spraakherkenning, computervertaling en spraaksynthese. De eerste pogingen tot spraakherkenning dateren alweer van tientallen jaren geleden, maar recentelijk is de technologie voor veel consumenten binnen handbereik gekomen. Siri - de persoonlijke assistent op de iPhone - en Cortana - de tegenhanger van Microsoft - zijn twee bekende voorbeelden.

De ontwikkeling van spraakherkenning is op dit moment al zo goed dat het zelfs in gevechtsvliegtuigen wordt gebruikt. De F-35 Lightning II Joint Strike Fighter is het eerste Amerikaanse gevechtsvliegtuig dat communicatie- en navigatie-opdrachten van piloten kan herkennen, bommen werpen gebeurt gelukkig nog wel gewoon via manuele bediening. De toekomst van spraakherkenning ligt echter in spraak daadwerkelijk begrijpen. TARS, één van de robots in de film Interstellar, begrijpt emoties en maakt af en toe grapjes, maar met de huidige stand op het gebied van artificiële intelligentie is een werkend TARS-systeem nog ver weg.

Siri's grote zus

Siri gebruikt de engine van Nuance, het belangrijkste bedrijf op het gebied van spraakherkenning. Waar Siri nu vooral gericht is op het begrijpen van simpele vragen, kan zus Nina al veel meer. Nina is een systeem voor bedrijven als klantenservice-assistent. Ze kan haar identiteit gemakkelijk aanpassen voor verschillende bedrijven, zo heet ze in de ING-app Inge en spreekt ze Nederlands. Om taken uit te voeren in de app, spreek je gewoon in het Nederlands met de spraakherkennings-engine van Nuance.

Computervertaling

Nadat de gesproken tekst is omgezet naar een geschreven tekst begint stap twee: de daadwerkelijke vertaling. Dit heet computervertaling en is bekend onder zijn Engelse naam Machine Translation (MT). De ontwikkeling van deze technologie ontstond net na de Tweede Wereldoorlog, legt Vincent Vandeghinste, Postdoctoraal onderzoeker bij het Centrum voor Computerlinguïstiek aan de KU Leuven, uit. "Men dacht dat als Duitse codes te ontcijferen waren, je ook een taal als Russisch kon ontcijferen door het als een code te zien. Dit was echter een lichte onderschatting van het probleem. Als eerste werd met een woord-gebaseerde aanpak gewerkt; iets wat in zekere mate functioneert, maar geen goede vertaling geeft omdat de vertaling van woorden mede afhankelijk is van een context. Daarna is er een meer linguïstische aanpak gekomen. Men besteedde tientallen jaren om bepaalde constructies van het Engels naar het Frans te vertalen.

Het nadeel is echter dat deze aanpak aan één taal-paar is gebonden, een nieuw taal-paar is hier niet gemakkelijk uit te creëren. Sinds de jaren negentig bestaat er een statistische benadering die taalonafhankelijk is." Statistische systemen vergelijken razendsnel bestaande tekstvertalingen, Google Translate is één van de meest geavanceerde voorbeelden. De onderliggende engine heeft toegang tot een enorme database aan vertaalde teksten. Deze zoekt naar een specifieke zin in het Nederlands en kijkt hoe deze zin in de database van bestaande vertalingen is vertaald. "Dit gebeurt echter zonder enige taalkundige analyse en kennis van het subject van de te vertalen zin", zegt Vandeghinste.

 

© PXimport

De IBM 701 werd gebruikt voor één van de eerste MT-experimenten, het Georgetown-IBM experiment.

Machine Translation

Statistische MT (SMT): De ingegeven tekst wordt geanalyseerd op basis van miljoenen voorbeeldvertalingen uit een database. Google Translate combineert SMT met de vertaalgeschiedenis van zinnen die door mensen zijn vertaald of gecorrigeerd.

Regel-gebaseerde MT (RBMT): De ingegeven tekst wordt geanalyseerd op basis van linguïstische regels in combinatie met enorme woordenboeken en informatie over semantiek, morfologie en syntaxis. Hierdoor zijn teksten grammaticaal vaak beter. Een voorbeeld van RBMT-software is Systran, deze software leverde de engine voor de website BabelFish.

Hybride MT (HMT): Een combinatie van SMT en RBMT, in veel gevallen de beste oplossing. Systran was tot 2010 enkel een RBMT-systeem, maar tegenwoordig een hybride systeem. Naast Systran is het bedrijf PROMT een bekende fabrikant van HMT-software.

 

© PXimport

Systran levert HMT-softwarepakketten voor bedrijven.

Spraaksynthese

De derde stap is spraaksynthese, oftewel het omzetten van de vertaalde tekst naar gesproken tekst. Deze technologie is al vrij ver en wordt al jarenlang toegepast in veel verschillende domeinen: de omroeper van de NS, je navigatieapparaat en voorleesstemmen in je besturingssysteem. Vaak zijn gesynthetiseerde stemmen gebaseerd op echte stemmen en is het niet meteen duidelijk dat je met een gesynthetiseerde stem te maken hebt. Spraaksynthese kan echter ook op andere manieren gegenereerd worden, de Texas Instruments Speak & Spell is een bekend voorbeeld van formant-synthese in de jaren tachtig. De verwachting is dat spraaksynthese-systemen steeds menselijker worden qua klank en uitspraak.

 

© PXimport

Een boegbeeld voor spraaksynthese is Stephen Hawking.

Ambigu

Spraakherkenning en spraaksynthese zijn al in een vrij ver stadium, het grootste struikelblok is op dit moment nog MT en in mindere mate intelligente spraakinterpretatie. Een computervertaling bespaart natuurlijk veel tijd en kosten, maar kan niet tippen aan een vertaling van een echt persoon, aldus Vandeghinste. "Je hebt te maken met verschillende uitdagingen. Het moeilijkste is dat taal heel ambigu is, het kan op heel veel manieren geïnterpreteerd worden. Wij mensen hebben geen probleem om de context van een tekst te begrijpen, maar een computer moet zelf gaan uitzoeken welke betekenis een tekst kan hebben. De statistische benadering trekt zich niks aan van betekenis."

De kwaliteit van een vertaling is ook afhankelijk van de gepaarde talen, een vertaling van Duits naar Nederlands lukt over het algemeen beter dan een vertaling van Japans naar Nederlands. Uiteraard heeft dit te maken met het feit dat Nederlands en Duits in dezelfde taalgroep zitten, maar Vandeghinste geeft ook aan dat het komt doordat de technieken die nu gebruikt worden, vooral in de Angelsaksische wereld ontworpen zijn. Een vertaling naar het Engels werkt ook vrij goed, omdat Engels een taal met een vaste woordvolgorde is. Nederlands en Duits hebben een iets vrijere woordvolgorde dan het Engels.

 

© PXimport

Als Google Translate iets verkeerd vertaalt, kun je het zelf aanpassen. Het programma leert van zijn fouten.

Context-informatie

Om de context van een tekst beter te begrijpen, moet een vertaalprogramma kennis van andere zaken hebben dan alleen de daadwerkelijke tekst. In hun publicatie "Virtual Babel: Towards Context-Aware Machine Translation in Virtual Worlds" geven onderzoekers Ying Zhang en Nguyen Bach aan dat er drie niveaus van context-informatie in een conversatie zijn te vinden: domein, onderwerp en 5w-context. Het domein van een conversatie is bijvoorbeeld reizen. Binnen dit domein heb je verschillende onderwerpen, zoals hotelreserveringen of navigatie. De 5w-context slaat op wie, wat, waar, wanneer en waarom. Des te beter een vertaalprogramma deze drie niveaus kan herkennen, des te beter ook de vertaling wordt. "Professionele vertalers gebruiken nu al MT-software om het vertaalproces te versnellen, daar wordt bijvoorbeeld de vertaalengine aangepast aan het domein", aldus Vandeghinste.

Dit zorgt ervoor dat de software iets beter weet hoe bepaalde zinnen en woorden vertaald moeten worden. "Als je een handleiding voor een koelkast moet vertalen, dan train je het systeem op heel veel handleidingen van elektro- en huishoudtoestellen, de automatische vertaling zal dan beter zijn." Een probleem is nog wel dat ook deze domein-gespecifieerde MT-engines niet alles kunnen weten. "Als er in een zin het woord "hij" staat, dan moeten we weten waar dit naar verwijst om het correct te kunnen vertalen. Bij mijn weten gebeurt dat nog vrijwel nergens, behalve bij wellicht een paar researchsystemen."

Skype Translator installeren

Om Skype Translator te kunnen installeren, moet je je aanmelden voor de preview-versie. Dit doe je door je gegevens op https://translator.skype.com in te vullen. Met een beetje geluk heb je binnen 24 uur een email in je inbox met een downloadkoppeling. Doorloop de configuratie en je wordt naar de Windows Store geleid waar je de preview kunt downloaden. Op dit moment ondersteunt Skype Translator alleen Engels en Spaans voor live vertalingen.

 

© PXimport

Skype Translator komt later dit jaar officieel uit.

Huidige toepassingen

Skype is overigens niet de enige partij die bezig is met het live vertalen van gesprekken. Ook Google schenkt zijn product Translate veel aandacht. De web-versie is bij velen bekend, maar de app herbergt nog een aantal andere ingenieuze opties. Zo kun je sinds een paar maanden de camera van je smartphone of tablet gebruiken om teksten in te scannen, Google Translate vertaalt deze tekst dan direct naar een andere taal. Deze functie komt voort uit de aankoop van Quest Visual, makers van de app Word Lens. Vooralsnog is Nederlands nog niet beschikbaar, maar je kunt al wel teksten uit zes andere talen naar het Engels vertalen. Naast consumentenprogramma's heeft ook het bedrijfsleven en de overheid baat bij MT-oplossingen, een bekende afnemer is de EU. Vandeghinste: "MT wordt in de Europese Commissie vaak gebruikt om het vertaalproces te versnellen. Een computervertaling is vaak consistenter in woordgebruik dan wanneer je verschillende vertalers eenzelfde tekst laat vertalen. De output wordt echter daarna nog wel bewerkt door mensen. De Europese Commissie heeft een groep van 15 tot 20 vertaaltechnologen die proberen dit systeem te verbeteren."

MT wordt overigens alleen op schriftelijke documenten toegepast. "Gesprekken worden nog niet direct vertaald, maar er bestaan wel technologieën die het leven van tolken makkelijker maakt, in die zin dat ze bijvoorbeeld snel dingen kunnen opzoeken. Live spraakvertaling is heel ingewikkeld, het kan werken als je een duidelijke spreker hebt die zonder achtergrondgeluid spreekt", iets wat natuurlijk in een meertalige discussie tussen meerdere sprekers erg lastig te bewerkstelligen is. Dit lijkt ook een argument voor de stelling dat het beroep tolk niet zo snel zal uitsterven. Terug naar Skype Translator. Het programma is wellicht niet revolutionair als opzichzelfstaand concept, maar wel revolutionair in zijn combinatie van verschillende technieken. "Het is één van de eerste grote toepassingen van de combinatie van spraakherkenning, automatische vertaling en spraaksynthese. Er zijn wel researchprojecten geweest, maar die waren dan heel specifiek qua domein."

 

© PXimport

Verbmobil was een project waarbij de Duitse overheid MT-toepassingen in het Duits, Engels en Japans onderzocht.

Apalon Speak & Translate

De app Speak & Translate is één van de betere iPhone-apps waarmee je gesproken tekst automatisch kunt laten vertalen naar een andere taal. De app ondersteunt vele talen, waaronder Nederlands. De volledige versie kost vijftien euro, maar met de gratis versie kun je tot tien vertalingen per dag inspreken. In het geval van Speak & Translate wordt de spraakherkenning gedaan met software van Nuance. Vervolgens wordt de tekst vertaald via een MT-techniek, de laatste stap is het transformeren van de vertaalde tekst naar een gesproken stem. "Naast de iPhone is Speak & Translate binnenkort verkrijgbaar voor OS X en we onderzoeken op dit moment of het mogelijk is de app voor Android beschikbaar te stellen", aldus Anastasia Gamezo, Brand Manager bij het Wit-Russische bedrijf Apalon, maker van Speak & Translate. Gamezo is het niet eens met Vandeghinste en is ervan overtuigd dat MT de toekomst is: "Als de technologie zich in hetzelfde tempo blijft ontwikkelen, dan is het zeer goed mogelijk dat een live tolk een zeldzaamheid gaat worden."

Toekomst

Of er in de toekomst veel gaat veranderen, hangt af van verschillende zaken, denkt Vandeghinste. "De vraag naar vertaling groeit gigantisch, alle websites moeten in veel verschillende talen ter beschikking komen. De snelheid waarmee vertaald moet worden, groeit ook. Uiteindelijk hangt het allemaal af van de kwaliteit. Automatische vertaling op de manier zoals je het kent van Google Translate is goed voor sommige doeleinden, maar niet goed genoeg voor echte publicaties of marketing. Daar zullen vertalers nog tientallen jaren nodig blijven om teksten te verbeteren. De komende tien jaar gaan we wel een verbetering van de kwaliteit van MT-software zien, maar zolang er geen grondige analyse wordt toegepast naar wat een zin in de context van een tekst betekent - zodat we weten wie wat gedaan heeft, met wie, waarom en wanneer - blijft het behelpen met het zo goed mogelijk letterlijk vertalen van woorden.

In de komende jaren zal de integratie van de verschillende regel-gebaseerde en de statistische computervertalingen gecombineerd worden. Daar gaan we wel vooruitgang zien op korte termijn, maar waarschijnlijk nog niet de vooruitgang die we graag zouden zien." Concreet betekent dit dat we in de nabije toekomst waarschijnlijk veel meer kruisbestuivingen van bekende technologieëngaan zien. Het automatisch vertalen van sms'jes, e-mails en andere berichten op je smartphone lijkt met de huidige stand van zaken geen enorme uitdaging op technologisch gebied. Als we een stap verder kijken, moet het ook mogelijk zijn dat je smartphone aan gaat bieden om een telefoongesprek van een buitenlands nummer automatisch te gaan vertalen. Een vis in je oor is dan helemaal niet meer nodig, je kunt gewoon je smartphone of smartwatch hiervoor gebruiken.

Conclusie

De ontwikkeling van automatisch vertalen zit de laatste tijd in een stroomversnelling. Dit komt mede doordat verschillende technologieën zoals spraakherkenning, statische en regel-gebaseerde computervertaling en spraaksynthese op een slimme manier gecombineerd worden tot innovatieve producten. Omdat het op dit moment voor een computer echter nog heel lastig is om de context van een tekst te begrijpen, is een perfect werkende BabelFish op je smartphone of computer helaas nog niet op korte termijn mogelijk. Voor vertalers en tolken lijkt MT een grote concurrentie, maar doordat menselijke vertalingen nog steeds superieur zijn en de vraag naar meertalige content groeit, zullen vertalers en tolken niet zo snel uitsterven.

Het bedrijfsleven mag dan hoge eisen stellen aan vertalingen, voor consumenten ligt dat anders. Als Google Translate af en toe een fout maakt, is er geen man overboord. De kans is dan ook groot dat er binnenkort meer slimme apps en toepassingen beschikbaar komen, vooral voor mobiele apparaten zoals smartphones, tablets en smartwatches.

 

© PXimport

De smartwatch is wellicht een goede kanshebber voor vertaal-opties in de toekomst en het komt het dichtste bij een echte babelfish.

Deel dit artikel
Voeg toe aan favorieten