Chatten zonder taalbarrières met Skype Translator

Door: Richard Veenstra | 10 juli 2015 15:07

Apps & Software

Inhoudsopgave

  1. Inleiding
  2. pagina 2
  3. pagina 3

In het sciencefictionboek Hitchhiker's Guide to the Galaxy worden alle intergalactische talen direct vertaald door een klein visje dat in je oor gepropt is. Skype Translator vertaalt binnenkort live chats, kunnen we onze woordenboeken in de toekomst thuis laten liggen?

Skype Translator zorgde eind vorig jaar voor een internet-hype. Het programma kan namelijk live je Skype-gesprekken vertalen. Op dit moment is het programma alleen als preview beschikbaar, maar later dit jaar zal het officieel verschijnen. Een gesprek met Skype Translator is wel even wennen, aangezien het programma als een digitale tolk fungeert en je dus even moet wachten tot de automatische tolk jouw tekst heeft vertaald en je verhaal aan de andere persoon heeft verteld. Skype Translator is een logische volgende stap na automatische vertaalprogramma's en -diensten als Google Translate en BabelFish, maar hoe werkt dit nu precies? Lees ook: Zo chat je zonder pottenkijkers.

Spraakherkenning

Skype Translator lijkt direct uit de toekomst te komen en is vrij geavanceerd, maar toch komt het concept niet helemaal uit de lucht vallen. Eigenlijk is het programma een slimme combinatie van drie verschillende technieken: spraakherkenning, computervertaling en spraaksynthese. De eerste pogingen tot spraakherkenning dateren alweer van tientallen jaren geleden, maar recentelijk is de technologie voor veel consumenten binnen handbereik gekomen. Siri - de persoonlijke assistent op de iPhone - en Cortana - de tegenhanger van Microsoft - zijn twee bekende voorbeelden.

De ontwikkeling van spraakherkenning is op dit moment al zo goed dat het zelfs in gevechtsvliegtuigen wordt gebruikt. De F-35 Lightning II Joint Strike Fighter is het eerste Amerikaanse gevechtsvliegtuig dat communicatie- en navigatie-opdrachten van piloten kan herkennen, bommen werpen gebeurt gelukkig nog wel gewoon via manuele bediening. De toekomst van spraakherkenning ligt echter in spraak daadwerkelijk begrijpen. TARS, één van de robots in de film Interstellar, begrijpt emoties en maakt af en toe grapjes, maar met de huidige stand op het gebied van artificiële intelligentie is een werkend TARS-systeem nog ver weg.

Siri's grote zus

Siri gebruikt de engine van Nuance, het belangrijkste bedrijf op het gebied van spraakherkenning. Waar Siri nu vooral gericht is op het begrijpen van simpele vragen, kan zus Nina al veel meer. Nina is een systeem voor bedrijven als klantenservice-assistent. Ze kan haar identiteit gemakkelijk aanpassen voor verschillende bedrijven, zo heet ze in de ING-app Inge en spreekt ze Nederlands. Om taken uit te voeren in de app, spreek je gewoon in het Nederlands met de spraakherkennings-engine van Nuance.

Computervertaling

Nadat de gesproken tekst is omgezet naar een geschreven tekst begint stap twee: de daadwerkelijke vertaling. Dit heet computervertaling en is bekend onder zijn Engelse naam Machine Translation (MT). De ontwikkeling van deze technologie ontstond net na de Tweede Wereldoorlog, legt Vincent Vandeghinste, Postdoctoraal onderzoeker bij het Centrum voor Computerlinguïstiek aan de KU Leuven, uit. "Men dacht dat als Duitse codes te ontcijferen waren, je ook een taal als Russisch kon ontcijferen door het als een code te zien. Dit was echter een lichte onderschatting van het probleem. Als eerste werd met een woord-gebaseerde aanpak gewerkt; iets wat in zekere mate functioneert, maar geen goede vertaling geeft omdat de vertaling van woorden mede afhankelijk is van een context. Daarna is er een meer linguïstische aanpak gekomen. Men besteedde tientallen jaren om bepaalde constructies van het Engels naar het Frans te vertalen.

Het nadeel is echter dat deze aanpak aan één taal-paar is gebonden, een nieuw taal-paar is hier niet gemakkelijk uit te creëren. Sinds de jaren negentig bestaat er een statistische benadering die taalonafhankelijk is." Statistische systemen vergelijken razendsnel bestaande tekstvertalingen, Google Translate is één van de meest geavanceerde voorbeelden. De onderliggende engine heeft toegang tot een enorme database aan vertaalde teksten. Deze zoekt naar een specifieke zin in het Nederlands en kijkt hoe deze zin in de database van bestaande vertalingen is vertaald. "Dit gebeurt echter zonder enige taalkundige analyse en kennis van het subject van de te vertalen zin", zegt Vandeghinste.

De IBM 701 werd gebruikt voor één van de eerste MT-experimenten, het Georgetown-IBM experiment.

Machine Translation

Statistische MT (SMT): De ingegeven tekst wordt geanalyseerd op basis van miljoenen voorbeeldvertalingen uit een database. Google Translate combineert SMT met de vertaalgeschiedenis van zinnen die door mensen zijn vertaald of gecorrigeerd.

Regel-gebaseerde MT (RBMT): De ingegeven tekst wordt geanalyseerd op basis van linguïstische regels in combinatie met enorme woordenboeken en informatie over semantiek, morfologie en syntaxis. Hierdoor zijn teksten grammaticaal vaak beter. Een voorbeeld van RBMT-software is Systran, deze software leverde de engine voor de website BabelFish.

Hybride MT (HMT): Een combinatie van SMT en RBMT, in veel gevallen de beste oplossing. Systran was tot 2010 enkel een RBMT-systeem, maar tegenwoordig een hybride systeem. Naast Systran is het bedrijf PROMT een bekende fabrikant van HMT-software.

Systran levert HMT-softwarepakketten voor bedrijven.