Demo bekijken


Machinevertaling


Machinevertaling: kan het mensen vervangen?

Kunstmatige intelligentie, of diepe neurale netwerken en machineleren om precies te zijn, is heel wat. Het project Google DeepMind heeft de koppen over de hele wereld gehaald en heeft aan de mainstream geïntroduceerd wat er in het lab gebeurt. Een populair verhaal is dat van AlphaGo, een computerprogramma ontwikkeld door het Google DeepMind-team. Het programma heeft onlangs Lee Se-dol, Go-speler van wereldklasse,, verslagen, iets wat naar verwachting nog vele jaren zou duren vanwege de grote hoeveelheid intuïtie die nodig is om het spel te spelen (er zijn meer mogelijke posities op het raster dan atomen in het universum!).
Maar hoe zit het met iets dat we al dagelijks gebruiken? Machinevertaling (MT) is een voorbeeld van kunstmatige-intelligentiealgoritmen die worden toegepast op praktische problemen. Dit is niet zomaar een abstracte technologische kanttekening, het is een hulpmiddel dat we dagelijks gebruiken om ons te helpen bij ons werk, onze ontspanning en ons vermaak.

Een korte geschiedenis van MT

IBM 701

De IBM 701

Om de huidige status van MT te begrijpen, is het zinvol om naar de oorsprong te kijken. Het idee van MT begon kort na de Tweede Wereldoorlog op te komen met een nauwe verbinding met cryptografie. Maar het idee kreeg vanaf het begin met tegenstand te maken. J.E. Holmström schreef in een rapport van 1951 voor UNESCO dat “de daaruit voortvloeiende literaire stijl afschuwelijk en nog meer 'blunders' en valse waarden zou bevatten dan het ergste dat een menselijke vertaler produceert”. Hij beweert ook dat “vertalen een kunst” is, wat leidt tot een interessante vraag die nog steeds wordt besproken: zullen machines ooit kunst kunnen produceren? Zijn opmerkingen werden enkele korte jaren later gevolgd door de eerste demonstratie van een MT-systeem. Dit was een samenwerking in 1954 tussen de universiteit van Georgetown en IBM die Russisch vertaalde naar het Engels. Het was een behoorlijk succes, volgens het persbericht van IBM ten minste, en verhoogde de verwachtingen van de capaciteiten van MT in de komende jaren. Maar net als bij veel interessante nieuwe technologieën was de vooruitgang veel trager dan verwacht. Als je meer wilt weten over de herkomst van MT, biedt John Hutchins’ paper uit 1997 Translation Technology and the Translator een goed verslag van zijn reis.

Opkomst van de machines

Veel complexe kwesties die in deze vroege dagen werden besproken, zijn nog steeds niet opgelost, zoals het feit dat MT dieper moet gaan dan alleen woorden vervangen. Bij vertaling moet zorgvuldig rekening worden gehouden met de context van elk woord. Idiomen en de grillen van verschillende domeinen, zoals sportschrijven in vergelijking met zakelijk schrijven, maken de productie van volautomatisch en kwalitatief hoogwaardige MT een moeilijke vaardigheid om onder de knie te krijgen. Een programma ontwikkelen dat de brontekst kan begrijpen zoals een mens dat zou doen en deze kan reproduceren in een andere taal, waarbij rekening wordt gehouden met culturele aspecten, is een enorme opgave. Daarom zullen machines in de nabije toekomst vertaling niet overnemen.
Deze interessante post van David Raab van Martech Advisor onderzoekt functiecategorieën die door informatisering dreigen verloren te gaan. De post weerspiegelt het idee dat hoe creatiever en intuïtiever het werk is, hoe minder waarschijnlijk het binnen afzienbare tijd zal verdwijnen.

'Job Threat' door David Raab

De vraag of machines al dan niet klaar zijn om creatieve mensen te vervangen, wordt ook besproken in een rapport van McKinsey & Co uit 2016. Het managementadviesbureau heeft de mogelijkheden bekeken voor het automatiseren van activiteiten door middel van huidige technologieën. Hieruit blijkt dat veel taken nu klaar zijn voor automatisering – misschien wel meer dan we op dit moment zouden denken.

McKinsey Automation

Maar staan we op het punt om een revolutie in automatisering te zien? Sommigen zouden zeggen dat we op het punt staan een enorme sprong in automatisering mee te maken. Net als de eerste golf automatisering die veel fabrieksbanen heeft vervangen, kan de volgende golf het op banen in de dienstensector hebben gemunt. De voorbeelden lijken bijna eindeloos: Uber investeert miljoenen in geautomatiseerde rijtechnologie om de mensheid te naar een hoger niveau te tillen, Xero maakt waarschijnlijk deel uit van de reden waarom Price Waterhouse Coopers (PWC) denkt dat boekhouding een van de meest waarschijnlijke rollen is om de komende 20 jaar te worden geautomatiseerd, en The Washington Post heeft een algoritme gebruikt om verhalen te schrijven tijdens de Olympische Spelen in Rio van 2016.

In al deze voorbeelden is het echter de bedoeling om menselijke middelen te verplaatsen naar gebieden waar ze productiever zijn. Of zoals Jeremy Gilbert, de Director of Strategic Initiatives bij The Washington Post, zegt: “We proberen niet om verslaggevers te vervangen, we proberen meer tijd voor ze vrij te maken”.

Bot Olympische Spelen

Deze robot verloor zijn baan.

Vertalers versus de machines

Laten we eerst één ding duidelijk maken: hoogwaardige vertaling zal niet snel worden vervangen door machines. Om ervoor te zorgen dat content opvalt in tijden van ad-blockers, moet deze entertainend, inzichtelijk en waardevol zijn. Dit betekent dat er nood is aan origineel denken, empathie en heel veel creativiteit. En zoals besproken in onze blogpost: Voldoe aan de verwachtingen van de klant en spreek als een local, zijn er veel complexe factoren waarmee rekening moet worden gehouden bij het creëren van meertalige content. MT gaat niet ver genoeg om klanten aan te spreken; ze hebben vloeiende communicatie nodig die rekening houdt met culturele en stilistische factoren. Met dit in gedachten vind je hier enkele belangrijke aandachtspunten om in het achterhoofd te houden als je gebruik wilt maken van MT:

Zal software foutloos zijn?

Iedereen maakt fouten, maar in veel gevallen maken machines minder fouten dan mensen. Hoe eenvoudiger de taak, hoe beter de machine het kan doen. Zelfs complexe taken zoals autorijden kunnen worden verbeterd door automatisering. De computerondersteunde auto's van Tesla hebben in de VS meer dan 200 miljoen kilometer gereden vóór hun eerste dodelijke ongeval, terwijl het gemiddelde voor conventionele auto' s 151 miljoen kilometer per dodelijk ongeval bedraagt. Hoewel dit mogelijk geen rekening houdt met het relatieve vaardigheidsniveau van Tesla-bestuurders, is de implicatie duidelijk: machines kunnen het aantal menselijke fouten verminderen. Maar vertrouw jij een machine met je merk? Een klein stadje in Spanje, As Pontes, maakte ooit een MT-fout die de hele wereld is rondgegaan. En dan hebben we het nog niet eens over of MT de juiste toon voor een merk wel kan vatten.

Kan een machine culturele en historische verschillen herkennen?

Je kunt bijvoorbeeld zeggen dat een portemonnee een ‘Personalausweis’ (identiteitskaart) kan bevatten in een productbeschrijving in Duitsland. Maar dit vertalen naar ‘identiteitskaart’ in landen zonder dergelijke kaarten, zoals Australië, het VK, Nieuw-Zeeland en de VS, zou vreemd klinken, ook al is het woord duidelijk. Er bestaan nog steeds talloze vergelijkbare verschillen, zelfs terwijl de wereld metaforisch kleiner wordt. Dit maakt een dieper cultureel inzicht essentieel voor het creëren van meertalige inhoud. Het is belangrijk om te onthouden dat tweetalig zijn iemand geen goede vertaler maakt. Het vergt jarenlange ervaring en leren om vlot betekenis te kunnen overzetten naar een nieuwe taal. Je zou kunnen zeggen dat deskundige vertalers woorden tot leven doen komen.

Mobiel en apparaatgebruik Kan een computer culturele verschillen begrijpen?

Hoe zit het met vertrouwelijkheid?

De meest alomtegenwoordige MT-tool, Google Translate, is een goed voorbeeld als het gaat om vertrouwelijkheid. Alles dat via translate.google.com wordt vertaald, wordt bijgehouden door Google, wat betekent dat je altijd het risico loopt dat je content in de verkeerde handen belandt. Maar wanneer je de vertaal-API van Google gebruikt, een betaalde dienst, garandeert Google vertrouwelijkheid.

Waar volstaan vertalingen van lagere kwaliteit?

Dit is de grote vraag bij het overwegen van de implementatie van MT. Het is een goedkopere en snellere oplossing dan menselijke vertaling, maar de kwaliteit zal niet het niveau bereiken van professionele menselijke vertalers. Anderzijds zijn er niet genoeg vertalers om de hogere volumes content die op het internet terechtkomen te vertalen. Daarom is het prioriteren van vertalingen in termen van kwaliteit en kwantiteit een manier om het juiste moment te vinden om MT te gebruiken op een manier die waarde toevoegt.

Hieronder vind je enkele basisgroeperingen van content en wat er zinvol kan zijn in termen van vertaling. Voor inhoud die zeer nauwkeurig moet zijn, is een professionele menselijke vertaling noodzakelijk. Voor inhoud die een hogere frequentie van release en niet dezelfde kwaliteitseisen heeft, is machinevertaling met nabewerking door een deskundig vertaler een plausibele optie. En ten slotte kan ruwe MT voor zeer hoge frequenties, zoals klantenondersteuning op sociale media, voldoende zijn.

Use cases voor MT

Ter samenvatting

Technologie zal steeds meer vooruitgang boeken in de richting van automatisering. Sommige banen zullen verloren gaan, maar er zal meer worden gewonnen omdat technologie helpt ons te focussen op niet-routinematig werk. Kijk maar naar de bescheiden geldautomaat, die sinds de jaren '70 een enorme verspreiding heeft gekend. Je zou denken dat dit het aantal bankmedewerkers tot bijna nul heeft teruggebracht, maar het tegenovergestelde is waar.

Hetzelfde geldt voor MT. Het wordt al gebruikt in klantgerichte content voor een aantal eenvoudige vertaaltaken, maar merken die echt willen opvallen moeten nog steeds samenwerken met een team van ervaren projectmanagers- en taalexperts. Het gebruik van MT is heel erg zinvol als schrijfhulp, voor routinematige content, of als je enkel de essentie van een bepaalde tekst in een vreemde taal wilt weten. Daarnaast is het een vaardigheid op zich om gebieden te vinden in je business die van MT kunnen profiteren en er meerwaarde in kunnen vinden. Het belangrijkste om te onthouden is dat teksten nog steeds een professionele menselijke vertaler nodig hebben als je de klant echt wilt aanspreken.