donderdag 6 december 2012

De grillige geschiedenis van de vertaalcomputer

Onlangs heb ik in het NOS journaal uitgelegd welke grammaticale fouten vertaalcomputers nog steeds maken sinds hun introductie in de jaren '50, en waarom. Hoewel er in het afgelopen decennium een enorme vooruitgang heeft plaatsgevonden in het automatisch vertalen, is dit vooral te danken aan de toename van zogeheten parallelle corpora van meerdere talen. Nog steeds werken vrijwel alle beschikbare vertaalcomputers aan de hand van (min of meer) vaste vertalingen van woordsequenties die worden gevonden in zulke parallelle corpora. Zogauw er 'gaten' oftewel discontigue afhankelijkheden bestaan tussen woorden in een zin, dan gaat Google Translate alsook de recente vertaalcomputer van Microsoft in de fout. Eenvoudige zinnen zoals "Kees eet een appel en Piet een peer" worden dan ook standaard verkeerd vertaald, bv als "Kees eat an apple and a pear Piet" in Google Translate. Zelfs met een zinnetje als "De hond op de heuvel blaft" gaat het al mis. Dit geldt overigens niet voor vertaalprogramma's die wel discontigue afhankelijkheden (of 'gaten') kunnen meenemen, zoals deze in mijn eigen groep worden gebouwd. Maar doordat de zoekruimte van deze programma's explosief toeneemt met de lengte van de te vertalen zin, werken ze nog te traag om commercieel toepasbaar te zijn. Maar wat nog niet is, zal komen! Zie hier voor een link naar het betreffende NOS journaal.

1 opmerking:

  1. Ik heb slechte ervaringen met vertaal computers en ik vindt het fijn om te lezen wat de oorzaak daarvan is. Ik gebruik alleen nog maar vertaalcomputers als ik 1 of 2 woorden moet vertalen maar bij het vertalen van documenten laat ik dit doen door een vertaalbureau. Tegenwoordig zijn deze ook niet meer zo duur!

    BeantwoordenVerwijderen