Volgens een artikel in Nature heeft Google een nieuwe vertaalsysteem ontwikkeld dat vertalen door een computer totaal anders benadert dan conventionele vertaalsoftware. In plaats van een expertsysteem waarin de kennis van idioom en grammatica van de talen is opgenomen, leert het programma door vergelijking van een enorme hoeveelheid documenten zoals krantenartikelen. Deze vergelijking levert een ruwe vertaling op die wordt bijgewerkt met een programma dat bijvoorbeeld de woordvolgorde omzet volgens de regels van de doeltaal. Het systeem, dat alleen maar in betaversie beschikbaar is, wist aanvankelijk niets van de brontalen, maar heeft deze lerenderwijs onder de knie gekregen. Het zou het voor formele teksten nu al kunnen concurreren met professionele vertalers. Meer moeite heeft het overigens met omgangstaal, en met talen als Duits, en Nederlands.
Ik heb het programma van Google getest. Jammer genoeg kan het nog niet van en naar het Nederlands worden gebruikt, wel van en naar Duits. Als voorbeeld een vertaling naar het Engels van het bekende gedicht van Goethe. Deel van de charme van dit gedicht is de zeer eenvoudige taal, het zou dus makkelijk te vertalen moeten zijn:
Über allen Gipfeln
Ist Ruh'
In allen Wipfeln
Spürest Du
Kaum einen Hauch;
Die Vögelein schweigen im Walde
Warte nur, balde
Ruhest Du auch.
Ist Ruh'
In allen Wipfeln
Spürest Du
Kaum einen Hauch;
Die Vögelein schweigen im Walde
Warte nur, balde
Ruhest Du auch.
Over all summits
peace is
in all treetops
hardly feels
you a breath;
The small birds are silent in the forest
control room only,
soon rest you also.
peace is
in all treetops
hardly feels
you a breath;
The small birds are silent in the forest
control room only,
soon rest you also.
Het verbaast me niets dat alle poëzie uit de tekst is verdwenen. Wat me wel verbaast is dat de vertaling rammelt van de fouten, met control room only als hilarisch dieptepunt. Ik vraag me af welke teksten er door Nature zijn beoordeeld als concurrerentie voor het werk van professionele vertalers. En wat daar de criteria voor waren.
Schaakprogramma's zijn een goed voorbeeld van hoe software zich in de loop van de jaren kan ontwikkelen. Die software is vanaf halverwege de jaren '70 geëvolueerd van de wat sullige 2-ply alfa-beta pruners tot brutale krachtpatsers als Shredder en Crafty, die al jaren beter schaken dan vrijwel iedereen behalve de beste grootmeesters. Daarmee leveren ze een uitstekend bewijs voor de stelling dat je nooit het doorzettingsvermogen van programmeurs moet onderschatten. Maar als het programma van Google exemplarisch is voor machinevertalingen hebben vertalers voorlopig nog niets van de computer te vrezen.
Schaakprogramma's zijn een goed voorbeeld van hoe software zich in de loop van de jaren kan ontwikkelen. Die software is vanaf halverwege de jaren '70 geëvolueerd van de wat sullige 2-ply alfa-beta pruners tot brutale krachtpatsers als Shredder en Crafty, die al jaren beter schaken dan vrijwel iedereen behalve de beste grootmeesters. Daarmee leveren ze een uitstekend bewijs voor de stelling dat je nooit het doorzettingsvermogen van programmeurs moet onderschatten. Maar als het programma van Google exemplarisch is voor machinevertalingen hebben vertalers voorlopig nog niets van de computer te vrezen.
No comments:
Post a Comment