Het online tijdschrift voor Nederlandse taal- en letterkunde Neerlandistiek organiseert een “woord van het jaar” gedoe, inclusief de zin, de dichtbundel, het prozawerk, neerlandistisch werk en de wetenschappelijke ontdekking van het jaar.
Het aardige is dat er twee ronden zijn: in de eerste ronde (die loopt tot en met 26 december) mag iedereen woorden, zinnen, dichtbundels, enz. insturen. In de tweede ronde (na kerstmis) kiest een deskundige jury uit de boezem van de Neerlandistiek-redactie winnaars in ieder van deze categorieën
Frans schrijft veel blijkbaar overbodige letters, want je hoort ze gewoon niet.
De Franse grammatica lijkt daardoor een opeenstapeling van regeltjes die alleen maar dienen om het moeilijker te maken dan het is, of om de indruk te wekken dat de Franse taal iets voor intelligente mensen is, of dat het bedacht is door mensen die zo onder de indruk waren van het Latijn dat ze vonden dat een taal alleen maar goed kon zijn of prestige kon hebben als ze een even complex netwerk van regels had.
Maar toch kom je gevallen tegen waaruit duidelijk is dat die regels niet nutteloos zijn.
Dat is natuurlijk vooral het geval in lange zinnen, maar het komt ook in eenvoudiger zinnen voor.
Hier een voorbeeld:
Les commandes doivent être contrôlées tous les jours dans 2 affichages de liste distincts.
Waar hoort die “distinct” bij? Gaat het om de “affichages” of om de “liste”? Het onderscheid is alleen maar duidelijk doordat “distincts” in het meervoud staat, en dus bij “affichages” hoort en niet bij het enkelvoudige “liste”.
Mijn oplossing was:
De bestellingen moeten elke dag worden gecontroleerd in twee verschillende weergaven van de lijst.
Na zoiets vraag ik me wel eens af: hoe merken de Fransen dan het onderscheid in de spreektaal? Maar dat is natuurlijk een kwestie van accent, intonatie en context.
Je wordt wel eens uitgedaagd om te controleren of AI vertalen aankan.
Een buur zag me onlangs dubben op: “Dort gibt es jetzt die aktuellen Modellhighlights.”
Ik had als oplossing aanvankelijk: “Daar zijn al de actuele modelhightlights.”
Die “highlights” klinkt misschien wat vreemd, maar dat is taalgebruik in het milieu van de doelgroep. Vandaar. Maar ik had een probleem met de zin: hij kon worden geïnterpreteerd alsof hij betekende dat “alle modelhighlights” er waren, maar “al” was hier een bijwoord van tijd.
Het kostte een half uurtje voor ik met mijn oplossing kwam (niet dat ik ondertussen niets anders deed): “De actuele modelhighlights zijn daar al.”
Het was gewoon een kwestie van een ander zinsdeel vooropzetten. De suggestie van mijn buur, om “al” te vervangen door “reeds”, wees ik af: niet vlot genoeg, en zelfs wat archaïsch. “Nou,” zei hij, “met AI had je het in een wip opgelost.”
Dat was natuurlijk een uitdaging, en dus stopte ik het in een automatische vertaalgenerator met AI.
Die kwam eerst aan met: “Daar vindt u nu de actuele modelhoogtepunten.”
Hij had “gibt es” vertaald met “vindt u”, wat niet onaardig is, maar hoe dan ook niet echt wat er staat. Dat de “highlights” “hoogtepunten” werden, wou ik door de vingers zien, maar het toonde in elk geval dat de AI het taalgebruik van de scene niet kent. Je kunt hem dat misschien wel leren, maar als ik hem alles moet leren, kost het me meer tijd dan als ik het zelf doe.
Toen ik het hem nog eens liet vertalen, kreeg ik: “Daar zijn nu de huidige modelhoogtepunten te vinden.”
Logischerwijs keerden die “hoogtepunten” terug, maar “gibt es” was nu “zijn (…) te vinden”, wat al bij al een achteruitgang is. Het blijft een stijlfout, omdat die “gibt” nogal inhoudsloos is, en dan vertaal je het best niet met ogenschijnlijk inhoudelijke woorden, terwijl het hier hoogstens de functie van een koppelwerkwoord heeft dat onderwerp, tijd en plaats met elkaar verbindt. Da’s een redenering die de AI, waarin “intelligentie” eigenlijk misplaatst is, niet kan maken.
“Jetzt” was in beide gevallen vertaald met “nu”, wat op zich wel goed is, maar wat ik opzettelijk had vermeden om de klemtoon minder op de onmiddellijkheid van de beschikbaarheid van de modellen te leggen. Er kon immers altijd iets misgaan met de leveringen, en bovendien was het een vertaling van een Duits blad dat zich erg richt op de Duitse markt waar producten afkomstig uit Duitse fabrieken worden verspreid. Aangezien ik naar het Nederlands vertaal, is het mogelijk dat er vertraging bij de uitlevering naar Nederland en België optreedt, zodat de liefhebber die naar zijn verkoper rent misschien voor niets de zweetdruppels op het voorhoofd parelen. Liever geen valse verwachtingen scheppen, denk ik dan, realistische verwachtingen maken tevreden klanten. Nog een redenering die AI niet kan maken. En die je hem ook niet kunt aanleren, of “jetzt” wordt altijd “al”. Wat ook niet juist is.
O ja, waarom schreef ik dan “daar” en niet “er”? Omdat “daar” sterker de nadruk legt op de terugverwijzing naar het antecedent in de voorgaande zin, terwijl “er” dat zou wegmoffelen. Dat was een verwijzing die ik er nou wel wou inhouden, in tegenstelling tot die “nu”, waarvan ik de directheid had verborgen.
Maar er is nog iets: hoe je ook telt, met woorden of met lettertekens, de AI kwam altijd met langere oplossingen aandraven. Nogal typisch: de kletsbarakken kunnen wel foutloze zinnen produceren, maar dat doen ze vaak door woordomhaal. Ze kunnen immers niet denken, en hebben geen enkel inzicht in de betekenis van de zin.
Dat heeft twee gevolgen: ten eerste had ik alle overwegingen die ik had gemaakt tijdens mijn vertaling, ook moeten maken als ik de AI had gebruikt, om de gebreken uit de vertaling te halen. En ik zou dus geen tijd hebben gewonnen.
En ten tweede ontstaat die woordomhaal doordat AI vermijdt foute zinnen af te leveren, zodat het allemaal goed oogt, terwijl het dat niet is. En dan bestaat het gevaar dat je die gebreken onbewust of onoplettend overneemt.
Onlangs moest ik het volgende Duitse zinnetje vertalen: “Modellbahnliebe in Gemeinschaft”. Raad eens wat het automatischvertaalprogramma van de klant opleverde? “Samen de liefde bedrijven voor de modelbaan.” (!) Ja, zeg, dát zie ik me al schrijven! Ik heb het netjes gehouden op: “Samen plezier beleven aan de modelbaan”. Toegegeven, het is wat langer, maar je ligt niet in een breuk van het lachen.
Leuk opdrachtje: Duitse catalogus met allerlei feestartikelen en wat gebruiksvoorwerpen waar je thuis wel wat mee kunt aanvangen. En dan, in die kolom met doeltaal, heel eenzaam het woordje: “je”.
Je? In het Duits? Een beetje woordenboek vertelt daar van alles over, maar het eerste kon het al niet zijn: ooit, weleens.
Nou, in een catalogus kan wel staan “ooit onbetaalbaar”, of “weleens gezocht”, maar zo op z’n eentje…
Dus even in de pdf met de brontekst kijken, en daar stond “je 20 €”.
Maar ook daarvoor gaf het woordenboek niet echt een oplossing. Geen enkele mogelijkheid paste echt. Woordenboeken zijn nu eenmaal als confectiekleding: je komt er vaak mee weg, maar o wee als je buiten de standaardmaten valt of eens wat aparts wilt.
Alleen als deel van een uitdrukking, zoals in “zu je einem Euro”, leek een oplossing. En dat werd dan “elk voor één euro”. Wat ook niet klopte. Een gesuggereerde vertaling was “per”, met als voorbeeld “etwas kostet 10 Euro je angefangene Stunde”, geïnterpreteerd als “iets kost 10 euro per aangebroken uur”. En al wees dat allemaal in een bepaalde richting, in mijn tekst stond die “je” in “je 20 €” er nogal naakt bij. Of er volgde te weinig achter de “je”, of er ontbrak gewoon “zu” voor.
Dus lexica gaven geen kant-en-klare oplossing. Vertaalwoordenboeken zijn dan ook zelden bedoeld als aandragers van één-op-één vertalingen. Ze zijn een collectie suggesties. Ze duiden een richting aan om je op weg te helpen, maar de definitieve interpretatie en woordkeuzes moet je zelf doen.
Uit de context in de catalogus bleek dat die “je X €” op heel verschillende zaken betrekking kon hebben: pakjes, losse producten, samenhorende voorwerpen…
Uiteindelijk bedacht ik vier interpretaties: per stuk, per verpakking, per set en per pak of per pakje.
“Per set” gebruikte ik bijvoorbeeld voor bestek. “Per verpakking” is eigenlijk hetzelfde als “per pak” of “per pakje”, maar de laatste twee paste ik toe op zaken die nooit per stuk worden verkocht, zoals gummibeertjes, en het eerste op pakketten van dezelfde voorwerpen die je wel per stuk zou kunnen kopen, zoals een krat bier. En “per stuk”, dat spreekt voor zich.
Bovendien stonden die prijzen nogal kriskras in de catalogus, doordat ze soms sloegen op een verpakking waar ook de stukprijs bij werd vermeld. Het was dus nogal verwarrend.
Echt geen opdracht om blind door een vertaalprogramma te jagen.
We attended the webinars organised by RWS during Elevate 2025 on the implication of AI on translation, and had some interesting talks with some of the other attendants.
It gave us the opportunity to stay in touch with the latest developments.
Remember the days when the web was young and people in the Netherlands called a ‘website’ a ‘webstek’?
The word didn’t catch on, but others did, like ‘koekje’ for ‘cookie’, although it’s not very general.
And homepage… That’s an odd one. Often one just writes ‘home’, and in that case almost nobody prefers a Dutch version. ‘Thuispagina’, however, is used, Although a search on Dutch language sites with domain name .nl reveals more than a billion occurrences of the word ‘homepage’, I doubt the validity of those search results. The Netherlands have only approximately 17 million inhabitants. Those figures suggest 75 web pages per inhabitant. Now, that’s not entirely impossible, but it is astonishing.
In general it looks as if Dutch coinages for web terminology didn’t really catch on, but that doesn’t mean you should altogether avoid them when translating, because it’s a way for a company to build its brand and character.
Some words did catch on, like ‘afdrukken’ for ‘to print’.
So it’s not only a matter of looking in a dictionary or putting everything in the hands of some AI. Remember when InterNet was spelled? Which became Internet, and finally plain internet? One has to notice such stuff, and it’s not purely a matter of statistics.
Talk it through with your translator, or make sure you can trust him he chooses what suites your company, personality or target audience.
Nederlands en Duits liggen als taal erg dicht bij elkaar. Nederlands werd trouwens lange tijd Nederduits genoemd. Voor Nederlandstaligen zijn Duitse teksten dan ook erg doorzichtig. Maar soms zijn er misleidende valse vrienden: woordvormen die in beide talen voorkomen, maar soms verrassend afwijkende betekenis hebben. Toen ik onlangs mijn kennis van het Duitse wijnvocabularium opfriste, werd ik verrast door een grappige valse vriend. Het Duitse weinig is immers een bijvoeglijk naamwoord dat ofwel betekent: “wijn bevattend”, ofwel “wijnachtig, als wijn”. Let wel: “weinig” betekent niet “wijn bevattend” zoals een vat dat wijn bevat, maar bijvoorbeeld een taart die naar wijn smaakt, of een saus die met wijn is gemaakt. Het heeft dus niets te maken met het Nederlandse “weinig”, dat een onbepaald telwoord of een bijwoord is.
L’intelligence artificielle (IA) n’a rien de nouveau en matière de traduction.
Le secteur de la traduction a toujours été l’un de premiers à intégrer la technologie de l’information et de la communication (ICT), parce que traduire c’est communiquer. Les traducteurs ont aussi été les premiers à utiliser les télécopieurs à grande échelle. Nous avons également été les premiers à utiliser des PC, même si c’était uniquement pour que le travail final soit propre. Et nous avons aussi été les premiers à utiliser des PC pour installer des bases de données, ainsi que pour automatiser les dictionnaires et le contrôle de l’orthographe.
L’un des premiers avantages qui m’a séduit dans la traduction assistée par ordinateur était la possibilité de conserver la mise en page du document original. Fini le temps des feuilles de papier avec des blocs de texte numérotés pour établir le lien avec le texte source. Le client recevait enfin un document traduit sans risque de confusion et qu’il pouvait facilement intégrer dans sa chaîne de production.
Lorsque la mémoire des ordinateurs est devenue suffisamment importante et rapide pour stocker le texte source et le texte cible des traductions, nous avons pu récolter les fruits de notre travail antérieur en automatisant ce que nous faisions depuis des décennies : baser les traductions de documents modifiés sur celles des versions précédentes. Mais cette fois, nous n’avions plus à passer au crible et à retaper des piles de textes. L’ordinateur faisait cette partie du travail pour nous, et nous pouvions nous concentrer sur les parties nouvelles et modifiées afin de livrer plus rapidement un meilleur résultat.
La dernière évolution a été l’introduction de la traduction assistée par ordinateur (TAO, ou CAT pour computer aided translation en anglais). Une fois ces logiciels adoptés, la mise en place de règles programmées pour comparer le texte source avec différents types de textes cibles, permettant ainsi au programme de nous aider à adapter le texte cible, n’a plus été qu’une question de temps.
Il en a inévitablement découlé l’introduction d’une intelligence accrue dans ces logiciels, ce qui a finalement donné naissance à ce que nous appelons la traduction automatique (TA, ou MT pour machine translation).
C’est pourquoi je ne comprends pas l’engouement actuel autour de la traduction avec l’IA. En réalité, la TA EST de la traduction avec l’IA. Bien souvent, les systèmes de TA n’utilisent pas la TAO traditionnelle comme base, mais la TAO classique intègre généralement des éléments de TA afin d’utiliser la traduction automatique pour préparer le travail final du traducteur, accélérer le processus et éviter les erreurs des systèmes purement automatisés.
La TA ne fonctionne pas sans la post-édition de traduction automatique (MTPE, machine translation post-editing). Le traducteur révise et édite le texte après la traduction automatique. C’est également ainsi que fonctionne la traduction avec l’IA. La seule différence entre la traduction avec l’IA et la MTPE est terminologique : ce sont deux expressions différentes pour désigner la même chose. C’est pourquoi l’énorme battage médiatique autour de l’IA dans la traduction n’est rien de plus qu’un changement de terminologie, parfois accompagné d’un changement de fournisseur : certains affirment utiliser l’IA pour attirer des clients, mais en réalité, ils font exactement ce que le secteur de la traduction fait depuis au moins dix ans.
Le terme « IA » pour la traduction relève davantage du marketing et du window dressing que d’une nouvelle méthode de travail plus avancée.
Artificiële intelligentie (AI) voor vertalen is niets nieuws.
Het vertaalvak is altijd al beïnvloed geweest door ICT, omdat het nu eenmaal over communicatie gaat. Vertalers waren bij de eersten die faxmachines op grote schaal konden gebruiken. We waren ook bij de eersten die pc’s toepasten, zelfs al was het alleen maar om ervoor te zorgen dat het afgeleverde werk er netjes uitzag. En we waren ook de eersten die pc’s gebruikten om er databases op te installeren om geautomatiseerde woordenboeken en spellingcontrole te gebruiken.
Een van de eerste voordelen die mij aansprak bij vertalen met computers, was dat we de lay-out van het oorspronkelijke document konden behouden. De dagen van velletjes papier met genummerde tekstblokken om het verband te leggen met de oorspronkelijke tekst, waren voorbij. De klant kreeg eindelijk een vertaald document zonder het risico tekst te verwarren, en dat hij vlot in zijn productketen kon introduceren.
Toen de computergeheugen groot en snel genoeg werden om brontekst en doeltekst van vertalingen op te slaan, konden we de voordelen oogsten van ons vroegere werk door de automatiseren wat we al decennia lang deden: vertalingen van gewijzigde documenten baseren op vertalingen van vorige versies. Maar deze keer moesten we geen stapels teksten meer doorploegen en overtikken. De computer deed dat deel van het werk voor ons, en wij konden ons concentreren op de nieuwe en gewijzigde delen en sneller een beter resultaat afleveren.
De jongste evolutie was de introductie van on of computerondersteund vertalen of CAT (van computer aided translation). Eenmaal die programma’s werden gebruikt, was het alleen nog maar een kwestie van tijd voor er programmaregels werden geïmplementeerd om bronmateriaal met allerlei soorten doelmateriaal te vergelijken, zodat het programma ons kon ondersteunen bij het aanpassen van de doeltekst.
Dat betekende onvermijdelijk dat er meer intelligentie in die programma’s werd geïntroduceerd, en dat leidde ten slotte tot wat we machinevertalingen, of MT (van machine translation) noemen.
Daarom begrijp ik de huidige hype over vertalen met AI niet. In feite IS MT vertalen met AI. MT-systemen gebruik vaak geen traditionele CAT als basis, maar traditionele CAT heeft doorgaans wel MT-elementen geïmplementeerd zodat MT wordt gebruikt voor de voorbereiding van het definitieve werk van de vertaler om het proces te versnellen en tegelijk de fouten te vermijden die pure geautomatiseerde systemen maken.
MT werkt niet zonder MTPE: machine translation post editing. De vertaler voert een redactie na de machinevertaling uit. Op die manier werkt ook vertalen met AI. Het enige verschil tussen vertalen met AI en met MTPE is terminologisch: het zijn twee verschillende uitdrukkingen voor hetzelfde ding. Daarom is de enorme hype over AI bij vertalen niets meer dan een verschuiving in terminologie en soms ook in leveranciers: sommigen zeggen om klanten aan te trekken dat ze AI gebruiken, maar ze doen hetzelfde als wat de vertaalsector al minstens tien jaar doet.
De term AI voor vertalen is meer een kwestie van marketing en windowdressing dan van een nieuwe, meer geavanceerde manier van werken.