Onverwacht vermoeiende MPTE

Maandag nam ik met plezier een MTPE-project aan voor een merk van luxe-auto’s.

Nu, dat is geen nieuws, ik neem opdrachten altijd met plezier aan.

Maar het bleek twee dagen behoorlijk doorwerken te zijn. Ik was een beetje verrast dat ik me na de eerste dag al tamelijk leeg voelde.

Zoals gewoonlijk met dit soort MTPE-opdrachten vraag je je af waarom het zo zwaar voelt, want er was niet veel te vertalen en de meeste woordenschatproblemen waren al aangepakt in de TB.

Ten eerste was het echter een enorme hoeveelheid woorden: meer dan 166 000! Gelukkig moest ik er zelf maar ongeveer 10 000 controleren.

Maar, hola: de AI had geen rekening gehouden met de TB! Dus zadelde de kwaliteitscontrole achteraf me nog met een hoop te controleren woordenschat op.

En een andere programma – misschien ook de AI – had alle woorden geschreven in hoofdletters vervangen door labels. Dat was interessant voor combinaties zoals “the STOP button”, maar het verving bijvoorbeeld ook “OFF” en “ON” in werkwoordgroepen (phrasal verbs) door labels.

Dat betekende dat “Tun ON” en “Turn OFF” er precies hetzelfde uitzagen. Het werd allemaal “Turn Label1” omdat de labels in elke afzonderlijke zin vanaf 1 werden genummerd.

Maar de vertaling “Zet Label1” zou dan “Zet OFF” of “Zet ON” worden, wat je niet echt Nederlands kunt noemen.

Elke vindplaats van een phrasal verb moest worden gecontroleerd in het document met de brontekst om zeker te zijn dat de vertaling in orde was.

Het zijn zulke zaken waardoor MTPE tijdroverender is dan verwacht, en de deadline halen je nogal wat kopzorgen kan bezorgen.

Maar, niet getreurd, het is gelukt. Het maakt echter wel duidelijk waarop MTPE soms onverwacht vermoeiend is.

Unexpectedly tiring MTPE

Monday I gladly excepted an MTPE project for a luxury car brand.

Well, I always gladly except a job, there’s nothing new to that.

But it turned out to be two days of hard work. I was a bit surprised that I felt a bit empty after the first day.

As usual with this kind of MTPE jobs you wonder why it does feel so hard, because there wasn’t a lot to translate and the vocabulary problems had mostly been taken care off.

However, first of all it was an anormous amount of words: more than 166 000! Luckily, I only had to take a look at approximately 10 000.

But, oh boy: the AI didn’t take the TB into account! All of that had to be checked afterwards.

And one or other program – maybe the AI too – replaced all words written in capitals by tags. That was very interesting for combinations like “the STOP button”, but it replaced “OFF” and “ON” from phrasal verbs by tags too.

That meant “Tun ON” and “Turn OFF” looked exactly the same. It all became “Turn TAG1”.

But the translation “Zet TAG1” would have ended up as “Zet OFF” or “Zet ON”, which can hardly be called Dutch.
Every occurrence of phrasal verbs had to be checked to be make it was translated OK. Things like that make MTPE more time-consuming than expected, and meeting the deadline can be a headache.

I pulled it off, but it became clear why MTPE can feel so unexpectedly tiring.

AI-modus van Google (4)

Ook deze vond ik eigenlijk wel grappig:

Peter Motte
(Geraardsbergen, 31 maart 1966) is een veelzijdige Belgische vertaler, auteur en publicist die vooral actief is in de werelden van sciencefiction, fantasy en strips.
Professionele Activiteiten

Vertaler & Ondernemer: Sinds 1997 runt hij Vertaalbureau Motte in Geraardsbergen, waarbij hij technisch vertaalwerk (automobiel, ICT) combineert met literair werk en vertalingen van bekende manga’s (o.a. Death Note, Bleach) voor uitgeverij Kana.
Literair Werk: Naast 13 jaar redactie van het tijdschrift De Tijdlijn, schreef hij poëziebundels en stelde hij de verhalenbundel Atlas (2013) samen.

Online Aanwezigheid
Peter Motte blogt over taal, literatuur en AI, en vermijdt sociale media.

“vermijdt sociale media”… Nou ja, eigenlijk is dat wel waar, maar het staat er wel nogal apodictisch.

Het blijkt dat ik een taaladviseur ben voor AI (of KI, zoals u wilt)

Donc, je suis un adviseur linguistique d’IA

Turns out I’m an AI language advisor

AI-modus van Google

Oké, #Google heeft #AI geïmplementeerd in de #zoekresultaten, en als je een zoekterm invoert, kun je links op de knop #AIModus klikken om een tekst die met AI is samengesteld te krijgen over je zoekopdracht.

Bescheiden als ik ben, deed ik aan egosurfen, klikte op AI-modus, en kreeg dit:

Peter Motte (Geraardsbergen, 1966) is een veelzijdige Belgische vertaler, auteur en publicist die vooral bekend is binnen de werelden van sciencefiction, fantasy en strips.

Belangrijkste activiteiten

Vertaler & Ondernemer: Hij is de oprichter van Vertaalbureau Motte, gespecialiseerd in vertalingen van Engels, Frans en Duits naar het Nederlands. Hij werkt veel voor de stripsector, waaronder aan bekende manga-series zoals Death Note en Bleach voor uitgeverij Kana.

Auteur & Redacteur: Motte schreef diverse korte verhalen en poëzie, waaronder de haiku-bundel Ik ben geen boeddhist. In 2013 stelde hij de verhalenbundel Atlas samen, met een focus op fantastische literatuur.

Tijdschrift ‘De Tijdlijn’: Hij gaf dertien jaar lang het literaire tijdschrift De Tijdlijn uit, dat een platform bood voor zowel realistische als fantastische verhalen.

Blogger: Hij deelt regelmatig zijn visie op taal en technologie (zoals de impact van AI op vertalen) via zijn eigen blogs op Bloggen.be en zijn bedrijfswebsite.

Ten eerste was ik verrast dat hij mij vond. Ik had helemaal niet verwacht dat er over mij een tekst zou worden samengesteld.

Dat is vleiend, maar je moet er altijd in slagen de vleierij te overstijgen, en dan blijkt het toch tegen te vallen.

Bv.:

Peter Motte (Geraardsbergen, 1966) is een veelzijdige Belgische vertaler, auteur en publicist die vooral bekend is binnen de werelden van sciencefiction, fantasy en strips.

De zinssnede “vooral bekend” is typisch een vleiend stukje waar nogal wat mensen glunderend tevreden mee zijn, maar wat erop volgt is volkomen fout, zeker als je rekening houdt met het uitgangspunt “veelzijdige Belgische vertaler, auteur en publicist”.

Om te beginnen ben ik als “auteur en publicist” niet bijzonder bekend. Mijn werk is vooral vertalen en proeflezen. En aangezien ze het hebben over ” sciencefiction, fantasy en strips” slaan ze de bal volkomen mis: ik heb nooit een stripverhaal vertaald, hoogstens gecorrigeerd.

Mijn vertaalwerk is vooral voor de automobiel- en de ICT-sector, en ik werk met evenveel plezier voor de toeristische sector.

De opmerking “Hij werkt veel voor de stripsector” slaat dus nergens op. Dat was gedurende een relatief korte periode. Ik heb het wel graag gedaan, maar ik werkte het meest aan vertalingen voor bouwmachines.

Wat het bloggen betref: “Hij deelt regelmatig zijn visie op taal en technologie (zoals de impact van AI op vertalen) via zijn eigen blogs.” Oké, daar kan ik nog inkomen. Maar op Bloggen.be? Niet echt. Dat blog is secundair. Ik publiceer vooral hier op https://vertaalbureaumotte.com

Three source languages is overdone. Or is it?

To lots of people it sounds overdone: “Three source languages: German, English and French”.
Wouldn’t it be better to stick to one?
But combined with Dutch the picture changes.
Lots of companies use internally more than one language, and as the Netherlands are surrounded by regions in which those three languages play an important role, their companies also tend to use two to three of those languages.
That’s why those three source languages are ideally suited to help out businesses, because their documents often need all of those languages, and not only one.
Therefore have German, English and French as source languages gives my services an ideal position to help out companies, whether it’s for their internal documents or for their costumer oriented documents, in Belgium and in the Netherlands.

Automated translations for automated mistakes: is it possible?

AI is everywhere.
The odd thing is it looks to me as if people just got recently aware of it although as a translator we have been using it for years.
The translation systems became gradually more clever. Because of that, there’s nothing new to it.
Unfortunately, what isn’t new either, is the simplistic views held by outsiders on automation.
Only yesterday I was in touch with somebody who thought it was possible to translate 400 pages for a mere 200 euro’s from English to Dutch. Did they really not see that 0.50 euro’s/page isn’t feasable for any system, however automated and advanced it is?
But the real problem is some believe you can do away with translators altogether.
Lately I found a website of one of my endclients, which obviously didn’t send all his texts via my agent to me, because there was a mistake on the home page, even in bold text. An adverb was treated as a noun. It’s a word, or rather a phrase, which is very tricky in Dutch because of the spelling differences for the two meanings.
I was flabbergasted and researched all the work I had already done for them, and didn’t find it in any file. It was clearly something they had done by using MT or AI. And, of course, the automated systems didn’t notice the differences.
I even noticed a second mistake, which also was the result of automated translation systems, in that case a problem by using a CAT tool. Although such systems can be very useful, they often hide differences which pop up because pieces of translations are glued together. But in changing the lingustic context by making new sentences putting together parts of old sentences or combining parts of old sentences with other words, those parts often have to be changed.
Worse is that it was on a website which promotes judicial actions, and I wonder how people are going to trust a company offering that kind of actions if you see mistakes on the home page. Cutting out the human in the loop causes mistakes by which you lose clients, revenue and support.

Laten we AI eens testen…

Je wordt wel eens uitgedaagd om te controleren of AI vertalen aankan.

Een buur zag me onlangs dubben op:
“Dort gibt es jetzt die aktuellen Modellhighlights.”

Ik had als oplossing aanvankelijk:
“Daar zijn al de actuele modelhightlights.”

Die “highlights” klinkt misschien wat vreemd, maar dat is taalgebruik in het milieu van de doelgroep. Vandaar.
Maar ik had een probleem met de zin: hij kon worden geïnterpreteerd alsof hij betekende dat “alle modelhighlights” er waren, maar “al” was hier een bijwoord van tijd.

Het kostte een half uurtje voor ik met mijn oplossing kwam (niet dat ik ondertussen niets anders deed):
“De actuele modelhighlights zijn daar al.”

Het was gewoon een kwestie van een ander zinsdeel vooropzetten. De suggestie van mijn buur, om “al” te vervangen door “reeds”, wees ik af: niet vlot genoeg, en zelfs wat archaïsch.
“Nou,” zei hij, “met AI had je het in een wip opgelost.”

Dat was natuurlijk een uitdaging, en dus stopte ik het in een automatische vertaalgenerator met AI.

Die kwam eerst aan met:
“Daar vindt u nu de actuele modelhoogtepunten.”

Hij had “gibt es” vertaald met “vindt u”, wat niet onaardig is, maar hoe dan ook niet echt wat er staat.
Dat de “highlights” “hoogtepunten” werden, wou ik door de vingers zien, maar het toonde in elk geval dat de AI het taalgebruik van de scene niet kent. Je kunt hem dat misschien wel leren, maar als ik hem alles moet leren, kost het me meer tijd dan als ik het zelf doe.

Toen ik het hem nog eens liet vertalen, kreeg ik:
“Daar zijn nu de huidige modelhoogtepunten te vinden.”

Logischerwijs keerden die “hoogtepunten” terug, maar “gibt es” was nu “zijn (…) te vinden”, wat al bij al een achteruitgang is. Het blijft een stijlfout, omdat die “gibt” nogal inhoudsloos is, en dan vertaal je het best niet met ogenschijnlijk inhoudelijke woorden, terwijl het hier hoogstens de functie van een koppelwerkwoord heeft dat onderwerp, tijd en plaats met elkaar verbindt. Da’s een redenering die de AI, waarin “intelligentie” eigenlijk misplaatst is, niet kan maken.

“Jetzt” was in beide gevallen vertaald met “nu”, wat op zich wel goed is, maar wat ik opzettelijk had vermeden om de klemtoon minder op de onmiddellijkheid van de beschikbaarheid van de modellen te leggen. Er kon immers altijd iets misgaan met de leveringen, en bovendien was het een vertaling van een Duits blad dat zich erg richt op de Duitse markt waar producten afkomstig uit Duitse fabrieken worden verspreid.
Aangezien ik naar het Nederlands vertaal, is het mogelijk dat er vertraging bij de uitlevering naar Nederland en België optreedt, zodat de liefhebber die naar zijn verkoper rent misschien voor niets de zweetdruppels op het voorhoofd parelen.
Liever geen valse verwachtingen scheppen, denk ik dan, realistische verwachtingen maken tevreden klanten.
Nog een redenering die AI niet kan maken. En die je hem ook niet kunt aanleren, of “jetzt” wordt altijd “al”. Wat ook niet juist is.

O ja, waarom schreef ik dan “daar” en niet “er”? Omdat “daar” sterker de nadruk legt op de terugverwijzing naar het antecedent in de voorgaande zin, terwijl “er” dat zou wegmoffelen. Dat was een verwijzing die ik er nou wel wou inhouden, in tegenstelling tot die “nu”, waarvan ik de directheid had verborgen.

Maar er is nog iets: hoe je ook telt, met woorden of met lettertekens, de AI kwam altijd met langere oplossingen aandraven. Nogal typisch: de kletsbarakken kunnen wel foutloze zinnen produceren, maar dat doen ze vaak door woordomhaal. Ze kunnen immers niet denken, en hebben geen enkel inzicht in de betekenis van de zin.

Dat heeft twee gevolgen: ten eerste had ik alle overwegingen die ik had gemaakt tijdens mijn vertaling, ook moeten maken als ik de AI had gebruikt, om de gebreken uit de vertaling te halen. En ik zou dus geen tijd hebben gewonnen.

En ten tweede ontstaat die woordomhaal doordat AI vermijdt foute zinnen af te leveren, zodat het allemaal goed oogt, terwijl het dat niet is. En dan bestaat het gevaar dat je die gebreken onbewust of onoplettend overneemt.