Heeft DeepL zijn nauwkeurigheid en Europese privacygaranties verloren onder druk van de Amerikaanse AI giganten?

De vertaalmachine uit Keulen gold jarenlang als het absolute paradepaardje van de Europese techsector omdat de software de ziel van een zin begreep. Waar de wereldwijde concurrentie houterige letterlijkheid voorschotelde koos dit Duitse systeem exact de juiste nuances waardoor de vertaling las alsof er een ervaren menselijke vertaler aan had gewerkt. Die stille betrouwbaarheid is de afgelopen maanden volledig geknakt door een onvoorspelbare drang naar kunstmatige creativiteit. De software vertaalt niet langer simpelweg de woorden die er staan maar begint jouw teksten actief te interpreteren en naar eigen inzicht te herschrijven. Waar je als auteur kiest voor een scherpe formulering of een bewuste herhaling strijkt de machine de tekst nu genadeloos glad tot een dertien in een dozijn marketingverhaal. Regelmatig verdwijnen er subtiele betekenissen of worden er complete zinsdelen weggelaten omdat het model denkt dat de tekst er vloeiender van wordt. De precisie is opgeofferd voor oppervlakkige gladheid en wat overblijft is een systeem dat weliswaar aardig lopende zinnen produceert maar regelmatig met een volstrekt andere betekenis aan de haal gaat.

Om te begrijpen waar deze opmerkelijke omslag vandaan komt moeten we terug naar de echte wortels van het bedrijf. In het jaar 2009 begon de reis onder de naam Linguee (de voorloper van de huidige vertaalmachine die destijds fungeerde als een contextuele zoekmachine voor talen). Het was een vindingrijke zoekmachine die niet zocht naar losse woorden maar puur naar de context waarin zinnen stonden. Het systeem indexeerde miljoenen officiële documenten van de Europese Unie en academische instellingen die al handmatig door experts waren vertaald. Hierdoor beschikte het bedrijf over de meest hoogwaardige trainingsdata ter wereld. Toen het team in het jaar 2017 de stap zette naar een eigen vertaalmachine onder de naam DeepL sloeg dat in als een bom. Hun gespecialiseerde neurale netwerk (de geavanceerde computertechnologie die menselijke hersens nabootst om complexe patronen te herkennen) bleef extreem dicht bij die menselijke kwaliteitsdata en dat bleek de gouden formule voor absolute betrouwbaarheid.

De rust in de vertaalmarkt werd eind 2022 ruw verstoord door de lancering van ChatGPT (de bekende tekstgenerator van het Amerikaanse bedrijf OpenAI die de wereld liet kennismaken met generatieve kunstmatige intelligentie). Ineens zag de hele wereld dat grote taalmodellen (software die getraind is op miljarden teksten om logische opeenvolgingen van woorden te voorspellen) in staat waren om teksten te genereren die ongekend natuurlijk klonken. Voor het traditionele DeepL ontstond er direct een existentiële dreiging op de wereldmarkt. Consumenten en zakelijke klanten raakten gewend aan de vloeiende stijl van de Amerikaanse systemen en de commerciële druk om mee te gaan in deze technologische wapenwedloop werd immens. Er werden honderden miljoenen aan extern durfkapitaal opgehaald om de kostbare overstap te maken naar een geheel nieuwe generatie van grote taalmodellen.

Daar ligt precies de kern van het huidige probleem waar veel gebruikers nu tegenaan lopen. Een traditionele vertaalmachine zoekt altijd naar de meest accurate overdracht van betekenis tussen twee talen. Een groot taalmodel werkt wezenlijk anders en is er primair op getraind om statistisch te voorspellen welk woord het beste volgt op het vorige om een aantrekkelijke tekst te vormen. Het vernieuwde platform gedraagt zich daardoor niet langer als een nauwkeurige tolk maar als een bemoeizuchtige redacteur. Het begint te hallucineren (het risicovolle fenomeen waarbij kunstmatige intelligentie zelf feiten of onjuiste betekenissen verzint die heel geloofwaardig klinken) en bedenkt modieuze oplossingen die de oorspronkelijke toon van de schrijver volledig overstemmen. Het platform wil zo graag indruk maken met vloeiende zinnen dat het de feitelijke juistheid steeds vaker uit het oog verliest.

Deze strategische koerswijziging heeft niet alleen geleid tot inhoudelijke frustratie bij kritische gebruikers maar heeft ook de technologische fundamenten van het bedrijf aan het wankelen gebracht. De nieuwe taalmodellen vereisen namelijk een astronomische hoeveelheid rekenkracht die de eigen infrastructuur van het bedrijf in Keulen simpelweg niet meer kon bolwerken. Om wereldwijd te kunnen opschalen en serieus te concurreren met de Amerikaanse giganten moest het roer noodgedwongen om. Dit leidde recent tot een ingrijpende aanpassing van de algemene voorwaarden waarbij Amazon Web Services (de gigantische Amerikaanse cloudprovider die wereldwijd servers verhuurt voor zware databewerking) werd toegevoegd als officiële subverwerker voor de gigantische datastromen.

Voor een platform dat zijn ijzersterke reputatie volledig heeft gebouwd op Europese privacywaarden is deze stap een ongekende waterscheiding. Tot voor kort konden Europese overheden, grote advocatenkantoren en privacygevoelige bedrijven er blind op vertrouwen dat hun documenten binnen afgesloten Europese datacenters bleven. Hoewel de directie in alle toonaarden bezweert dat alle data streng versleuteld blijft en de fysieke servers zich nog altijd op Europees grondgebied bevinden is de juridische realiteit fundamenteel veranderd. Door de overstap naar de infrastructuur van Amazon valt de dataverwerking onherroepelijk onder de invloedssfeer van de Amerikaanse wetgeving.

De Amerikaanse wet die bekendstaat als de Cloud Act (de Amerikaanse wetgeving die de federale autoriteiten in Washington de bevoegdheid geeft om data op te eisen bij Amerikaanse technologiebedrijven) geeft de overheid daar het recht om gegevens op te vragen. Het maakt daarbij wettelijk gezien helemaal niet uit of die data fysiek opgeslagen staat op een server in Frankfurt of in Dublin. Zodra een Amerikaanse partij de infrastructuur beheert is de digitale soevereiniteit in theorie doorbroken. Voor organisaties die gebonden zijn aan strikte Europese privacywetgeving of werken met hooggerechtelijke documenten is de vertrouwde veilige haven daarmee veranderd in een open zee met onvoorspelbare stromingen.

Het verhaal van deze transformatie legt een diepere ironie bloot van de huidige internationale technologische wedloop. In de haast om niet achterop te raken bij de trends uit Silicon Valley is het bedrijf precies datgene kwijtgeraken wat het destijds uniek en superieur maakte. De absolute betrouwbaarheid en de vlijmscherpe precisie hebben plaatsgemaakt voor een machine die teksten gladstrijkt tot een eenheidsworst. Tegelijkertijd is de belofte van een onafhankelijk Europees alternatief ingewisseld voor de bittere noodzaak om aan te haken bij de Amerikaanse cloudinfrastructuur om überhaupt te kunnen overleven in de markt.

De eindgebruiker blijft achter met een hulpmiddel dat nog steeds prima werkt voor een snelle alledaagse email maar ongeschikt begint te worden voor het fijngevoelige werk. Wie een opiniestuk, een literair essay of een complex juridisch contract wil vertalen kan er niet langer blind van uitgaan dat de machine de exacte waarheid spreekt. Je moet constant achterom kijken of de software de cruciale nuances niet stiekem heeft weggepoetst. De gladgestreken Toren van Babel staat weliswaar fier overeind maar de grote vraag is of we elkaar er op deze manier nog wel echt in begrijpen.

Heeft DeepL zijn nauwkeurigheid en Europese privacygaranties verloren onder druk van de Amerikaanse AI giganten?

Dit delen:

Vind ik leuk:

Ontdek meer van Typify