Yann LeCun heeft Meta officieel verlaten om met Advanced Machine Intelligence Labs een frontale aanval te openen op de dominantie van Amerikaanse tekstgestuurde kunstmatige intelligentie. De breuk hing al langer in de lucht, maar de definitieve stap markeert een diepe ideologische splitsing in Silicon Valley. LeCun was jarenlang de hoogste wetenschapper op het gebied van kunstmatige intelligentie bij het moederbedrijf van Facebook, maar weigerde nog langer mee te gaan in de miljardenrace rond tekstrobots. Waar topman Mark Zuckerberg na het succes van ChatGPT alle pijlen richtte op grote taalmodellen (de systemen die teksten analyseren en genereren), noemde LeCun deze route herhaaldelijk een doodlopende weg. De bom barstte toen Zuckerberg miljarden investeerde in Scale AI en de jonge ondernemer Alexandr Wang aanstelde als hoofd van een nieuw laboratorium, waardoor LeCun plotseling orders moest aannemen van een dertiger. De Franse pionier pikte deze hiërarchie niet en trok zijn eigen plan. Met zijn nieuwe onderneming richt hij zich volledig op wereldmodellen (systemen die de fysieke werkelijkheid begrijpen door middel van beelden in plaats van taal). De lancering van dit nieuwe bedrijf is geen bescheiden experiment, want LeCun haalde direct 1,03 miljard dollar aan startkapitaal op tegen een waardering van 3,5 miljard dollar. Het is de grootste investeringsronde voor een startende onderneming in de Europese geschiedenis.
Het fundamentele probleem van de huidige generatieve systemen is hun blindheid voor de echte wereld. Grote taalmodellen bezitten geen echt begrip van oorzaak en gevolg, maar voorspellen simpelweg het volgende logische woord in een zin op basis van statistische waarschijnlijkheid. Een baby leert de wereld niet kennen door miljarden pagina’s tekst te lezen maar door simpelweg om zich heen te kijken en fysieke interactie aan te gaan. De nieuwe technologie van LeCun bootst dit proces na door kunstmatige intelligentie te trainen op honderden miljoenen uren aan videomateriaal. Door video te analyseren leert de software hoe objecten zich door de driedimensionale ruimte bewegen en wat er gebeurt als een voorwerp valt of ergens tegenaan stoot. Dit levert een diepgaand begrip van de fysieke realiteit op dat via geschreven tekst simpelweg nooit bereikt kan worden. Deze vorm van visuele training legt de basis voor autonome systemen die daadwerkelijk kunnen redeneren en complexe acties kunnen plannen in de echte wereld.
Deze verschuiving van tekst naar video is voor Europa een unieke geopolitieke kans om de digitale soeveriniteit (het recht en vermogen om zelfstandig over eigen digitale infrastructuur en data te beslissen) te heroveren op de techreuzen uit de Verenigde Staten. De huidige markt voor taalmodellen is nagenoeg volledig in handen van Amerikaanse partijen die hun systemen trainen op basis van Angelsaksische normen en waarden. Europa loopt in die specifieke race hopeloos achter omdat de noodzakelijke rekenkracht en datacentra grotendeels in Amerikaanse handen zijn. De stap naar visuele systemen gooit de kaarten echter volledig opnieuw op tafel. Omdat de technologie van LeCun zich richt op het begrijpen van universele natuurkundige wetten en visuele logica is de culturele en taalkundige dominantie van de Amerikaanse techsector ineens een stuk minder relevant. Een vallende appel of een rijdende auto gedraagt zich in Parijs of Berlijn immers exact hetzelfde als in San Francisco.
Het kapitaal achter de nieuwe onderneming laat bovendien zien dat de Europese markt hiermee een strategisch alternatief in handen krijgt dat niet zomaar opzij kan worden geschoven door de giganten uit Silicon Valley. Door de enorme kapitaalinjectie kan het bedrijf onafhankelijk van de grillen van partijen zoals Microsoft of Google bouwen aan een eigen infrastructuur. Dit biedt Europese bedrijven en overheden de kans om applicaties en robotsystemen te ontwikkelen die draaien op een fundament dat niet onderhevig is aan Amerikaanse wetgeving of commerciële spionage. Het nuchtere midden tussen naïef optimisme en protectionistische angst ligt in het bouwen van eigen kracht en deze verschuiving naar visuele kunstmatige intelligentie biedt daarvoor de perfecte opening. De dominantie van de traditionele techreuzen is niet in beton gegoten en de miljardenvloedgolf richting de visuele benadering bewijst dat de echte revolutie in de technologiesector wellicht net is begonnen.
