Alibaba heeft met de lancering van een nieuwe set softwaremodellen voor fysieke robots de technologische strijd definitief verplaatst naar onze tastbare werkelijkheid. De belofte van kunstmatige intelligentie speelde zich de afgelopen jaren voornamelijk af achter het glas van jouw computerscherm en telefoon. Je raakte gewend aan de tekstuele interacties met chatbots die code schrijven of gedichten componeren, en je verbaasde ons over de snelheid waarmee deze digitale assistenten antwoorden formuleerden. Toch bleef er een fundamentele barrière bestaan tussen deze abstracte wereld van taal en de weerbarstige realiteit van alledag. Een chatbot voelt immers geen zwaartekracht, begrijpt de textuur van een object niet en heeft geen besef van de driedimensionale ruimte waarin objecten kunnen omvallen of verschuiven. De stap van deze techgigant uit Hangzhou laat zien dat de strijd om de dominantie op het gebied van kunstmatige intelligentie nu echt op de fabrieksvloer wordt uitgevochten.


Deze overgang naar wat in de sector belichaamde intelligentie (de versmelting van geavanceerde software met een fysiek robotlichaam) wordt genoemd, vormt de volgende grote arena voor technologiebedrijven wereldwijd. Tot voor kort was de markt scherp verdeeld. Aan de ene kant stonden de softwaregiganten die blonken uit in taalanalyse en patroonherkenning op basis van enorme hoeveelheden internetdata. Aan de andere kant bevonden zich de roboticafabrikanten die mechanisch superieuze machines bouwden, maar worstelden om deze apparaten flexibel en autonoom te laten reageren op onverwachte situaties in een magazijn of op een fabrieksvloer. Een traditionele robot doet precies wat er is geprogrammeerd en loopt onherroepelijk vast wanneer een object een fractie van een centimeter buiten de verwachte positie ligt. De nieuwe generatie software probeert dit rigide systeem te doorbreken door robots uit te rusten met het vermogen om te kijken, te redeneren en te anticiperen voordat ze een handeling verrichten.


Hoewel de aankondiging past in een bredere wereldwijde trend, is de specifieke architectuur die hier wordt gepresenteerd om meerdere redenen opmerkelijk. Veel westerse pioniers proberen een allesomvattend model te bouwen dat alle taken tegelijkertijd uitvoert. Dat vereist een enorme hoeveelheid rekenkracht en leidt in de praktijk vaak tot vertragingen in de reactietijd van de machine. De benadering in dit nieuwe Chinese systeem kiest voor een modulaire opzet die de intelligentie opsplitst in 3 onderling verbonden lagen. De 1e laag richt zich puur op de visuele navigatie en helpt de machine om de driedimensionale ruimte te interpreteren en er veilig doorheen te bewegen. De 2e laag functioneert als een soort intern simulatieprogramma dat video gebruikt om de natuurwetten te voorspellen. De robot kan hierdoor in een fractie van een seconde simuleren wat er gebeurt als hij een object aanraakt of verplaatst, nog voordat de fysieke arm daadwerkelijk in beweging komt. De 3e laag is een compact en efficiënt model dat uitsluitend de motorische controle en de precieze mechanische handelingen aanstuurt.
Dit driedelige ontwerp lost een van de grootste praktische knelpunten op binnen de moderne robotica. Door de zware rekenprocessen voor het begrijpen van de wereld te scheiden van de directe aansturing van de hardware, kan de robot via deze weg veel sneller en adequater reageren op veranderingen in zijn omgeving. Het stelt de machine in staat om te leren van openbare data over hoe objecten zich gedragen en die kennis direct toe te passen in de praktijk. Dat dit geen theoretische exercitie is, blijkt wel uit het feit dat de software al direct in de praktijk wordt getest door geselecteerde cloudklanten in logistieke en industriële omgevingen.


De lancering intensiveert tegelijkertijd de geopolitieke dynamiek rondom technologische innovatie. De Verenigde Staten hebben via concerns als Google en Nvidia, en zwaar gefinancierde startups, een aanzienlijke voorsprong opgebouwd in de ontwikkeling van de meest geavanceerde softwaremodellen. Nvidia positioneert zichzelf al langer als de centrale spil in de robotica door zowel de noodzakelijke chips als simulatieplatforms (de digitale oefenruimtes waarin robots virtueel kunnen trainen) te leveren waarop digitale robots kunnen oefenen. Aan de andere kant van de oceaan beschikt China over een ongeëvenaard industrieel ecosysteem met diepe toeleveringsketens en lage productiekosten voor de fysieke hardware. Tot nu toe ontbrak het de Chinese roboticafabrikanten vaak aan de verfijnde software om hun machines echt autonoom te maken. Nu grote binnenlandse techbedrijven en cloudproviders de markt betreden met kant en klare systemen, sluit de kloof tussen het mechanische lichaam en het digitale brein zich in een hoog tempo.


De implicaties hiervan reiken veel verder dan de muren van distributiecentra en fabrieken. Wanneer software in staat is om de fysieke werkelijkheid accuraat te interpreteren, verandert de aard van automatisering fundamenteel. We bewegen weg van de wereld waarin machines uitsluitend repeterend werk in een gecontroleerde omgeving kunnen uitvoeren. De integratie van visuele vermogens en voorspellende macromodellen (modellen die de bredere context en fysieke wetmatigheden begrijpen) opent de deur naar systemen die kunnen omgaan met de chaos van het dagelijks leven. Dit verklaart ook waarom niet alleen traditionele softwareontwikkelaars, maar ook fabrikanten van elektrische voertuigen zich nu massaal op deze markt storten. De expertise die zij hebben opgebouwd met sensoren en computersystemen voor zelfrijdende auto’s laat zich relatief eenvoudig vertalen naar de aansturing van mensachtige robots of andere mobiele systemen.


Voor de kritische toeschouwer laat deze ontwikkeling zien dat de hype rondom generatieve kunstmatige intelligentie een nieuwe fase is ingegaan. De aanvankelijke fascinatie voor tekstgeneratoren en digitale plaatjesmakers maakt plaats voor een nuchtere, pragmatische focus op tastbare toepassingen. De uitdaging verschuift van het beantwoorden van vragen in een chatvenster naar het foutloos sorteren van goederen of het assembleren van complexe producten onder wisselende omstandigheden. Het succes van dergelijke systemen zal uiteindelijk niet worden afgemeten aan de complexiteit van de theorie, maar aan de betrouwbaarheid en de economische haalbaarheid op de werkvloer. De modulaire benadering die nu de kop opsteekt, zou wel eens de noodzakelijke katalysator kunnen zijn om deze technologie breed toegankelijk te maken voor commercieel gebruik en de belofte van autonome machines eindelijk te verzilveren.

,

Ontdek meer van Typify

Abonneer je nu om meer te lezen en toegang te krijgen tot het volledige archief.

Lees verder