Bel ons

Maakt AI volumetrische video overbodig? De data zegt van niet

21/11/2025 – Door Natasja Paulssen

Het gesprek duikt steeds vaker op, zowel in bestuurskamers als op conferenties: nu AI zo snel vooruitgaat, hebben we die dure volumetrische capturestudio’s eigenlijk nog wel nodig? Als algoritmes fotorealistische gezichten kunnen genereren en 3D-scènes uit één enkele afbeelding kunnen reconstrueren, dan zijn de dagen van multi-cameraopstellingen en gespecialiseerde hardware toch geteld?

De recente Strategic Research & Innovation Agenda for Virtual Worlds van de Europese Unie suggereert iets verrassends. In plaats van volumetrische capture af te schrijven, wordt de technologie expliciet genoemd als een fundamentele voorwaarde voor de volgende generatie digitale ervaringen. De markt lijkt dit te bevestigen. De omzet in volumetrische video zal naar verwachting stijgen van 2,95 miljard dollar in 2024 tot meer dan 20 miljard dollar in 2032, een samengesteld jaarlijks groeipercentage van meer dan 26 procent.

Wat is hier precies aan de hand? Het antwoord onthult een fundamenteel misverstand over hoe AI en captur technology zich eigenlijk tot elkaar verhouden.

De trainingsdata-paradox

De patronen in de industrie laten iets interessants zien. In januari 2024 introduceerde Meta AI-gedreven volumetrische verwerking voor zijn Metaverse-platformen. Maar al in september demonstreerde Reality Labs Hyperscape, met high-fidelity Gaussian Splat-captures van fysieke ruimtes die uitgebreide camera-opstellingen vereisen. De productdirecteur van het bedrijf legde uit: ze hebben verschillende AI-only methoden geprobeerd, maar betere resultaten behaald met systemen die eerst echte ruimtelijke informatie vastleggen en deze vervolgens met algoritmes verbeteren.

Dat patroon herhaalt zich in de hele sector. Bedrijven met toonaangevende AI-onderzoekscapaciteiten blijven investeren in fysieke capture-infrastructuur. De reden wordt duidelijk zodra je bekijkt hoe deze AI-modellen werkelijk werken: ze creëren geen kwaliteit uit het niets. Elke indrukwekkende diepte-inschatting, elke neural rendering doorbraak, is getraind op enorme datasets die zijn vastgelegd in professionele volumetrische studio’s.

De EU-SRIA zegt het helder: “De mogelijkheid om echte objecten, omgevingen en zelfs mensen in 3D vast te leggen is een fundamentele voorwaarde voor de realisatie van hoogwaardige Digital Twins en immersieve Virtuele Werelden.”Verder stelt het document dat hoewel modellen als ZoeDepth en Depth Pro goed presteren op losse beelden, “deze modellen nog niet geschikt zijn voor dynamische sequenties omdat ze temporele coherentie missen.”

Met andere woorden: de AI die volumetrische capture zou moeten vervangen, heeft volumetrische capture nodig om überhaupt te bestaan.

Waar AI écht past

De relatie tussen AI en capturehardware is geen vervanging, maar een versterking. High-fidelity capture levert ground truth en genereert trainingsdata. AI comprimeert die data, vult gaten tussen camerastandpunten op en optimaliseert voor real-time streaming. Samen maken ze toepassingen mogelijk die met geen van beide technologieën afzonderlijk haalbaar zouden zijn.

Recent onderzoek gepubliceerd in Frontiers in Signal Processing bevestigt deze hybride realiteit. Na een analyse van de technologische stand van zaken concludeerden de onderzoekers dat “RGBD-gebaseerde benaderingen nog steeds de meest populaire en wijdverspreide technologie zijn voor het vastleggen van volumetrische video met weinig camera’s.”Hoewel AI-only reconstructiemethoden potentie tonen, “is volledige dynamische scenereconstructie vanuit meerdere camerahoeken nog niet aangetoond, en de hoge GPU-verwerkingsvereisten kunnen deze methode duur maken.”

Het opkomende patroon wijst op complementariteit in plaats van concurrentie. Professionele capture biedt de kwaliteitslimiet en de trainingsbasis. AI biedt optimalisatie en toegankelijkheid. De markt differentieert zich in niveaus in plaats van te consolideren naar één oplossing.

De Europese dimensie

Europa’s focus op volumetrische capture heeft extra strategisch gewicht. De SRIA waarschuwt expliciet voor de “kritieke strategische afhankelijkheid van niet-Europese aanbieders voor kern-XR-technologieën.” De meeste geavanceerde capture-faciliteiten bevinden zich momenteel in Noord-Amerika of Azië. Dat zorgt niet alleen voor logistieke problemen, maar roept ook vragen op over digitale soevereiniteit.

Wanneer Europese zorgsystemen Digital Twins ontwikkelen voor precisiegeneeskunde, wanneer musea interactieve historische ervaringen bouwen, wanneer bedrijven telepresence-systemen opzetten, dan is de kwaliteit van de trainingsdata die AI-modellen vormt van groot belang. Representatie is belangrijk. Lokale verwerkingscapaciteiten zijn belangrijk. Controle over biometrische data is zeer belangrijk.

De EU ziet Virtuele Werelden als een kans van 800 miljard euro tegen 2030, met 860.000 nieuwe banen in Europa al tegen 2025. Om deze groei te ondersteunen is infrastructuur nodig, niet alleen algoritmes. Zoals de SRIA stelt, maken technologieën voor real-time 3D-capture “remote samenwerking mogelijk die fysieke aanwezigheid echt nabootst,” en vertegenwoordigen ze onderzoeksgaten waarin “momenteel geen enkel systeem real-time holografie, multimodale feedback, netwerkoptimalisatie en een mensgerichte ervaring naadloos integreert.”

Vooruitkijken

De vraag is niet of AI volumetrische video zal transformeren want dat doet het nu al. Neural compression draagt bij aan het drastisch verlagen van de uiteindelijke volumetric bestandsgrootte. AI-ondersteunde capture-workflows worden standaard. Single-camera oplossingen verbeteren snel voor consumentenmarkt-toepassingen.

Maar de vraag of AI professionele capture-infrastructuur overbodig maakt, is gebaseerd op een verkeerd inzicht in de technologie-stack. De AI-doorbraken die smartphone-demonstraties mogelijk maken, vergroten juist de vraag naar hoogwaardige trainingsdata die alleen professionele faciliteiten kunnen leveren. De neural rendering technieken die bandbreedte optimaliseren, vereisen grondwaarheid die met nóg hogere kwaliteit wordt vastgelegd.

Bedrijven die volledig inzetten op AI-only oplossingen bereiken uiteindelijk een plafond dat wordt bepaald door de kwaliteit van hun trainingsdata. Organisaties die bouwen op high-fidelity capture kunnen AI steeds verder toevoegen naarmate algoritmes verbeteren, terwijl ze kwaliteitsvoordelen behouden die zich op lange termijn opstapelen.

De sterke groei van de volumetrische videomarkt in een tijd van snelle AI-ontwikkeling spreekt voor zich. Net als de aanhoudende investeringen van grote technologiebedrijven in fysieke capture-infrastructuur. En net als de strategische prioritering van deze capaciteiten binnen de EU’s officiële onderzoeksagenda.

AI vormt geen bedreiging voor volumetrische video. Het verandert wat volumetrische video moet zijn, en maakt het belangrijker dan ooit.

21-11-2025
,