Multimodale AI

Multimodale kunstmatige intelligentie (multimodale AI) verwijst naar AI-systemen die tegelijkertijd verschillende soorten gegevens (of modaliteiten) kunnen verwerken, interpreteren en integreren, zoals tekst, afbeeldingen, audio, video of zintuiglijke gegevens, om completere en genuanceerdere reacties of beslissingen te genereren.

In tegenstelling tot traditionele (unimodale) AI-modellen, die zich specialiseren in één soort gegevens (tekst/afbeeldingen/video/audio), bootst multimodale AI de menselijke cognitie na door heterogene bronnen te combineren voor een verrijkt begrip van de context.