IA multimodale

Une intelligence artificielle multimodale (IA multimodale) désigne des systèmes d’IA capables de traiter, d’interpréter et d’intégrer simultanément plusieurs types de données (ou modalités), tels que le texte, les images, l’audio, la vidéo, ou les données sensorielles, pour générer des réponses ou des décisions plus complètes et nuancées.

Contrairement aux modèles d’IA traditionnels (unimodaux), spécialisés dans un seul type de données (texte/images/vidéo/audio), l’IA multimodale imite la cognition humaine en combinant des sources hétérogènes pour une compréhension contextuelle enrichie.