Accueil > Glossaire IA > Vision par ordinateur (computer vision)

Vision par ordinateur (computer vision)

Vision par ordinateur (computer vision en anglais) est un domaine de l’intelligence artificielle qui vise à permettre aux machines d’interpréter, d’analyser et de comprendre des données visuelles (images, vidéos).

Fonctionnement

Pour parvenir à cette compréhension, la vision par ordinateur s’appuie sur une combinaison de techniques avancées, notamment :

Le traitement d’images : qui permet de prétraiter et d’améliorer les données visuelles afin de faciliter leur analyse.
L’apprentissage automatique (machine learning) : qui offre des outils pour reconnaître des motifs et apprendre à partir de données.
L’apprentissage profond (deep learning) : qui utilise des architectures de réseaux neuronaux, en particulier les réseaux neuronaux convolutifs (CNN), pour extraire des caractéristiques complexes et hiérarchisées des images.

Ces méthodes permettent non seulement de détecter des objets et de classifier des scènes, mais aussi de reconnaître des visages, de segmenter des images ou de suivre des mouvements dans des séquences vidéo. Par exemple, les réseaux de neurones convolutifs imitent, de manière algorithmique, la manière dont le cerveau humain traite les informations visuelles, en filtrant et en hiérarchisant les données pour en extraire les éléments essentiels.

Les applications de la vision par ordinateur

Les applications de la vision par ordinateur sont vastes et variées, incluant notamment :

La reconnaissance faciale : utilisée dans la sécurité et l’identification.
Les véhicules autonomes : qui dépendent de la vision pour naviguer en temps réel dans des environnements complexes.
L’imagerie médicale : facilitant le diagnostic en détectant des anomalies sur des images médicales.
La réalité augmentée : enrichissant l’expérience utilisateur en superposant des informations virtuelles à notre environnement réel.

Retour au Glossaire