Différence entre IA, machine learning et deep learning en médecine

#IA & Santé 22 avril 2026 9 min de lecture

Trois termes, une confusion persistante

« Intelligence artificielle », « machine learning », « deep learning », « algorithme », « réseau de neurones »… Ces termes circulent dans les conférences médicales, les articles de presse spécialisée et les argumentaires commerciaux des éditeurs de logiciels de santé. Ils sont souvent utilisés de façon interchangeable, parfois par les vendeurs eux-mêmes, parfois par des journalistes mal informés, et parfois même par des professionnels de l’IA qui simplifient à l’excès.

Résultat : beaucoup de professionnels de santé ont l’impression de comprendre vaguement de quoi il s’agit, sans pouvoir vraiment distinguer ces concepts ni évaluer concrètement ce que tel ou tel outil fait réellement.

Cette confusion a des conséquences pratiques. Un médecin qui ne comprend pas la différence entre un système expert à base de règles et un modèle de deep learning ne peut pas évaluer correctement les limites de l’outil qu’on lui propose. Il ne peut pas poser les bonnes questions à un industriel, ni comprendre pourquoi un algorithme peut performer brillamment sur une population et échouer sur une autre.

Cet article vous propose une clarification progressive et ancrée dans des exemples médicaux concrets, sans formules mathématiques, sans jargon informatique inutile.

L’image des poupées russes : une métaphore pour tout comprendre

Imaginez trois poupées russes emboîtées les unes dans les autres. La plus grande, qui contient toutes les autres, s’appelle l’intelligence artificielle. À l’intérieur se trouve une poupée plus petite appelée machine learning. Et à l’intérieur de celle-là, une poupée encore plus petite : le deep learning.

Autrement dit : tout deep learning est du machine learning, et tout machine learning est de l’IA. Mais l’inverse n’est pas vrai : tout ce qui relève de l’IA n’est pas du machine learning, et tout ce qui relève du machine learning n’est pas du deep learning.

L’intelligence artificielle : le cadre général

Définition

L’intelligence artificielle est le domaine de l’informatique qui vise à concevoir des systèmes capables de réaliser des tâches qui, si elles étaient effectuées par un être humain, nécessiteraient de l’intelligence : comprendre un texte, reconnaître une image, résoudre un problème, prendre une décision, traduire une langue.

Les approches « classiques » de l’IA en santé

Avant le machine learning et le deep learning, l’IA en médecine reposait principalement sur des systèmes experts, des programmes informatiques encodant des règles logiques formulées par des experts humains du type « SI le patient a de la fièvre ET une toux productive ET une opacité à la radiographie ALORS envisager une pneumonie bactérienne ».

Ces systèmes experts ont eu leurs heures de gloire dans les années 1980-1990. MYCIN pour les infections bactériennes, INTERNIST-1 pour le diagnostic interne, DXplain pour le diagnostic différentiel. Ils ont le mérite d’être transparents et explicables, on peut exactement savoir pourquoi le système a produit telle recommandation. Mais ils ont une limite fondamentale : ils ne peuvent intégrer que les règles qu’un expert humain a été capable de formuler explicitement, et ils se révèlent vite insuffisants face à la complexité et à la variabilité des situations cliniques réelles.

Le machine learning : apprendre à partir des données

Le changement de paradigme

La différence fondamentale entre un système expert classique et un système de machine learning tient en une phrase : le système expert suit des règles écrites par des humains, le système de machine learning découvre lui-même des règles à partir des données.

Au lieu de programmer explicitement « si A et B alors C », on fournit au système des milliers d’exemples de A, B et C, et on le laisse identifier lui-même les patterns qui permettent de prédire C à partir de A et B. C’est ce qu’on appelle l’apprentissage automatique, ou entraînement du modèle.

Comment ça fonctionne concrètement ?

Prenons un exemple médical simple. Vous souhaitez entraîner un modèle de machine learning pour prédire le risque de réhospitalisation à 30 jours après une décompensation cardiaque.

Vous rassemblez un jeu de données historiques de 50 000 séjours hospitaliers pour insuffisance cardiaque, en annotant pour chacun si le patient a été réhospitalisé dans les 30 jours ou non. Chaque séjour est décrit par un ensemble de variables : âge, sexe, fraction d’éjection, taux de BNP, créatininémie, nombre de médicaments, durée du séjour, antécédents…

L’algorithme de machine learning va analyser ces 50 000 exemples et identifier les combinaisons de variables qui sont statistiquement associées à la réhospitalisation. Il va produire un modèle mathématique qui, face à un nouveau patient à la sortie, calculera un score de risque individuel.

Les principales familles d’algorithmes de machine learning utilisées en santé

La régression logistique est l’approche la plus classique et la plus transparente : elle produit une équation linéaire reliant des variables d’entrée à une probabilité de résultat. Le score de Framingham pour le risque cardiovasculaire en est un exemple familier.

Les arbres de décision et les forêts aléatoires (random forests) construisent des structures arborescentes de règles successives. Les forêts aléatoires sont très utilisées en médecine prédictive pour leur bon rapport performance/interprétabilité.

Les machines à vecteurs de support (SVM) sont efficaces pour les problèmes de classification avec peu de données et beaucoup de variables, un profil fréquent en génomique médicale.

Le gradient boosting (XGBoost, LightGBM) est aujourd’hui l’un des algorithmes les plus performants sur les données tabulaires structurées, exactement le type de données que contiennent les dossiers patients.

La limite du machine learning classique

Ces algorithmes excellent sur des données structurées et tabulaires. Mais ils se révèlent insuffisants face à des données non structurées de haute complexité : une image médicale contenant des millions de pixels, un signal ECG en continu, un compte rendu rédigé en langage libre. C’est pour traiter ces types de données qu’est apparu le deep learning.

Le deep learning : la puissance des réseaux de neurones profonds

L’inspiration biologique

Le deep learning s’inspire, de façon très schématique, du fonctionnement du cerveau humain. Il utilise des réseaux de neurones artificiels : des structures mathématiques composées de couches de nœuds interconnectés, chaque nœud traitant une information et la transmettant aux nœuds suivants avec une pondération ajustable.

L’adjectif « profond » (deep) fait référence au nombre de couches successives dans ces réseaux, les architectures modernes peuvent en compter des centaines, voire des milliers.

Ce que le deep learning rend possible en médecine

En imagerie médicale, le deep learning a provoqué une révolution. Un réseau de neurones convolutif (CNN) peut analyser une image médicale pixel par pixel, identifier des structures anatomiques, détecter des anomalies et les localiser avec une précision remarquable.

En traitement du langage médical, des architectures de deep learning appelées transformeurs (dont GPT et BERT sont les représentants les plus connus) permettent d’analyser et de générer du texte médical avec une sophistication inédite. C’est cette technologie qui est au cœur des assistants de transcription médicale, des systèmes de codage automatique des comptes rendus, et des chatbots médicaux d’information.

En analyse de signaux biologiques, le deep learning permet d’analyser des ECG en continu pour détecter des arythmies, d’interpréter des tracés
d’électroencéphalogramme (EEG) pour identifier des crises épileptiques
infracliniques, ou d’analyser des sons respiratoires pour détecter un
bronchospasme.

La contrepartie : la « boîte noire »

La puissance du deep learning s’accompagne d’un problème majeur pour l’usage médical : l’explicabilité. Contrairement à un arbre de décision ou à une régression logistique dont on peut lire les règles, un réseau de neurones profond est une « boîte noire », il produit un résultat sans qu’on puisse facilement comprendre pourquoi.

C’est pourquoi un champ de recherche entier s’est développé autour de
l’explicabilité de l’IA (XAI — Explainable Artificial Intelligence), avec des techniques comme les cartes de chaleur (heatmaps) qui colorent les zones de l’image ayant le plus contribué à la décision de l’algorithme.

Récapitulatif : ce qui distingue ces trois niveaux

Niveau	Analogie clinique	Forces	Limites
IA (cadre général)	La médecine dans son ensemble	Champ vaste, approches multiples	Terme trop large pour être précis
Machine learning	L’épidémiologie clinique	Données tabulaires, scores prédictifs, interprétabilité	Inefficace sur images, texte, signaux
Deep learning	L’expert visuel très entraîné	Images, texte, signaux complexes	« Boîte noire », besoin de données massives

Pourquoi cette distinction compte pour votre pratique

Évaluer la pertinence d’un outil. Un algorithme de machine learning entraîné sur des données de patients caucasiens dans un CHU parisien peut performer différemment sur vos patients, selon votre contexte. Savoir qu’il s’agit de machine learning, et donc d’un modèle statistique dépendant de ses données d’entraînement, vous aide à poser les bonnes questions sur sa validité externe.

Interpréter les résultats avec le recul approprié. Un score de risque produit par un modèle de gradient boosting est une probabilité statistique, pas un diagnostic. Un résultat de deep learning en imagerie est une suggestion à intégrer dans votre raisonnement clinique global, pas une vérité absolue.

Identifier les limites selon le type de données. Si un outil de machine learning classique est utilisé pour analyser des images médicales, méfiez-vous : ce type d’algorithme n’est pas architecturalement adapté à ce type de données. Un outil crédible en imagerie médicale utilisera du deep learning.

Dialoguer avec les industriels et les équipes informatiques. Lorsqu’un éditeur vous présente une solution, savoir distinguer un système expert d’un modèle de machine learning et d’un réseau de neurones vous permet de poser des questions précises : sur quelles données a-t-il été entraîné ? Quelle est sa performance dans ma population ? Comment gère-t-il les cas atypiques ? Peut-il m’expliquer ses décisions ?

Trois concepts, une même exigence de regard critique

Intelligence artificielle, machine learning, deep learning : ces termes ne désignent pas des technologies mystérieuses réservées à des ingénieurs. Ce sont des outils mathématiques avec des forces, des limites et des contextes d’usage spécifiques, exactement comme les outils cliniques que vous maîtrisez.

Un scanner n’est pas une IRM, et un bilan biologique n’est pas une biopsie : chaque outil a son domaine d’excellence et ses angles morts. Il en va de même pour les différents types d’IA. Les comprendre à ce niveau vous permet de les utiliser avec discernement, d’en tirer le meilleur parti et de protéger vos patients de leurs limites.

Et cette compréhension, contrairement à ce que l’on pourrait croire, ne nécessite pas de formation mathématique avancée. Elle nécessite simplement de prendre le temps de démystifier, ce que vous venez précisément de faire en lisant cet article.

Vous souhaitez approfondir votre compréhension de l’IA et apprendre à évaluer concrètement les outils proposés dans votre spécialité ? Nos formations sont conçues pour les professionnels de santé, sans prérequis technique. Découvrez le programme.

Sources et références

Shortliffe, E. H. & Buchanan, B. G. (1975). « A model of inexact reasoning in medicine. » Mathematical Biosciences, 23(3-4), 351–379. [Système MYCIN]
Miller, R. A. et al. (1982). « INTERNIST-1, an experimental computer-based diagnostic consultant for general internal medicine. » New England Journal of Medicine, 307(8), 468–476.
Barnett, G. O. et al. (1987). « DXplain — An evolving diagnostic decision-support system. » JAMA, 258(1), 67–74.
LeCun, Y., Bengio, Y. & Hinton, G. (2015). « Deep learning. » Nature, 521(7553), 436–444.
Rajkomar, A., Dean, J. & Kohane, I. (2019). « Machine learning in medicine. » New England Journal of Medicine, 380(14), 1347–1358.
Vaswani, A. et al. (2017). « Attention is all you need. » Advances in Neural Information Processing Systems, 30. [Architecture Transformer à l’origine de GPT et BERT]
Esteva, A. et al. (2017). « Dermatologist-level classification of skin cancer with deep neural networks. » Nature, 542(7639), 115–118.
Chen, T. & Guestrin, C. (2016). « XGBoost: A scalable tree boosting system. » Proceedings of the 22nd ACM SIGKDD, 785–794.
Ribeiro, M. T. et al. (2016). « « Why should I trust you? »: Explaining the predictions of any classifier. » Proceedings of the 22nd ACM SIGKDD. [Explicabilité / XAI]
Topol, E. J. (2019). « High-performance medicine: the convergence of human and artificial
intelligence. » Nature Medicine, 25, 44–56.