Nouvelles de la Journée de la Santé — Les modèles standards d’intelligence artificielle (IA) améliorent la précision du diagnostic, mais les modèles d’IA systématiquement biaisés réduisent cette précision, selon une étude publiée dans le numéro du 19 décembre de la revue Journal de l’Association médicale américaine.
Sarah Jabbour, de l’Université du Michigan à Ann Arbor, et ses collègues ont examiné l’impact d’une IA systématiquement biaisée sur l’exactitude du diagnostic des cliniciens dans une étude randomisée par vignette clinique. Les cliniciens ont vu neuf vignettes cliniques de patients hospitalisés pour insuffisance respiratoire aiguë et ont été invités à déterminer la probabilité d’une pneumonie, d’une insuffisance cardiaque ou d’une maladie pulmonaire obstructive chronique comme cause sous-jacente. Les cliniciens ont vu deux vignettes sans entrée de modèle d’IA pour établir l’exactitude du diagnostic de base, puis ont été assignés au hasard à voir six vignettes avec entrée de modèle d’IA : trois prédictions de modèle standard et trois prédictions de modèle systématiquement biaisées.
Au total, 457 cliniciens ont été assignés au hasard : 231 et 226 aux prédictions du modèle d’IA sans et avec explications, respectivement. Les chercheurs ont constaté que pour les trois diagnostics, la précision diagnostique de base des cliniciens était de 73,0 pour cent. La précision des cliniciens a augmenté par rapport à la ligne de base de 2,9 et 4,4 points de pourcentage lorsqu’on leur a montré un modèle d’IA standard sans et avec explications. La précision des cliniciens a été réduite de 11,3 points de pourcentage avec les prédictions du modèle d’IA systématiquement biaisées par rapport à la ligne de base ; fournir des prédictions biaisées du modèle d’IA avec des explications a réduit la précision de 9,1 points de pourcentage, ce qui représente une amélioration non significative de 2,3 points de pourcentage par rapport au modèle systématiquement biaisé.
« Bien que les résultats de l’étude suggèrent que les cliniciens ne sont peut-être pas en mesure de servir de filet de sécurité contre les défauts de l’IA, ils peuvent jouer un rôle essentiel dans la compréhension des limites de l’IA », écrivent les auteurs.
Un auteur a déclaré avoir reçu des redevances sur un brevet d’Airstrip.
Résumé/Texte intégral (un abonnement ou un paiement peut être requis)

