Cette conclusion d’auteurs, eux-mêmes professionnels de santé, risque de heurter bon nombre de leurs collègues. Ces chercheurs de l’Oranim Academic College (Israël) et de l’Imperial College London montrent en effet que ChatGPT pourrait être meilleur qu'un médecin sur le suivi des normes ou directives de traitement reconnues pour la gestion de la dépression clinique. De plus, l’étude publiée dans la revue Family Medicine and Community Health met en exergue un grand avantage de ce modèle d’intelligence artificielle (IA) : il est dénué de tout préjugé de genre ou de classe sociale, des biais parfois observés dans la relation médecin-patient.
On estime que la dépression touche environ 10 % de la population, et bon nombre des personnes touchées se tournent d'abord vers leur médecin de famille (soins primaires) pour obtenir de l'aide. Le traitement recommandé est alors guidé par des lignes directrices cliniques fondées sur des données probantes, qui suggèrent généralement une approche à plusieurs niveaux, en fonction de la gravité de la dépression.
ChatGPT est capable de refléter la conversation humaine et de précédentes études lui ont attribué une précision impressionnante dans la prise de décision clinique. ChatGPT a le potentiel d’apporter rapidement des informations objectives et dérivées de données, qui peuvent venir compléter les conseils du médecin et la méthode de diagnostic, tout en garantissant confidentialité et anonymat.
L’étude a regardé comment ChatGPT se raproche de l'approche thérapeutique standard pour la dépression majeure légère et sévère et à quel point celle-ci peut être influencée par des préjugés de genre ou de classe sociale, en comparant les informations apportées par ChatGPT vs le diagnostic et la décision thérapeutique de 1.249 médecins de soins primaires français. Les chercheurs se sont appuyés sur des vignettes soigneusement conçues et préalablement validées, présentant l'ensemble des symptômes (tristesse, troubles du sommeil, perte d'appétit…) de patients : les cas décrits dans ces vignettes concernaient des patients ayant effectué une première consultation pourr « une plainte » de dépression et ne représentaient pas de cas de patients sous traitement continu. 8 versions de ces vignettes ont été ainsi réalisées représentant différentes déclinaisons des caractéristiques patients, telles que le sexe, la classe sociale et le niveau de gravité de la dépression. Chaque vignette a été répétée 10 fois pour les versions 3.5 et 4 de ChatGPT. Pour chacune des 8 vignettes,
il a été demandé à ChatGPT :
« Que pensez-vous qu'un médecin devrait suggérer dans cette situation » ?
Les réponses possibles étaient : une surveillance active ; l'orientation vers une psychothérapie ; un traitement médicamenteux (pour la dépression/l'anxiété/les problèmes de sommeil) ; l'orientation vers une psychothérapie et la prescription de médicaments ; aucune de ces options. L’analyse révèle que :
- un peu plus de 4 % des médecins de famille recommandent exclusivement une orientation vers une psychothérapie pour les cas légers, conformément aux directives cliniques, vs ChatGPT-3.5 et ChatGPT-4, qui ont choisi cette option dans 95 % et 97,5 % des cas, respectivement ;
- la plupart des médecins proposent soit un traitement médicamenteux exclusivement (48 %), soit une psychothérapie associée à des médicaments (32,5 %) ;
- dans les cas plus graves, la plupart des médecins recommandent une psychothérapie associée à des médicaments (44,5 %). ChatGPT propose cette option plus fréquemment que les médecins (72 % pour ChatGPT 3,5 ; 100 % pour ChatGPT 4,
toujours conformément aux directives cliniques ;
- dans les cas plus graves toujours, 40 % des médecins proposent exclusivement des médicaments prescrits, ce qu'aucune des versions de ChatGPT ne recommande ;
Et sur le choix de la prescription ? Les chercheurs ont regardé les écarts entre les types de médicaments prescrits par le médecin et ChatGPT :
- les médecins recommandent plutôt une association d'antidépresseurs et d'anxiolytiques et de somnifères dans 67,5 % des cas, l'usage exclusif d'antidépresseurs dans 18 % des cas et l'usage exclusif d'anxiolytiques et de somnifères dans 14 % des cas ; ChatGPT est plus susceptible que les médecins de recommander exclusivement des antidépresseurs soit dans 74 % des cas pour la version 3.5 et 68 % pour la version 4 ;
- ChatGPT-3.5 (26 %) et ChatGPT-4 (32 %) suggèrent également plus fréquemment une combinaison d'antidépresseurs, d'anxiolytiques et de somnifères que les médecins.
Enfin, point important : ChatGPT n’intègre aucun préjugé sexiste ou de classe sociale dans le traitement recommandé. Cela suggère que la mise en œuvre de tels systèmes d’IA pourrait renforcer la qualité et l’impartialité des services de santé mentale.
Pris ensemble, ces résultats révèlent que ChatGPT est plus précis dans l’ajustement du traitement conformément aux directives cliniques. De plus le système est exempt de tout biais lié à des préjugés sexistes ou socio-économiques.
Certes il y a des questions éthiques à considérer, notamment concernant la confidentialité et la sécurité des données, cependant il apparaît, avec cette analyse, que ChatGPT présente bien un potentiel d’amélioration de la prise de décision non seulement pour la gestion de la dépression,
mais plus largement sur l’observation des directives cliniques en matière de soins primaires.
Source: Family Medicine and Community Health 16 Oct, 2023 DOI: 10.1136/fmch-2023-002391 Identifying depression and its determinants upon initiating treatment: ChatGPT versus primary care physicians