Publié dans Covid19-FAQ.
#136 Je ne sais pas comment simplement interpréter un article présentant les résultats d'une étude clinique, pouvez vous m'aider?
Cette FAQ présente de façon simple et didactique les différents aspects de l'interpétation des études cliniques.
Pour les pressés: les points essentiels , en 4 min |
Pour tout savoir, ou presque, en 18 min |
Vous pouvez également regarder la présentation didactique du Pr. D Deplanque, Président du Collège National de Pharmacologie Médicale, sur le thème 'Développement des médicaments'
La FAQ
Un article scientifique, publié dans un journal scientifique, a pour but de faire connaître à l’ensemble de la communauté scientifique (en particulier médicale) les résultats de travaux effectués par une équipe de recherche.
En médecine, les articles originaux servent notamment à partager les résultats d’études sur les maladies ou les médicaments.
D’autres types d’articles existent ; par exemple, des auteurs peuvent rapporter des cas rares de patients, présenter une méta-analyse (c’est-à-dire une analyse combinée de l’ensemble des études portant sur un sujet), exprimer un point de vue, etc |
.
Un journal scientifique est un titre de presse publié périodiquement. Ils peuvent être à l’initiative de sociétés savantes ou avoir été fondés indépendamment par des éditeurs de presse scientifique. La plupart sont spécialisées dans un domaine particulier (sciences, médecine, …) voire même sur une discipline (par exemple en médecine, des revues sont spécialisées en cardiologie, réanimation, pneumologie, etc.).
L’objectif de ces journaux est de faire connaître les travaux des chercheurs en direction d'un public de spécialistes, et de contribuer ainsi au débat scientifique en le confrontant à la communauté scientifique.
La plupart des journaux réalisent un examen de la rigueur de la méthode scientifique employée dans les articles, par un comité de lecture composé de chercheurs de la même spécialité, avant leur publication.
De plus en plus, et tout particulièrement depuis le début de la pandémie de COVID-19, des sites permettent d'accéder à des articles n'ayant pas encore été relus et validés par les pairs : on appelle ces manuscrits des "prépublications" ou "preprint". Ceux-ci sont très nombreux en période de crise, mais il faut donc rester vigilant avec les résultats présentés dans ces articles.
Selon leur rigueur, leur impact et leur visibilité, ces journaux peuvent être reconnus comme plus ou moins prestigieux et sérieux. Nature, Science, The New England Journal of Medicine et The Lancet sont des journaux scientifiques très reconnus |
Il existe différents types d’études scientifiques. Chaque type d’étude a un objectif différent.
TYPE D’ETUDE |
OBJECTIF |
Essai thérapeutique/clinique |
Évaluer l’intérêt d’un nouveau médicament |
Étude épidémiologique observationnelle descriptive |
Étudier la fréquence et la répartition d’un problème de santé à un moment donné |
Étude épidémiologique observationnelle causale, étiologique ou analytique |
Recherche les facteurs de risque d’une maladie |
Étude pronostique |
Rechercher les facteurs de risque prédictifs (pronostiques) de la survenue d’une complication lors de l’évolution de la maladie |
Étude d’évaluation d’une méthode diagnostique |
Étudier l’intérêt d’un nouvel examen diagnostique par rapport à un examen de référence |
Étude d’évaluation d’une intervention en santé |
Évaluer l’intérêt d’une intervention en santé (dépistage, prévention) |
Nous allons nous concentrer sur les essais cliniques/ thérapeutiques par la suite.
Ces études visent à comparer l’efficacité de différents médicaments ou stratégies thérapeutiques dans une maladie donnée.
Avant de recevoir son autorisation de mise sur le marché (AMM), un nouveau médicament va être évalué tout au long des différentes phases de son développement.
Ce processus est très long (en moyenne une dizaine d’années).
On distingue la phase préclinique, où le médicament est d’abord testé en laboratoire (« in vitro ») puis sur l’animal, et la phase clinique, où le médicament est testé chez l’Homme, avec différentes phases ou étapes successives :
- Phase préclinique:
Études réalisées en laboratoire et sur des modèles animaux. Elles permettent de sélectionner de futurs « médicaments candidats » parmi de nombreuses molécules testées. - Phase 1:
Étude sur un petit groupe de volontaires sains pour comprendre comment l’organisme humain assimile et élimine ce médicament. Pour les médicaments trop agressifs pour des personnes non malades, cette phase n’est pas réalisée chez le volontaire sain (exemple : les chimiothérapies). - Phase 2:
Étude sur un petit groupe de patients. Le but est de déterminer la dose à administrer. - Phase 3:
Étude sur des larges échantillons de patients, (sauf pour les maladies rares) avec idéalement une comparaison à un placebo ou à un traitement déjà autorisé. Le but est de prouver l’efficacité du médicament et de surveiller les effets indésirables afin d’évaluer la balance bénéfice / risque.. - Phase 4:
Ces études ont lieu après la mise sur le marché du médicament. Elles concernent souvent les effets indésirables potentiels des médicaments donnés à grand échelle (exemple : elles ont permis le retrait du Médiator®). Elles permettent aussi de mettre en évidence de nouvelles indications pour un médicament.
Certains médicaments déjà utilisés et mis sur le marché pour le traitement d’une maladie peuvent être également testés pour une autre indication
La définition des personnes éligibles pour l’étude se fait par des critères d’inclusion et de non-inclusion.
Les personnes participant à l’étude doivent répondre à tous les critères d’inclusion. Ceux-ci doivent être précis et cohérents.
Les résultats obtenus sur ces personnes ne pourront être extrapolés dans la population générale qu’à des personnes présentant les mêmes caractéristiques. |
Exemples : âge, sexe, sévérité de la maladie, tabagisme, …
Ainsi, si on veut évaluer l’intérêt d’un traitement dans les formes graves d’une maladie (exemple : patients admis en réanimation), il ne faut pas le tester sur des patients présentant des formes bénignes ou modérées. |
A l’inverse, les participants à l’étude ne devront avoir aucun des critères de non-inclusion.
Ainsi, les enfants, les femmes enceintes ou allaitantes, les personnes sous tutelle, etc. ne sont souvent pas inclus dans les études.
Pour tester l’efficacité d’un nouveau médicament, ou pour tester son efficacité dans une nouvelle indication, il faut le comparer à un traitement de référence ou à un placebo (s’il n’existe pas de traitement de référence).
On parle d’essai « contrôlé », car le groupe recevant le placebo ou le traitement de référence sert de contrôle au groupe traité avec le médicament étudié..
Un « placebo » est une copie du médicament, qui a un aspect semblable (même forme, même couleur, …) mais ne contient pas de principe actif. |
Évaluer un médicament signifie que l’on ne sait pas ce qui est le mieux pour le malade : le nouveau traitement ou le placebo. Quand on ne sait pas, il est légitime de ne pas faire de choix. C’est pourquoi les patients et les médecins ne choisissent pas quel traitement sera administré.
Quand un patient accepte de participer à une étude, on tire au sort l’attribution d’un des traitements. C’est la « randomisation ».
Cette randomisation permet de réaliser deux groupes de patients : l’un recevra le traitement étudié, et l’autre le placebo ou le traitement de référence. Si plusieurs traitements sont comparés, on peut faire autant de groupes que de traitements.
Il faut vérifier que ces deux groupes sont similaires avant d’analyser les résultats de l’étude. Grâce à la randomisation, cela devrait être le cas puisque seul le hasard intervient. Par exemple, les patients des deux groupes doivent être d’âge similaire. De cette façon, si l’un des deux groupes se porte mieux à la fin, cela pourrait être attribuable au traitement. |
Cette randomisation doit être effectuée à l’aide d’un logiciel informatique, et non selon un critère défini (exemple : lieu d’hospitalisation, année de naissance paire ou impaire, …), et par une personne externe à l’étude, déterminée à l’avance.
Parfois, le simple fait de savoir que l’on prend un médicament peut modifier l’état de santé : c’est le fameux « effet placebo ».
Pour que l’évolution de l’état du patient ne soit pas influencée par « l’effet placebo », il ne faut pas que le patient et le médecin connaissent la nature du traitement reçu.
On parle de « simple aveugle » quand seul le patient ignore le traitement qui lui est administré et de « double aveugle » quand le patient et le médecin ne savent pas.
On parle parfois « d’insu », qui est un synonyme. |
Parfois, il n’est pas possible de réaliser l’étude en aveugle, par exemple quand on compare un traitement chirurgical invasif à un traitement médical.
Plusieurs éléments sont étudiés pour juger du bénéfice et du risque d’un traitement dans une étude clinique. Ils sont généralement hiérarchisés en critère principal et critères secondaires.
Les critères de jugement sont les éléments qui sont étudiés par l’étude.
Ils doivent être définis avant le début de l’étude, être clairs et adaptés à l’objectif de l’étude.
Le critère de jugement principal est celui sur lequel on veut mettre en évidence le bénéfice du traitement par rapport au comparateur (le traitement de référence ou un placebo).
Il doit être pertinent, en accord avec l’objectif de l’étude, bien défini, quantifiable, facile à mesurer et idéalement unique.
Pour démontrer un bénéfice clinique du traitement, l’idéal est que le critère de jugement soit clinique aussi : guérison, mortalité, aggravation des symptômes, … Les données biologiques, d’imagerie ne sont que des critères intermédiaires à l’objectif du traitement, sans traduire forcément un bénéfice sur l’état clinique du patient.
Exemple : Étudier l’efficacité d’un médicament pour diminuer le taux de cholestérol ne prouve pas que ce médicament améliore la survie des patients |
Le critère de jugement principal idéal est la mortalité car il est objectif et indéniable, mais il n’est pas souvent le plus pertinent.
Exemple : si on étudie un traitement pour une maladie peu mortelle, comme le rhume, chercher à montrer une différence sur la mortalité est impossible. On peut alors choisir d’autres critères, comme la durée des symptômes, le risque d’hospitalisation, … |
Les critères de jugement secondaires donnent une estimation de la sécurité du traitement et des hypothèses à explorer dans de futures études.
On ne peut conclure que sur l'objectif principal. Une différence statistique significative sur un critère secondaire ne permet pas de tirer de conclusion mais donne une piste pour une étude ultérieure avec une méthodologie adaptée. |
Pour faire simple :
Dans une étude, le médicament n’est testé que sur une partie des patients potentiels, un échantillon. Pourtant, on va généraliser les résultats à l’ensemble des patients, même aux non-participants. C’est comme pour un sondage :
- l’étude peut révéler la vérité : le traitement est efficace, ou le traitement n’a pas de bénéfice sur le critère étudié.
- l’étude peut aussi révéler un faux résultat à cause d’un mauvais hasard.
Par exemple :
On tire au sort 11 footballeurs en France pour constituer une équipe pour la Coupe du Monde.
Si cette équipe gagne, est-ce parce que les footballeurs français sont meilleurs, ou est-ce dû au hasard de l’échantillon ?
Si à l’inverse l’équipe perd, les footballeurs français sont-ils mauvais, ou est-ce que l’échantillon par malchance n’est pas tombé sur les meilleurs joueurs ?
Tout cela se quantifie par des risques d’erreur statistiques que l’on cherche à minimiser : alpha et beta.
Pour aller plus loin :
On entre dans la partie la plus mathématique de ce texte.
Dans un essai clinique, il y a deux risques :
- Le risque de 1ère espèce ou risque alpha :
C’est le risque de mettre en évidence une différence qui n’existe pas, donc de déclarer à tort que le médicament étudié est plus efficace que le traitement de référence ou le placebo alors que ce n’est pas le cas. - Le risque de 2ème espèce ou risque bêta :
C’est le risque de ne pas mettre en évidence une différence qui existe, donc de ne pas montrer à tort que le traitement étudié est plus efficace alors qu’il l’est.
Ceux-ci sont le reflet du hasard, qui peut aléatoirement favoriser un groupe par rapport à un autre. Il est donc impossible que ces risques soient nuls. Il faut fixer la valeur du seuil que l’on juge acceptable avant le début de l’étude. |
Comment fixe-t-on ces risques ?
- Pour le risque alpha :
Par consensus, il est fixé à 5% généralement. Ceci signifie que l’on a 5% de risque de conclure que le médicament testé est plus efficace alors qu’il ne l’est pas. - Pour le risque bêta :
Il n’y a pas de consensus. En général, ce seuil est fixé à 10 ou 20 %.
La puissance d’une étude est la probabilité de conclure à une différence qui existe réellement et correspond à 1-bêta.
Un risque bêta de 10% signifie qu’il y a 10% de risque de ne pas mettre en évidence la supériorité du traitement testé. La puissance est donc de 1-10% = 90% de chance de mettre en évidence cette efficacité. |
A partir de ces seuils de risques et de l’hypothèse d’efficacité que l’on fait (la différence d’efficacité que l’on souhaite voir entre les deux traitements), les statisticiens vont pouvoir déterminer le « nombre de sujets nécessaires », soit le nombre de patients à inclure dans l’étude afin de pouvoir statuer sur l’efficacité du traitement :
- Si le traitement testé est vraiment plus efficace que le traitement de référence ou le placebo, un petit effectif de personnes suffira pour mettre en évidence la différence.
- Si le traitement testé est à peine plus efficace, il faudra beaucoup plus de personnes incluses pour mettre en évidence cette différence.
Plus il y a de personnes inclues dans une étude, plus l’étude aura une forte puissance.
Il faut choisir des seuils honnêtes mais réalistes pour que le nombre de personnes à inclure ne soit pas impossible à atteindre. |
Le « petit p », c’est quoi ?
Les résultats présentés doivent l’être avec un calcul du « p » et/ou de l’intervalle de confiance. Ceci permet de refléter le risque de fluctuations liées au hasard.
Un résultat n’est statistiquement significatif que si le p est inférieur au risque alpha (5% habituellement). Ceci permet de vérifier que l’association est une véritable association statistique.
Par exemple :
- Une différence de mortalité de 10% (p = 0,03) est statistiquement significative
- Une différence de mortalité de 10% (p = 0,2) n’est pas statistiquement significative
Une différence statistique est-elle forcément pertinente ?
Les analyses statistiques permettent de mettre en évidence une supériorité statistique d’un médicament testé. Cependant, il faut être vigilant sur la traduction clinique de cette supériorité.
Par exemple, une étude peut mettre en évidence une diminution statistiquement significative de la durée des symptômes d’une maladie avec un nouveau médicament. Cependant, si cela correspond à une diminution d’une demi-journée, cela est peu pertinent en pratique. |
Ex : durée des symptômes avec traitement = 6,5 jours versus avec placebo = 7 jours (p=0,04).
Il faut aussi prendre en compte les effets indésirables des médicaments. En effet, si l’efficacité du médicament est démontrée mais qu’il entraîne beaucoup d’effets indésirables graves (par exemple, des atteintes de certains organes (cœur, foie, rein, …)), il n’est pas forcément intéressant.
Il faut réfléchir à la « balance bénéfice/risque », c’est-à-dire vérifier que le bénéfice du traitement ne soit pas au prix d’effets indésirables graves importants. |
La différence statistique est-elle forcément due au médicament ?
Non, ce n’est pas parce qu’une étude met en évidence une association statistique qu’elle est due au médicament.
En effet, des « biais » peuvent venir fausser les résultats ou leur interprétation.
Un biais est un facteur qui pourrait fausser les résultats décrits dans une étude. Il en existe plusieurs types.
Biais de confusion
Il résulte de la présence d’un facteur de confusion, c’est-à-dire d’une différence entre les groupes comparés autre que le médicament testé : âge, autres maladies concomitantes, stade de la maladie, effet placebo, …
Par exemple, si l’on teste un médicament de la grippe et que l’on donne le nouveau traitement à des patients avec une forme peu sévère et le placebo à des patients admis en réanimation, il est facile de voir une différence entre les deux groupes. Pour autant, elle n’est probablement pas liée au médicament. |
Comment l’éviter ?
Une des façons de ne pas avoir de facteur de confusion est de vérifier que les groupes ont bien été randomisés (c'est à dire tirés au sort, voir l'item 07). Ainsi, il n’y a pas de raison que les groupes soient différents, y compris pour des facteurs de confusions même inconnus.
D’autres méthodes complémentaires sont liées aux méthodes statistiques employées, notamment le fait de réaliser des analyses multivariées qui prennent en compte différents paramètres intercurrents.
Biais de sélection
Il s’agit d’une erreur dans la sélection des patients, c’est-à-dire que l’échantillon étudié n’est pas adapté : non représentatif de la population atteinte par la maladie (exemple : des personnes jeunes pour la maladie d’Alzheimer) ou non conforme à l’objectif (exemple : des patients avec des formes trop sévères de la maladie pour un traitement destiné à éviter l’aggravation de formes modérées).
Il faut donc vérifier que le groupe de patients de l’essai est représentatif de la population touchée par la maladie et à qui serait destinée le traitement.
Biais de Mesure
C’est une erreur dans les mesures des caractéristiques des patients étudiés.
Par exemple, utiliser une méthode de diagnostic insuffisamment fiable qui peut faire considérer comme malade une personne qui ne l’est pas. |
Biais d’attrition
Dans les essais cliniques, il est possible que tous les patients qui participent ne les terminent pas, pour différentes raisons (déménagement, lassitude, … mais aussi décès et effets indésirables pénibles). Ce sont les « perdus de vue ». |
Il est important que ceux-ci ne soient pas trop nombreux, pour que les groupes initiaux restent comparables à la fin.
De plus, il ne faut pas exclure les données des patients n’ayant pas terminé l’étude sans analyser pourquoi !
Par exemple, le fait que les patients décèdent au cours de l’étude est intéressant, car cela peut être lié à la maladie et donc à un potentiel échec de traitement.
S’ils arrêtent l’étude, cela peut être lié à des effets indésirables gênants des médicaments, etc.
Il faut donc en tenir compte lors de l’analyse statistique par une analyse dite « en intention de traiter » : tous les patients qui ont été inclus sont analysés dans les résultats.
Ceux avec des données manquantes sont traités arbitrairement, le plus souvent avec l’hypothèse de biais maximum : les perdus vus ayant reçus le traitement testé sont considérés comme ayant eu une mauvaise évolution. |
De cette façon, on « pénalise » artificiellement le médicament testé, mais cela renforce la probabilité qu’un bénéfice démontré par cette étude existe réellement.
Biais de publication
C’est un biais spécifique des méta-analyses, qui compilent les résultats de nombreuses études déjà réalisées.
Le problème est que les études ayant eu des résultats positifs ont plus de chances d’être publiées que celles ne démontrant pas d’intérêt d’un médicament car elles seront jugées plus intéressantes par les comités de lecture.
Il est important de comparer les résultats d’une étude avec ceux obtenus lors d’études similaires préalables.
Une seule étude ne suffit pas ! Comme on l’a vu, dans les études même bien menées, on accepte 5% de risque de conclure à une efficacité qui est due au hasard uniquement.
Si d’autres études viennent corroborer ces résultats, c’est rassurant. Sinon, il faut être vigilant avec cette étude, car la différence observée peut être due à des biais ou à une méthodologie inappropriée et non rigoureuse.
Le concept de « médecine basée sur les preuves » a été développé dans les années 1980 à la Faculté de médecine McMaster, au Canada. En effet, à cette période, il fallait trouver une solution d’intégrer aux pratiques courantes les résultats issus des publications scientifiques en constante augmentation.
Cette approche cherche à fonder au maximum les décisions cliniques sur les données scientifiques actuelles les plus probantes.
Les données scientifiques probantes comprennent notamment les essais cliniques avec le plus haut niveau de preuve, dont les essais cliniques randomisés en double aveugle bien menés.
Elle repose sur une démarche en 4 étapes :
- La formulation d'une question clinique claire et précise à partir d'un problème clinique posé.
- La recherche dans la littérature d'articles cliniques pertinents et appropriés sur le problème.
- L'évaluation critique de la validité et de l'utilité des résultats trouvés (niveau de preuve).
- La mise en application des résultats de l'évaluation dans la pratique clinique pour une prise en charge personnalisée de chaque patient.
Le niveau de preuve varie selon la qualité et le type d’étude apportant des résultats sur un médicament ou une stratégie de prise en charge. Celui-ci détermine la force des recommandations qui seront élaborées à partir de ces résultats.
Tableau 1 - Grade des recommandations (Haute Autorité de Santé)
Grade des recommandations |
Niveau de preuve scientifique fourni par la littérature |
A Preuve scientifique établie |
Niveau 1 |
B Présomption scientifique |
Niveau 2 - études de cohortes |
C Faible niveau de preuve scientifique |
Niveau 3 |
Niveau 4 |
Les lois encadrant les études cliniques
Après la Seconde Guerre mondiale et les expérimentations inhumaines menées sur l’Homme dans les camps de concentration, différents pays se sont concertés pour définir des principes éthiques aux études cliniques.
Plusieurs textes de loi sont venus successivement encadrer les pratiques : Code de Nuremberg en 1947, déclaration d’Helsinki en 1964, loi Huriet-Serusclat en 1988, lois de bioéthiques en 2002 et loi Jardé en 2012. |
En résumé, toute recherche clinique doit respecter des principes éthiques :
- obligation de soumettre les protocoles à un comité consultatif de protection des personnes (« comité d’éthique » ou CPP)
- consentement « libre et éclairé» des patients se prêtant à la recherche clinique, c’est-à-dire sans contraintes et en toute connaissance de cause et révocable à tout moment.
- sanction pénale en cas de non-respect.
Ces règles visent à assurer la sécurité des patients participant aux protocoles.
L’assurance du respect de ces principes rend le processus de soumission de protocole long, en général plusieurs semaines voire mois, même s’il est toujours possible d’accélérer le processus dans des situations exceptionnelles. Cependant, aucune situation ne justifie de s’affranchir de ces règles.
Les liens d’intérêt
Un lien d’intérêt est évoqué quand la personne ou l’organisme qui réalise ou finance l’étude pourrait avoir un intérêt personnel à démontrer l’efficacité d’un médicament, notamment financier.
Cela peut être le cas par exemple quand l’un des auteurs de l’étude espère retirer une certaine publicité de la publication des résultats de son étude.
La publication d’articles scientifiques est un élément indispensable du débat scientifique, qui permet aux sciences d’avancer et de toujours remettre en question les connaissances d’hier pour bâtir celles de demain.
Cependant, pour être exploitables, les études rapportées doivent avoir une méthodologie fiable et rigoureuse.6Même en cas d’urgence, il est toujours possible de mener des études de façon scientifique, dont on pourra utiliser les résultats.
Les faux faits sont très préjudiciables aux progrès de la science, car ils durent souvent longtemps ; mais les idées fausses, si elles sont étayées par des preuves, font peu de dégâts, car chacun prend un plaisir salutaire à prouver leur fausseté.
Charles Darwin - biologiste, naturaliste, scientifique (1809 - 1882)
Vous pouvez également aller consulter cette page du site du ministère des solidarités et de la santé : COVID19 et recherche en France
Evaluation de nouveaux traitements
- Dernière mise à jour le .