3.3 Pourquoi est-il utile de juger par soi-même de la solidité des études ? Les spins de conclusion.

     

Les essais cliniques étant publiés majoritairement dans des revues à comité de lecture, il pourrait être perçu comme superflu de rejuger par soi-même de la méthodologie et du bien-fondé des conclusions de l’article. Dans un contexte professionnel chargé, où le temps est précieux, on pourrait se dire qu’il suffit de prendre connaissance de la conclusion, l’évaluation de la solidité de celle-ci ayant été réalisée par les reviewers qui possèdent en général des expertises méthodologiques et statistiques bien plus importantes que le simple lecteur.

Il s’avère cependant que cette attitude n’est pas complètement possible en raison notamment de l’existence des spins, dans tous les parties des articles, mais surtout les spins de conclusions.

Les spins de conclusion (ou enjolivement de la conclusion) [104] sont des situations où la conclusion de l’article rapportant un essai clinique est positive, en faveur de l’intérêt du traitement, alors même que l’essai est non-concluant (n’apportant pas de démonstration de l’intérêt clinique du nouveau traitement).

Les spins sont fréquents et on peut estimer que pour la moitié des essais non concluants il existe un spin dans l’abstract, la discussion ou la conclusion de l’article [105 , 106 , 107] .

La présence de spins peut s’expliquer par les conflits d’intérêts des revues elles-mêmes [108] . Les revues biomédicales, sauf cas exceptionnels, appartiennent à des éditeurs privés et reposent sur un modèle économique de profitabilité. Ces revues sont alors fortement intéressées par les articles rapportant des études industrielles (essais de phase 3 pivotales des nouveaux médicaments par exemple) car ces articles sont susceptibles de leur assurer des retours financiers substantiels par la vente de tirés à part et autres droits de traduction au sponsor de l’étude [109 , 110 , 111] . Ce type d’article assure aussi un maintien du niveau d’impact factor de la revue du fait du nombre de fois où ces articles, qui font souvent le buzz, sont cités. Ainsi pour ne pas risquer de rater la publication d’un manuscrit à fort potentiel de citations, les éditeurs en chefs sont parfois amenés à relativiser les commentaires des reviewers et à accepter des articles tels qu’ils sont proposés, y compris avec les éventuels spins présents. Cet état de fait est particulièrement bien décrit dans deux ouvrages écrits par d’anciens éditeurs en chefs d’une revue de tout premier plan [33 , 34] .

Les conséquences des spins sont graves, car ils conduisent à faire croire au lecteur, qui se limiterait à la lecture de la conclusion de l’abstract, que le nouveau traitement a un intérêt clinique alors qu’en réalité celui-ci n’est pas démontré [112] .

Une des finalités de l’enseignement de la lecture critique durant les études médicales est d’armer les futurs cliniciens à ne pas tomber dans les pièges des spins de conclusions.

Ainsi, il incombe au lecteur de ces publications la charge de faire une évaluation de la rigueur méthodologique de l’étude et des résultats obtenus avant de dériver sa propre conclusion pour ne pas tomber dans le piège d’un spin de conclusion

Les spins sont aussi très fréquents dans les supports de communication promotionnelle ou dans le discours de certains leadeurs d’opinion. L’éminence d’un locuteur ne doit pas faire perdre le regard critique et la volonté de revenir aux faits prouvés.

Exemple : HOT

L’essai HOT avait comme objectif de montrer que la prise en charge intensive de l’hypertension artérielle permettait de maximiser le bénéfice sur les évènements cardiovasculaires [113] . Pour cela, 3 cibles de pression artérielle diastolique (PAD) étaient comparées : la cible standard de l’époque (90 mm Hg) et deux cibles d’intensification (85 et 80 mm Hg). L’essai était randomisé et a inclus 18790 patients. Le critère de jugement principal était les évènements cardiovasculaires mortels et non mortels.

Le caractère randomisé de l’essai est mentionné dans le titre de l’article :

IMG

Et décrit dans la section méthode de l’abstract :

« Methods. 18 790 patients, from 26 countries, aged 50–80 years (mean 61·5 years) with hypertension and diastolic blood pressure between 100 mm Hg and 115 mm Hg (mean 105 mm Hg) were randomly assigned a target diastolic blood pressure. 6264 patients were allocated to the target pressure 90 mm Hg, 6264 to 85 mm Hg, and 6262 to 80 mm Hg. Felodipine was given as baseline therapy with the addition of other agents, according to a five-step regimen. ».

Le traitement utilisé était un nouvel inhibiteur calcique, la félodipine, et cet essai appartenait au plan de développement de ce produit, même si cette étude n’évaluait pas le bénéfice de cette molécule. Il était sponsorisé par le fabricant du produit comme les autres phases 3 du plan de développement.

Comme il s’agissait à l’origine d’un essai randomisé, son niveau de preuve était élevé et à même de faire changer les pratiques.

La conclusion de l’abstract est la suivante : “Intensive lowering of blood pressure in patients with hypertension was associated with a low rate of cardiovascular events. The HOT Study shows the benefits of lowering the diastolic blood pressure down to 82·6 mm Hg.”

Cette conclusion incite donc à changer les pratiques et à abandonner la cible standard de 90 mm Hg pour chercher à atteindre 82.6 mm Hg. Cependant, cette conclusion apparait d’emblée surprenante du fait de la valeur de la cible mise en avant : 82.6 mm Hg. Cet essai ne peut pas conduire à ce résultat. En effet, les seules conclusions possibles sont 85 ou 80 mm Hg en fonction du groupe dans lequel il y aurait le moins d’évènements cardiovasculaires. Il est donc impossible de conclure à 82.6mmHg. De plus les résultats présentés sont les suivants :

IMG

Il apparait qu’aucune différence de fréquence des évènements cardiovasculaire n’a été obtenue entre les 3 cibles (9.9, 10.0 et 9.3 /1000 patients années respectivement pour les cibles de 90, 85 et 80 mm Hg) avec un p = 0.5. L’interprétation adéquate de ces résultats est : cette étude a échoué à montrer le bénéfice d’intensifier la baisse de PAD. Il n’y a pas lieu de changer les pratiques.

À la place de cette conclusion, le papier, comme nous l’avons vu, conclut positivement et propose une nouvelle cible. La valeur de 82.6 mm Hg, qui ne peut pas être validée par le plan d’expérience qui avait été utilisé, provient en réalité d’une analyse de la relation entre la PAD obtenue après l’instauration du traitement, quel que soit le groupe alloué par la randomisation et la fréquence des évènements cardiovasculaires. Une régression curvilinéaire a été utilisée pour modéliser cette relation. Le minimum de la courbe de régression est 82.6 mm Hg. Cette analyse est donc une recherche d’association, purement observationnelle, et n’a pas du tout le niveau de preuve d’un essai randomisé. C’est d’ailleurs la nième observation d’une courbe en U (ou en J) obtenue en épidémiologie de l’HTA.

Cet article est trompeur sur plusieurs aspects. Non seulement il conclut positivement à partir de résultats négatifs, mais il met aussi en avant un résultat obtenu par une toute autre méthodologie que celle qui est décrite. L’article aurait donc dû décrire une étude observationnelle et non pas un essai randomisé. Le lecteur rapide peut ainsi ne pas percevoir ce problème et considérer que la conclusion est parfaitement bien établie, car elle provient d’un essai randomisé et a donc un niveau de preuve maximal.

On peut imaginer que les reviewers ont signalé ces problèmes, mais l’éditeur en chef aura pris la décision de publier cet article sous cette forme sans demander aux auteurs de reformater le manuscrit. L’enjeu pour le Lancet de publier cet essai était certainement important en termes de citations et de ventes de tirés à part compte-tenu du buzz qu’allait produire ce résultat [108] .