2 Justification de la recherche de la non-infériorité
3 L’impossible démonstration de l’équivalence
4 Équivalence clinique ou non-infériorité
5 Le choix du seuil de non-infériorité
5.2 Positionnement par rapport à l’efficacité du traitement de référence
5.4 Limite en différence de risque ou en risque ratio
7 Enchainement d’évaluations en non-infériorité
8 Méthodologie, le contrôle des biais dans l’essai de non-infériorité
9 Méta-épidémiologie des essais de non-infériorité
10 Absence de différence dans un essai de différence (supériorité)
Le choix du seuil de non-infériorité peut être facilité par l’étude du bénéfice qu’apporte le traitement de référence. Le seuil sera fixé de telle façon à ne pas permettre que l’utilisation du nouveau traitement conduise à perdre l’avancée thérapeutique représentée par le traitement de référence. Entre autres, si le traitement de référence a validé son efficacité contre placebo, le seuil choisi garantira que le nouveau traitement ne puisse pas être moins bon que le placebo.
Cette démarche a été utilisée dans l’essai COBALT [5]. L’objectif de cet essai de fibrinolyse à la phase aiguë de l’infarctus du myocarde était de comparer un nouveau traitement représenté par un double bolus d’alteplase au traitement de référence, la perfusion accélérée d’alteplase. La perfusion accélérée est justifiée par les résultats de l’essai GUSTO 1 où ce traitement s’est avéré meilleur que le traitement de référence précédent, la streptokinase. Dans cet essai, la mortalité à 30 jours sous streptokinase était de 7,3% contre 6,3% avec l’alteplase. Le gain apporté par la perfusion accélérée d’alteplase est donc, en différence absolue, de 1% avec un intervalle de confiance bilatéral à 95% de 0,4% à 1,6%. Le vrai effet de l’alteplase se situe entre ces deux bornes et au pire, dans la situation la moins favorable, la différence absolue par rapport à la streptokinase n’est que de 0,4%.

Figure 4 – Illustration du choix de la limite d’équivalence en se basant sur le bénéfice apporté par le traitement de référence. La limite est choisie de telle façon qu’il n’y ait pas de risque de régresser, c’est-à-dire de faire moins bien que le précédent traitement de référence (ici la streptokinase).
En choisissant comme limite cette valeur on est assuré que le nouveau traitement ne pourra pas être considéré comme équivalent alors qu’il fait moins bien que la streptokinase. C’est-à-dire que l’efficacité moindre que l’on pourrait tolérer en regard des avantages pratiques apportés par le double bolus d’alteplase ne conduise pas à perdre tout le bénéfice de la dernière avancée thérapeutique. La démarche de cet essai est exemplaire et montre qu’une définition rigoureuse et argumentée de la non-infériorité est possible. Elle conduit cependant à des valeurs très contraignantes demandant un nombre de sujets de même ordre de grandeur qu’un essai de supériorité.
Dans cet exemple, la perte de 100% de l’efficacité de la perfusion accélérée d’alteplase est acceptable, car, même si l’efficacité du double bolus n’est que celle de la streptokinase, le double bolus représente encore un progrès thérapeutique en termes de praticabilité et de meilleure tolérance, car il ne présente pas les effets allergiques de la streptokinase.
Un autre exemple du même domaine illustre que le choix de la limite est fréquemment subjectif. L’essai GUSTO 3 [6] comparait un nouveau fibrinolytique, la reteplase qui s’administre en double bolus au traitement de référence qu’est la perfusion accélérée d’alteplase. À l’origine, cet essai était un essai de supériorité dont les résultats ne permettaient pas de conclure à la supériorité de la reteplase. Devant ce résultat, l’objectif de l’étude a été transformé en recherche de l’équivalence clinique. Ce changement post-hoc d’hypothèse pose un problème sur lequel nous reviendrons. Pour l’instant intéressons-nous à la limite de non-infériorité qui a été choisie. Cette limite a été choisie comme dans COBALT par référence à GUSTO 1, mais là où COBALT intégrait l’incertitude statistique en prenant la borne inférieure (0,4%) de l’intervalle de confiance de GUSTO 1, GUSTO 3 considère l’estimation moyenne de 1%. La borne supérieure de l’intervalle obtenue dans GUSTO 3 est de 0,66%, valeur qui autorise de conclure à l’équivalence avec la limite de 1%, mais pas avec celle de 0,4%. Les publications de COBALT et GUSTO 3 sont parues dans le même numéro du New England Journal of Medicine et ce contraste entre des choix différents illustre le manque de règles adoptées par tous et les dérives qui peuvent exister.
GUSTO 3 pose aussi la question de savoir s’il est licite de passer d’un objectif de supériorité à un objectif d’équivalence en fonction des résultats. À cause de ce changement post-hoc, le principe de la méthode expérimentale suivant lequel l’hypothèse doit être générée avant le recueil des données (« l’hypothesis testing » de Fisher) n’est pas respecté. L’essai ne peut pas être considéré comme démontrant l’hypothèse d’équivalence étant donné qu’il n’avait pas été conçu pour cela, mais pour démontrer l’hypothèse inverse. Dans cette situation, conclure à l’équivalence est une démarche tautologique. Les données servant à la démonstration sont celles qui ont fait générer l’hypothèse. De plus rien n’assure qu’un essai de supériorité répond au critère de qualité de l’essai d’équivalence et que le comparateur soit adéquat.
Ces restrictions méthodologiques sont prises en compte dans la discussion, mais néanmoins la conclusion de GUSTO 3, bien que prudente, suggère fortement l’équivalence.
Cette approche peut être utilisée avec le bénéfice absolu (la différence des risques) ou le bénéfice relatif (risque relatif). Bien que fréquemment utilisée jusqu’à présent, la différence absolue ne tient pas compte du risque de base. Une différence absolue limite fixée à 1% a priori sur l’hypothèse que le risque de base est de 10% correspond à un risque relatif limite de 10%. Si l’essai inclut des patients à faible risque conduisant à un risque de base de 5%, la même limite absolue de 1% correspond alors à un risque relatif limite de 20%. La tendance actuelle est d’utiliser préférentiellement le risque relatif.