#M014 Essai de non-infériorité : choix du seuil de non-infériorité et expression en différence de risques ou en rapport de risques

De quoi parle-t-on ?

Silvain J, Cayla G, et al.; ABYSS Investigators of the ACTION Study Group. Beta-Blocker Interruption or Continuation after Myocardial Infarction. N Engl J Med. 2024;391(14):1277-1286. doi: https://doi.org/10.1056/NEJMoa2404204

Pourquoi a-t-on choisi cet article ?

L’étude ABYSS est un essai clinique visant à évaluer la non-infériorité de l’arrêt des bétabloquants par rapport à leur poursuite chez des patients ayant présenté un infarctus du myocarde il y a plus de six mois et sans insuffisance cardiaque chronique. Dans ce blog, nous analyserons en détail le choix du seuil de non-infériorité, et utiliserons cet exemple pour illustrer l’importance du mode d’expression du seuil de non-infériorité, selon qu’il soit exprimé en termes absolus ou relatifs.

Ce qu’en pense la SFPT : principaux messages de l’article

Le choix du seuil de non-infériorité est un élément clé du design des essais de non-infériorité. S’il est généralement bien connu que l’amplitude maximale de l’effet que l’on consent à perdre relève avant tout d’une décision clinique, les conséquences liées à son mode d’expression – en rapport de risques ou en différence de risques absolue – sont peut-être moins connues. Pourtant, le choix d’exprimer le seuil de non-infériorité en termes relatifs ou absolus peut avoir un impact important dans les cas où la proportion d’événements attendue dans le bras contrôle est différente de celle réellement observée dans l’essai. En effet, lorsque la proportion d’événements dans le bras contrôle a été :

sous-estimée (fréquence dans le bras contrôle supérieure à ce qui était attendu), l’expression du seuil de non-infériorité en différence de risques est plus conservatrice;
surestimée (fréquence dans le bras contrôle inférieure à ce qui était attendu), l’expression du seuil de non-infériorité en risque relatif est donc plus conservatrice.

	Sous-estimation	Surestimation
Proportion d’évènements attendus dans le bras contrôle	20 %	20 %
Seuil de non-infériorité absolu	+5 % en absolu soit 25 %	+5 % en absolu soit 25 %
Seuil de non-infériorité relatif	+25 % en relatif soit 25 %	+25 % en relatif soit 25 %
Proportion d’évènements observés dans le bras contrôle	40 %	10 %
Seuil de non-infériorité absolu	+5 % en absolu soit 45 %	+5 % en absolu soit 15 %
Seuil de non-infériorité relatif	+25 % en relatif soit 50 %	+25 % en relatif soit 12,5%

Pour approfondir

PICOS de l’essai ABYSS

Patients	Patients ayant présenté un infarctus du myocarde il y a plus de six mois et sans insuffisance cardiaque chronique
Intervention	Arrêt des bétabloquants
Control	Poursuite des bétabloquants
Outcome	Critère composite comprenant (i) le décès, (ii) l’infarctus du myocarde non fatal, (iii) l’accident vasculaire cérébral non fatal ou (iv) l’hospitalisation pour des raisons cardiovasculaires
Study design	Essai clinique contrôlé, randomisé (ratio 1:1), multicentrique, de non-infériorité, en ouvert

Comment définir la marge de non-infériorité?

Pour contextualiser le choix d’une marge de non-infériorité (MNI), il est nécessaire de désigner trois traitements :

Traitement A, qui correspond à la référence historique
Traitement B, qui a démontré sa supériorité par rapport à la référence historique
Traitement C, pour lequel on veut démontrer la non-infériorité par rapport au traitement B

Le premier élément clé à prendre en compte pour le choix de la MNI est le bénéfice apporté par le traitement B par rapport au traitement A. Sauf cas très exceptionnel^*, la MNI d’un essai visant à démontrer la non-infériorité du traitement C par rapport au traitement B devra être plus petite que la borne inférieure de l’intervalle de confiance de l’effet du traitement B vs traitement A. Cette borne inférieure de l’intervalle de confiance correspond ainsi au plus petit effet possible du traitement B vs le traitement A. Autrement dit, on ne doit pas consentir à perdre plus que le plus petit bénéfice attendu de B par rapport à la référence historique. On appelle en général cette borne M1 représentée sur la figure ci-dessous :

014 1

Figure 1. Principe du choix des marges M1 et M2.

^*Ces cas très exceptionnels correspondent à des situations où un effet majeur est attendu par ailleurs, sur un autre critère de jugement par exemple.

Toutefois, choisir M1 comme borne de non-infériorité suppose que l’on peut potentiellement perdre quasiment tout le bénéfice de A, ce qui est rarement acceptable. On fixe donc une marge (appelée M2) qui correspond à la plus grande perte d’efficacité cliniquement acceptable. Pour définir M2, on peut raisonner sur la base de la fraction d’effet préservé (F), qui est la fraction du bénéfice du traitement standard que l’on souhaite conserver. Sur la figure ci-dessus, la valeur de F est d’environ 50%, ce qui est la valeur minimale souvent recommandée.

Différence de risques ou rapport de risques ?

Lors du choix de la MNI dans un essai de non-infériorité, on peut choisir de l’exprimer en termes relatifs – i.e., rapport de risques – ou en termes absolus – i.e., différence de risques. Dans l’exemple de l’étude ABYSS, le critère de jugement principal était un critère composite combinant décès, infarctus myocardique non fatal, accident vasculaire cérébral non fatal, ou hospitalisation pour des raisons cardiovasculaires. Le choix de la MNI reposait sur une hypothèse de survenue du critère principal de 12 % dans le groupe contrôle (poursuite des bétabloquants), avec une variation relative maximale de 25 % dans le groupe intervention (arrêt des bétabloquants), ce qui correspond donc à une différence absolue de 3 points (25 % de 12 %).

“Calculation was based on an estimated risk of 12% for the primary end point in the continuation group at a median follow-up of 3 years at an alpha level of 5%. The margin of 3 percentage points was chosen to correspond to a 25% difference in relative risk that is commonly used in cardiology trials”.

Le résultat de l’étude pour le critère principal n’a pas permis de conclure à la non-infériorité : la différence de risques entre les deux groupes étant de 2,8 points (IC 95 % <0,1 – 5,5), avec une borne supérieure de l’intervalle de confiance qui dépasse largement la MNI fixée à 3 points. Toutefois, le risque d’événement dans le groupe contrôle s’est avéré presque deux fois plus haut que prévu initialement (environ 21 %) (Figure 2) :

014 2

Figure 2. Principaux résultats de l’essai ABYSS.

Cette différence entre le risque d’événements observé dans le groupe contrôle et le risque attendu peut avoir des répercussions significatives dans les études de non-infériorité. En effet, si l’on exprime maintenant le résultat principal de l’étude en effet relatif, on obtient un RR à 1,13 [IC 95 % 1,00 –1,27]. Selon le raisonnement des investigateurs, la marge de non-infériorité serait dans ce cas de 1,25, soit juste en dessous de la borne supérieure de l’IC 95%. Ainsi, bien que dans le cas présent la conclusion soit la même, cet exemple illustre l’importance de l’expression en absolu ou en relatif, quand on s’éloigne de l’estimation du risque basal faite a priori.

La figure 3 illustre ce phénomène de manière schématique. Elle représente la fréquence maximale d’événements autorisée sous traitement pour conclure à la non-infériorité, selon que l’on exprime l’effet en valeur absolue ou relative. Nous voyons ici que les courbes ne se superposent pas mais se croisent, en un point qui est l’estimation de la proportion d’événements dans le bras contrôle au moment du design de l’essai (12 % dans le cas de l’essai ABYSS). Pour cette valeur, le nombre d’événements maximal autorisé sous traitement est le même, que le résultat soit exprimé en relatif ou en absolu. En revanche, on voit sur cette figure que lorsque la proportion dans le bras contrôle a été sous-estimée (fréquence dans le bras contrôle supérieure à ce qui était attendu), P_Tmax est supérieure lorsque l’effet est exprimé en relatif (c’est le cas de l’essai ABYSS). Dans cette situation, l’expression en différence de risques est plus conservatrice. En revanche, lorsque la proportion dans le bras contrôle a été surestimée (fréquence dans le bras contrôle inférieure à ce qui était attendu), P_Tmax est supérieure lorsque l’effet est exprimé en absolu ; l’expression en risque relatif est donc plus conservatrice.

014 3

Figure 3. Proportion maximale d’événements autorisée sous traitement pour conclure à la non-infériorité (P_Tmax) en fonction de la proportion d’événements dans le bras contrôle, lorsque l’effet est exprimé en valeur relative (droite bleue) ou absolue (droite orange). Dans cet exemple, le seuil de non-infériorité retenue est de 1,25 en risque relatif (MNI_RR) ou 3 en différence de risque (MNI_DR). La valeur de PT_maxest identique que l’on soit avec une MNI en relatif ou en absolu lorsque la proportion d’événements dans le bras contrôle est celle utilisée pour le calcul d’effectif (12 % dans l’essai ABYSS).

Conclusion

Pour définir la marge de non-infériorité il est nécessaire de raisonner selon l’effet du traitement de référence et définir une diminution cliniquement acceptable de l’effet. Par ailleurs, il est important d’estimer de la manière la plus fiable possible le risque d’événement dans le bras contrôle, et d’être conscient des conséquences que cela peut avoir si le risque observé est différent de celui attendu.

Références

1. U.S. Department of Health and Human Services, Food and Drug Administration Non-Inferiority Clinical Trials to Establish Effectiveness Guidance for Industry. 2016. https://www.fda.gov/media/78504/download.

études randomisées

Dernière mise à jour le 17 janvier 2025.

Menu principal

Menu blog de la méthodologie