4 Gestion des autres types de multiplicité lors des analyses intermédiaires

     

Dans les essais modernes, le plan de contrôle du risque alpha global gère d’autres multiplicités que celle engendrée par les analyses intermédiaires, par exemple celle liée à plusieurs critères de jugement décisionnel par répartition du risque alpha ou par hiérarchisation. À ce moment les méthodes dédiées aux analyses intermédiaires se greffent sur celles utilisées en amont pour la multiplicité des critères. Comme évoqué précédemment, la hiérarchisation peut intégrer les analyses intermédiaires aux différents critères de jugement

Dans les essais en oncologie moderne, les analyses intermédiaires sont quasi systématiques. La multiplicité des comparaisons qu’elles entrainent s’ajoute alors à celle engendrée par l’utilisation de plusieurs critères de jugement décisionnel (comme l’OS, la PFS et l’ORR). Le contrôle du risque alpha global prend alors en compte ces 2 sources de multiplicités.

L’intrication entre analyse intermédiaire et critères de jugement multiple conduit à des schémas d’étude similaire à celui représenté sur la Figure 3.

IMG

Figure 3 – Schéma typique des analyses intermédiaires dans un essai moderne d’oncologie. L’objectif de la hiérarchie décrite ici est de rediriger l’intégralité du risque alpha à 0.05 vers l’OS, ceci ne serait possible que si le bénéfice sur la survie sans progression était démontré au cutoff 1 et 2. Comme nous le verrons dans l’exemple suivant, d’autres approches encore plus complexes, idéalement illustrées sur un plan graphique sont utilisées

Dans cet essai la présence 2 critères de jugement décisionnels (PFS et OS) induit deux séquences indépendantes analyses intermédiaires / analyse finale. Une analyse intermédiaire (AI) est prévue pour éventuellement permettre de démontrer de manière anticipée le bénéfice du traitement sur la PFS. Cette AI de PFS est prévue lorsque 100 évènements de PFS (progression ou décès) auront été accumulés. Le moment où ce nombre est atteint définit alors la date de point (cut-off) de l’analyse intermédiaire note n° 2 .  Le seuil de la signification statistique à atteindre pour pouvoir faire la conclusion anticipée de bénéfice sur la PFS est de 0.01. S’il n’est pas possible de faire cette conclusion anticipée (car le p nominal obtenu est supérieur au seuil), le bénéfice du traitement sur la PFS pourra être à nouveau testé lors de l’analyse finale de PFS qui est prévue à 200 évènements de PFS. Pour pouvoir conclure à ce bénéfice, à cette analyse, le p nominal devra être inférieur à 0.04.

Pour l’OS, les analyses intermédiaires et finales vont être décalées dans le temps, car les évènements d’OS (les décès) dont plus rare que ceux de PFS. Il faut donc un suivi plus important pour obtenir le même nombre d’évènements par rapport la PFS. En général il n’est pas effectué d’analyse intermédiaire d’OS au moment de l’AI de PFS, car le nombre de décès sera très faible, rendant improbable la possibilité de démontrer avec si peu d’événement un bénéfice du traitement.

La première AI d’OS survient donc en même temps que l’AF de PFS. Cette AI d’OS n’est donc pas définie en termes de nombre d’évènements comme les autres, mais est simplement synchrone de l’analyse de PFS note n° 3 . Le seuil à atteindre pour conclure à un bénéfice sur l’OS est de 0.01. Si le p nominal n’est pas inférieur à ce seuil, aucune conclusion anticipée n’est possible et il convient d’attendre 200 décès pour déclencher l’AF à la recherche d’un éventuel bénéfice du traitement sur l’OS avec un seuil de la signification de 0.04.

Comme la multiplicité des critères de jugement a été gérée dans cette étude par une hiérarchisation (PFS puis OS), ces 2 séquences d’AI et d’AF sont à considérer l’une après l’autre pour respecter cette hiérarchie (et ainsi avoir un contrôle du risque alpha global).

En d’autres termes, lorsque l’hypothèse nulle est rejetée au cutoff 2 pour la survie sans progression et uniquement dans ce cas, l’analyse de la survie globale peut être considérée. Ceci implique que l’analyse de la survie globale ne pourra pas être testée si un bénéfice sur la survie sans progression n’est pas démontrée. Si l’analyse de survie globale ne permet pas de démontrer un bénéfice, l’essai n’est alors pas négatif mais n’aura démontré un bénéfice que sur la survie sans progression

Ainsi l’étude ne pourra démontrer un bénéfice en OS que si auparavant il a été possible de démontrer un bénéfice de PFS lors de l’AI de PFS ou de l’analyse finale de PFS. Si à l’analyse finale de PFS le p nominal n’est pas inférieur au seuil ajusté, aucun effet du traitement sur la PFS n’aura été démontré et l’étude s’arrête à ce stade. Le résultat obtenu sur l’OS sera purement exploratoire, quelle que soit sa valeur par rapport à son seuil ajusté (principe de la hiérarchisation des critères de jugement).

Si la PFS est démontré (en AI ou en AF), l’OS pourra être envisagée à but de démonstration. Si lors de l’AI d’OS le p nominal n’est pas inférieur au seuil ajusté, aucune conclusion n’est possible et l’essai se poursuit vers l’analyse finale. Ainsi à ce stade un p nominal non inférieur au seuil ne veut pas dire que l’essai est négatif. Aucune conclusion n’est possible puisque l’essai se poursuit vers l’AF. Cependant, si à l’analyse finale, le p nominal obtenu ne franchit pas la limite du seuil de la signification, l’essai sera non concluant pour l’OS. Dans l’autre cas, il aura démontré le bénéfice du traitement sur la survie.

Remarque terminologique

Souvent il y a confusion dans le langage courant entre date de point (cut-off) et d’analyse intermédiaires. On parle ainsi de 1 ère , 2 ème analyse intermédiaire pour désigner en fait les cut-off.

Si un seul critère de jugement est utilisé dans l’essai, ces appellations ne sont pas ambigües.

Par contre, en cas d’utilisation de plusieurs critères, comme ci-dessus, parler de la 2 ème analyse intermédiaire pour désigner le 2 ème cut-off n’est pas souhaitable, car, à cette date, une analyse finale de PFS et une analyse intermédiaire d’OS sont réalisées. Il est bien plus clair de dire qu’au 2 ème cut-off, analyse finale de PFS et la première analyse intermédiaire d’OS sont réalisées.

Dans un autre cas de figure, la multiplicité des critères de jugement pourrait être gérée par une répartition du risque alpha. Dans ce cas, les 2 séquences d’AI/AF deviennent complètement indépendantes. Cependant les seuils ajustés de la signification sont calculés à partir d’un capital initial d’alpha, non plus de 5% (comme avec la hiérarchisation), mais de 2.5% (en cas d’équirépartition). Ces seuils ajustés seront plus petits avec la répartition qu’avec la hiérarchisation. L’intérêt de la répartition sera de pouvoir conclure sur l’OS même si aucun bénéfice sur la PFS n’a pu être démontré (en AI ou en AF) car les deux analyses sont strictement indépendantes

L’essai keynote-010 a évalué le pembrolizumab à 2 doses en 2eme ligne du cancer du poumon non à petites cellules [3] . La multiplicité provenait de 2 critères de jugement décisionnel (PFS et OS) et deux populations de patients (patients ayant un niveau d’expression du PD-L1 >= 50% et totalité des patients positifs au PD-L1 quel que soit le degré d’expression). Une analyse intermédiaire (IA2) était prévue. Le plan de contrôle du risque alpha fut le suivant :

IMG

Le risque alpha global total de l’étude (2.5% exprimé en unilatéral, ce qui correspond bien à 5% bilatéral) a été réparti entre la PFS 0.35% et l’OS 2.15%. Les populations de patients ont été hiérarchisées (d’abord les >=50% puis la population totale).

L’analyse intermédiaire (IA2) débutait par le test de la PFS chez les TPS>=50% avec une consommation de 0.25% des 0.35% d’alpha attribué à ce critère. Si ce test était « significatif » la PFS était testé dans la population totale avec le même risque alpha (hiérarchisation). Pour l’analyse finale, il restait 0.1% d’alpha (sur les 0.35% alloué à la PFS) avec le même test hiérarchisé en fonction des populations de patients.

Pour l’OS, l’analyse intermédiaire consommait 0.5% d’alpha par rapport au 2.15% attribué à ce critère (avec la même hiérarchisation pour les populations de patients que pour la PFS). Pour l’analyse finale d’OS, le risque alpha était déterminé avec un processus de réallocation (et divisé en 2 en raison des 2 doses note n° 4 ). Il pouvait donc aller de 0.825% (qui est 2.15% attribué initialement à l’OS moins les 0.5% consommés à l’analyse intermédiaire divisée par 2) à 1% (2.15% moins 0.5% plus 0.25% et 0.1% de réallocation en provenance de l’IA2 et de l’AF de la PFS si elles sont significatives et le tout divisé par 2).


[2] Cette date de point de l’analyse n’est donc pas fixée, mais dépends de la vitesse avec laquelle survient effectivement les évènements dans l’essai lui-même. Cette date ne peut donc pas être anticipée au protocole de l’étude. Dans ce protocole, seul figure le nombre d’événement définissant l’AI.

[3] Cette AI d’OS est donc indirectement conditionnée par le nombre d’évènements de PFS nécessaires à l’AF de PFS.

[4] cf. le texte du protocole de l’essai pour la signification de l’encadré en pointillé non explicité dans la légende : « At the final analysis, OS in the strongly positive PD-L1 stratum and the overall positive PD-L1 population will be tested simultaneously, with available alpha split evenly between the two tests »