4 Vérification de la généralisabilité du résultat

     

Les analyses en sous-groupes ont pour seul but de s’assurer de la généralisabilité du résultat global de l’essai à l’ensemble des sous-types de patients inclus dans l’essai, c’est-à-dire de s’assurer que, l’hypothèse qui a été faite lors de l’élaboration des critères d’éligibilité du protocole que tous les patients inclus bénéficieraient de la même façon du traitement, n’est pas remise en cause par les résultats des analyses en sous-groupes.

Les analyses en sous-groupes standards note n° 4 ne servent qu’à juger de la généralisabilité du résultat de l’étude aux différents types de patients qui ont été inclus dans l’essai.

Lors de la conception de l’étude, les critères d’éligibilité sont définis afin de recruter des patients que l’on pense tous en mesure de tirer le même bénéfice du traitement. L’analyse de la généralisabilité du résultat est donc une vérification, a posteriori, qu’il était justifié de regrouper ces différents types de patients au sein d’une même étude.

Cette analyse s’effectue graphiquement. Les analyses en sous-groupes sont le plus souvent représentées à l’aide d’un forest plot où le résultat de l’étude est projeté sur les sous-groupes par un trait vertical.

IMG

Figure 9 – Utilisation des analyses en sous-groupes pour s’assurer de la généralisabilité du résultat de l’essai à tous les sous-types de patients inclus dans l’essai. La bande grise verticale représente la projection de l’intervalle de confiance du résultat de l’essai (All patients) sur les résultats des analyses en sous-groupes. Les intervalles de confiances des sous-groupes ont tous des parties communes avec l’intervalle de confiance du résultat de l’essai. Il n’existe pas de cas où le résultat obtenu par un sous-groupe serait discordant avec le résultat global compte tenu de l’incertitude des estimations. Le résultat de l’essai est donc généralisable à l’ensemble des catégories de patients inclus. [ 10.1056/NEJMoa2022485 ]

En cas de constatation de modifications de l’effet dans certains sous-groupes, les difficultés d’interprétation commencent. Le premier élément de discussion va être une interaction due au hasard. Compte tenu de la multiplicité des sous-groupes la probabilité d’avoir au moins une interaction sur le nombre du fait du hasard est importante.

Ensuite naturellement arrive la question de restreindre la population cible du traitement (si le résultat global de l’essai est en faveur du bénéfice). Comme nous l’avons vu, la présence d’une interaction ne signifie pas l’absence d’effet dans un sous-groupe. Elle signifie simplement que l’effet du traitement change entre les sous-groupes. Ainsi la difficulté de conclure à l’absence d’intérêt d’un traitement dans un sous-groupe reste identique.

Utilisation erronée des sous-groupes pour conclure vis-à-vis de l’effet du traitement

Analyse de la signification statistique (nominale) pour chaque sous-groupe, par exemple chez les hommes, chez les femmes

Correspond au même objectif que l’essai, entraine donc une inflation du risque alpha global de conclure à tort à un quelconque intérêt du traitement

Utilisation appropriée des sous-groupes pour rechercher si un facteur modifie la taille de l’effet du traitement (interaction)

Comparer la taille de l’effet entre les sous-groupes (par exemple entre les hommes et les femmes pour explorer si le sexe est un facteur modifiant l’effet du traitement)

Ne cherche pas à conclure à l’intérêt du traitement

Résultat purement exploratoire, cognitif.

Ne permettant pas de faire des conclusions sur l’intérêt du traitement, cette analyse n’entraine pas d’inflation du risque alpha global de l’essai

Il faut cependant noter, qu’en pratique, hors du champ d’une interprétation rigoureuse, les analyses en sous-groupe sont largement surinterprétées, exposant à des prises de décisions potentiellement erronées. La littérature regorge d’exemples de résultats de sous-groupes qui ont été invalidés par les études de vérification ultérieures.

La nouvelle politique concernant les p-values du NEJM se traduit par la disparition des p-values des tests d’existence de l’effet du traitement au niveau des résultats de sous-groupes. La Figure 10 montre un exemple de l’application de cette nouvelle politique éditoriale.

IMG

Figure 10 - Conséquence de la nouvelle politique concernant les p values du NEJM sur la présentation des résultats de sous -groupe. La figure du haut correspond à la population totale de l’étude. La p-value est donnée. La figure du bas est un sous-groupe, aucune p-value n’est rapportée, car ce résultat ne peut pas être considéré comme inférentiel, permettant une conclusion sur ce sous-groupe.


[4] c’est-à-dire non inclus dans un plan de contrôle du risque alpha global