4.2 Probabilité à posteriori d’efficacité, intervalle de crédibilité

     

À partir de cette distribution « à postériori » de l’effet traitement, plusieurs mesures sont dérivées, principalement une estimation ponctuelle (médiane ou moyenne), l’intervalle de crédibilité à 95% et la probabilité à postériori que le traitement soit efficace.

La distribution de l’effet du traitement représente l’incertitude avec laquelle on connait l’effet du traitement. Plus la distribution est étalée, plus l’incertitude est grande. Sur cette distribution (cf. Figure 3) on peut calculer la probabilité que l’effet du traitement soit dans la zone du bénéfice (c’est la zone en dessous de l’absence d’effet). Cette probabilité est l’aire sous la courbe de cette zone (en dessous de 1 pour une mesure relative, risque ratio, odds ratio, hazard ratio ; ou en dessous de zéro pour une différence de moyenne, de risque). Elle est dénommée probabilité à posteriori d’efficacité (ou de supériorité) (« posterior probabilities of efficacy », « posterior probabilities of superiority to control »).

IMG

Figure 3 – Illustration du calcul de la probabilité à postériori que le traitement soit efficace Il s’agit de l’aire sous la courbe en dessous de la valeur de l’absence d’effet. Ici inférieure à 1 comme il s’agit d’une distribution de risque ratio (RR). La distribution représente l’incertitude sur l’estimation du risque ratio. Il s’avère qu’il y a une possibilité que celui-ci soit 1 ou supérieur à 1 (effet délétère), mais il est plus probable qu’il soit inférieur à 1 (la plus grande partie de la distribution est en dessous de 1).  La probabilité que ce risque ratio soit inférieur à 1 est calculée par l’aire sous la courbe.

Pour pouvoir conclure à l’intérêt du traitement (supériorité) à partir de la probabilité à postériori, il est nécessaire de fixer un seuil de décision note n° 3 , sinon la conclusion serait arbitraire, décidée au cas par cas et très influencée par l’intérêt de conclure au bénéfice du traitement. Sans ce seuil chacun pourra voir dans la valeur obtenue de probabilité à posteriori d’efficacité ce qu’il souhaite voir. Ce seuil correspond au degré de certitude que l’on souhaite avoir pour adopter le nouveau traitement. Par analogie avec le niveau de risque alpha utilisé dans l’approche classique fréquentiste, ce seuil est souvent fixé à 97.5% même s’il ne s’agit pas des mêmes concepts. Comme la notion de risque alpha existe aussi dans l’essai bayésien (cf. section suivante), ce seuil est maintenant fixé pour garantir un risque alpha de 97.5%. Cependant compte tenu de la nouveauté de cette approche, aucun standard n’a été établi et certains essais peuvent revendiquer la démonstration de la supériorité du traitement avec un seuil nettement inférieur à ces valeurs.

Exemple de choix effectué dans un essai

The criterion for declaring a most or least effective treatment was a probability greater than 0.975. The threshold of 0.975 was chosen by convention (analogous to an alpha of 0.025 in a one-sided comparison) and because a simulation study showed that with this threshold and trial design, the type I error rate was controlled.

Il est aussi possible de calculer l’intervalle qui englobe 95% des valeurs les plus probables. C’est l’intervalle de crédibilité à 95%. On peut remarquer que la définition de l’intervalle de crédibilité bayésien correspond à l’interprétation erronée de l’intervalle de confiance à 95% fréquentiste qui est souvent faite note n° 4 , illustrant au passage que les concepts bayésiens sont plus intuitifs et plus faciles à interpréter correctement. Ce dernier point représente l’avantage de l’approche bayésienne dans le cadre des essais de phase 3.

IMG

Figure 4 – Illustration de la détermination de l’intervalle de crédibilité

A la place de la probabilité d’être efficace, Il est aussi possible de calculer une probabilité que l’effet du traitement soit supérieur à une valeur de bénéfice cliniquement pertinent minimal (MCID) (cf. Figure 1).


[3] Certain essai utilise aussi un seuil de décision pour conclure à la futilité du traitement (et éventuellement à son infériorité).

[4] L’intervalle de confiance à 95% est l’intervalle qui a une probabilité de 95% de contenir la vraie valeur de l’effet du traitement (vraie valeur qui est considérée comme fixe). En d’autres termes, si l’on réplique (hypothétiquement) un grand nombre de fois le même essai, 95% des IC ainsi générés contiendront la vraie valeur.