2.1 Limite conceptuelle de la p value et de l’approche fréquentiste

     

L’approche classique des statistiques (test d’hypothèse, intervalle de confiance, p value) est l’approche fréquentiste. Traditionnellement, les essais cliniques adoptent cette approche et la p value est utilisée pour apprécier la « plausibilité statistique » de l’effet du traitement étudié. Cependant la p value ne donne qu’une appréciation très indirecte de cette plausibilité.

Devant la possibilité que le résultat d’un l’essai soit dû au hasard (cf. dossier 1 – risque alpha global), la question qui vient naturellement à l’esprit est « quelle est alors la probabilité que le traitement soit efficace compte tenu du résultat obtenu ? ». Compte tenu des incertitudes dues aux fluctuations aléatoires qui affectent tout résultat observé, que peut-on conclure à partir de ces résultats quant à la plausibilité de l’effet du traitement ? Finalement, à l’issue de cet essai, quelle est la probabilité que le traitement apporte un bénéfice (ou quelle est la probabilité qu’il n’apporte pas de bénéfice) ? Mais la p value ne va pas répondre à cette question. Elle va apporter une tout autre information qui n’est qu’une appréciation très indirecte de la plausibilité de l’effet du traitement à l’issue des résultats obtenus dans l’essai.

La p value apprécie la probabilité d’obtenir les résultats effectivement observés sous l’hypothèse qu’il n’y a pas d’effet du traitement (l’hypothèse nulle, H0). En fait la p value donne une réponse qui est à l’opposé de la question que l’on se pose. En termes de probabilité conditionnelle, cette question est la probabilité que le traitement « marche » (ou « ne marche pas ») en fonction des résultats obtenus. Avec les notations suivantes : H1 le traitement apporte un bénéfice, H0 il n’apporte pas de bénéfice (H1 = 1- H0) et R les résultats effectivement obtenus dans l’essai, la question naturelle est quelle est la probabilité de H1 si R (ou H0 si R) : Pr (H0 | R). À la place de cela, la p value est connectée à la probabilité des résultats si H0 : Pr (R | H0).

Mais pourquoi donne-t-on une réponse qui est l’inverse de la question posée ? Cela provient du fait que l’on ne sait pas calculer directement à partir des résultats la probabilité conditionnelle Pr(H0|R).

Ainsi on aimerait connaitre Pr(H0|R) (ou Pr(H1|R)) mais seul Pr(R|H0) est accessible. Cela s’avère possible grâce au théorème de Bayes :

IMG

Cependant ce calcul implique de connaitre Pr(A), c’est-à-dire Pr(H0) ou Pr(H1). C’est toute la difficulté de cette approche : pour calculer à l’issue de l’essai la probabilité que le traitement apporte un bénéfice, il faut introduire la probabilité à priori que le traitement apporte un bénéfice note n° 1 .


[1] C’est la même situation qu’avec les tests diagnostiques où pour calculer la VPP (probabilité que le patient soit malade en fonction d’un test positif) à partir de la sensibilité (probabilité d’avoir un test positif si le patient est malade) il faut connaitre la prévalence de la maladie à diagnostiquer (la probabilité à priori que le patient soit malade).