2.1 Problématique

La conclusion à l’absence d’effet indésirable notable lors de l’analyse d’un essai est souvent faites de façon rudimentaire, à partir du constat que la fréquence du critère considérée est similaire entre les 2 groupes (non augmentée dans le groupe traité par rapport au groupe contrôle), sans plus de formalisme.

Dans l’essai TRILOGY ACS [3] comparant à la phase précoce des syndromes coronariens aigus le prasugrel au clopidogrel, il est conclu que « rates of severe and intracranial bleeding were similar in the two groups » à partir des résultats de safety suivant :

Cette conclusion semble donc avoir été faite à partir du constant que les estimations ponctuelles de la fréquence des saignements sévères (1 ^ère ligne de résultat) sont « similaires » entre les 2 groupes (0.4% et 0.4%)

Cependant l’incertitude statistique existant en général sur les données de safety rend ce raisonnement extrêmement fragile et susceptible de conclure facilement à l’absence de surcroit d’évènements indésirable à tort. En effet, compte tenu de la rareté des évènements considérés, ne pas constater de différence numérique notable n’apporte à peu près aucune garantie de l’absence réelle de surrisque.

Dans d’autres cas, un test statistique est effectué et un résultat non statistiquement significatif est alors invoqué pour conclure à l’absence de surrisque.

Dans le tableau de résultats de l’essai TRILOGY ACS (ci-dessus) la dernière colonne présente la p value. Celle des saignements sévères (1 ^re ligne) conduirait dans une interprétation abusive (cf. infra) à faire la même conclusion que la comparaison naïve des pourcentages.

Cette approche présente les mêmes limites et ne permet pas davantage de faire des conclusions fiables d’absence de surrisque. En effet, un résultat non statistiquement significatif ne permet pas de conclure à l’absence d’effet, note n° 1 car il peut simplement provenir d’un manque de puissance statistique [4] . Les évènements indésirables susceptibles de remettre en cause la balance bénéfice risque sont en général moins fréquents que les évènements utilisés pour montrer le bénéfice. La calibration de l’essai (calcul du nombre de sujets ou du nombre d’évènements nécessaires) est faite pour garantir une puissance sur la recherche de l’efficacité, et jamais, sauf cas exceptionnel, pour garantir la puissance au niveau des évènements indésirables. Ainsi il est impossible de conclure à l’absence d’effet devant un résultat non significatif.

Démontrer qu’un traitement est sûr, c’est-à-dire qu’il n’induit d’augmentation de la fréquence d’un ou de plusieurs évènements cliniques non désirés, avec le même degré de certitude que pour l’efficacité, est impossible. En effet, il s’agirait alors de démontrer l’absence d’effet. Or en statistique il est impossible d’obtenir cette démonstration de manière formelle [4] . C’est d’ailleurs pour cette raison que l’approche des essais de non-infériorité a été élaborée.

Ces réflexions montrent bien qu’en termes de safety, le risque statistique pertinent est le risque beta de ne pas conclure à une différence qui existe pourtant. Vis-à-vis de l’objectif de l’analyse des données de safety, cette formulation devient le risque de ne pas conclure à une augmentation des effets indésirables qui existe pourtant. C’est le risque de ne pas détecter un problème d’effets indésirables et de conclure à tort à une balance bénéfice risque favorable à l’issue de l’essai et, ainsi, de laisser recommander et utiliser un nouveau produit à la balance bénéfice risque non favorable.

[1] Cf. Dossier 21 – Le cas des essais « négatifs »