2.1 Confusion

     

Une problématique méthodologique importante des études observationnelles réside dans le biais de confusion.

Dans la vraie vie, les médecins ne prescrivent pas les traitements au hasard, mais les choisissent, au cas par cas, en prenant en compte les particularités de leurs patients, et les patients n’accèdent pas aux mêmes traitements selon leurs caractéristiques et leurs comportements de recours aux soins. Certaines de ces caractéristiques, conditionnant l’accès au traitement ou au soin, et le choix du traitement ou la décision de traiter ou de ne pas traiter, peuvent être aussi des variables qui conditionnent en amont le critère de jugement. Dans ces situations, si la méthodologie et les analyses statistiques ne sont pas correctement conçues, une fausse relation entre le traitement et le critère de jugement peut apparaitre du fait de cette relation triangulaire. Il y a confusion entre l’effet de la covariable et l’effet du traitement, conduisant à un résultat biaisé (dans un sens ou dans l’autre). C’est le « biais » de confusion auquel se rattache le biais dit d’indication, le channeling, etc.

Les études observationnelles cherchent à supprimer ce biais de confusion au moment de l’analyse à l’aide de différentes techniques statistiques visant à prendre en compte les différences de caractéristiques pouvant exister entre les patients étudiés (« ajustements », analyse conditionnée) qui peut être réalisé de nombreuses manières. Toutes les approches d’ajustement ne sont pas équivalentes sur d’autres aspects.

La prise en compte statistique de ces différences peu se faire de nombreuses manières (mixables entre elles éventuellement) : restriction, matching, stratification, régression multivariée, pondération ou autres méthodes plus complexes et moins courantes, soit sur les facteurs de confusion eux-mêmes soit sur un score de propension (sorte de condensat des variables sur lesquelles on souhaite ajuster).

En théorie il est possible de corriger complètement un résultat du biais de confusion s’il est possible de prendre ne compte tous les facteurs de confusion à l’origine du biais. En pratique cela suppose une identification raisonnée des facteurs de confusion « potentiel » pour chaque critère de jugement en se basant sur :

  • L’identification de tous les facteurs de confusion potentiels par une revue systématique de tous les caractéristiques (prédicteurs ou déterminants) conditionnant le critère de jugement considéré
  • L’élaboration d’un réseau de causalité (causal graph) [11] sous la forme d’un graphe orienté acyclique (Directed acyclic graph, DAG) pour identifier les facteurs d’ajustement (et ceux sur lesquels il ne faut pas ajuster, comme les colliders)
  • La prise en compte de tous les facteurs de confusion identifié ce qui suppose La disponibilité des données (de bonne qualité) pour chacune de ces variables.

Juger de l’optimalité d’un ajustement a posteriori n’est pas aisé même si l’ensemble des points précédents ont été suivis par l’étude. En effet, juger de l’identification complète de tous les facteurs de confusion pour chaque critère demande une expertise thématique et méthodologique poussée. De plus, dans la réalité, il est rare que l’analyse puisse prendre en compte tous les facteurs de confusion potentiels (non-disponibilité par exemple avec les données secondaires). In fine se pose donc la question d’un biais de confusion résiduel .

Plusieurs développements méthodologiques récents donnent des outils pour chercher à répondre à cette question : les contrôles négatifs et positifs et l’analyse quantitative de biais. Si grâce à ces outils il est possible d’exclure formellement un biais de confusion résiduel les résultats pourront être considérés comme fiables sur le plan de la confusion.

Les contrôles négatifs sont soit des critères de jugement que l’on sait non-associés avec le traitement étudié soit des expositions que l’on sait non-associées avec le critère de jugement, mais qui sont susceptibles d’être impactées par les mêmes facteurs de confusion de l’association d’intérêt.

Exemples de contrôle négatif.

Dans les études des conséquences de l’exposition in utero à un médicament, la prise du médicament longtemps avant ou après la grossesse sont des contrôles négatifs potentiels. Biologiquement il ne peut pas y avoir d’association avec les malformations par exemple, mais cette relation est susceptible d’être affectée par les mêmes facteurs de confusion que la relation d’intérêt (exposition in utero et malformation). Si l’ajustement est insuffisant, une relation apparait sur ce contrôle négatif entrainant la réfutation de l’absence de biais de confusion résiduelle.

Un évènement clinique type effet indésirable médicamenteux, que l’on sait parfaitement exclu avec le médicament d’intérêt, mais dont certains facteurs de risques sont communs avec les facteurs de confusion potentielle (facteurs de fragilité des patients par exemple) peut servir de contrôle négatif.

Les contrôles négatifs ne permettent jamais d’exclure avec certitude un biais de confusion résiduel, car il est toujours possible que les facteurs de confusion persistant après ajustement n’affectent pas en fait les contrôles négatifs considérés et parce que le raisonnement nécessite de conclure à l’absence de relation, ce qui statistiquement est toujours incertain pour des raisons de puissance statistique.

Cependant les contrôles négatifs permettent de réfuter un résultat si on retrouve, pour le contrôle, une association de même ordre de grandeur que celle retrouvée pour l’exposition réelle d’intérêt (ou l’événement réel d’intérêt). Dans cette situation en effet, l’association retrouvée pour le contrôle est à la fois le marqueur l’existence et le quantificateur de l’importance d’un biais de confusion résiduel.

L’analyse quantitative de biais peut prendre plusieurs formes, mais le principe général est de montrer que la taille de l’effet obtenu ne peut pas s’expliquer par des facteurs de confusion qui n’auraient pas été pris en considération. Il s’agit d’une mesure de la robustesse numérique des résultats. Les limites de l’approche résident dans le fait que ces calculs reposent sur des hypothèses sur le nombre et la force des facteurs de confusion oubliés ou débouchent sur une analyse de « tipping point » (point de rebroussement).