15.2.3 L’importance du chevauchement des distributions des scores de propension

La distribution des scores de propension dans les deux groupes permet d’explorer le respect de l’hypothèse de positivité de l’inférence causale (cf. section 13.1.1).

Cette hypothèse stipule que tous les patients, quelles que soient leurs caractéristiques étaient susceptibles de recevoir les deux traitements. Il n’existe pas de patients qui compte tenu de leurs caractéristiques avaient une probabilité nulle de recevoir l’un des deux traitements, c’est-à-dire qu’ils ne pouvaient pas recevoir l’un des deux traitements.

Comme le score de propension est un condensé de caractéristiques des patients, l’hypothèse de positivité sera non vérifiée si pour certains scores de propension existent que des patients traités avec l’un ou l’autre des deux traitements. Ce point peut se vérifier en comparant la distribution des scores de propension dans les 2 groupes (Figure 8, Figure 9, Figure 10 et Figure 11). Cette hypothèse sera vérifiée quand les deux distributions se chevauchent parfaitement.

Figure 8 – Exploration du chevauchement des distributions du score de propension dans les deux groupes de traitement (DMT A et DMT B). les deux distributions se chevauchent très largement permettant de conclure que l’hypothèse de positivité n’est pas violée (d’après ref [143] ).

Figure 9 – Situation caractéristique d’un non-respect de l’hypothèse de positivité. Les deux distributions ne se chevauchent pas. Pour un score de propension inférieure à environ 0.25 les patients avaient une probabilité nulle de recevoir le traitement bleu et pour les scores supérieurs à 0.8, les patients avaient une probabilité nulle de recevoir le traitement rouge.

En cas de non-vérification de l’hypothèse de positivité du fait d’un non-chevauchement des distributions, il est parfois proposé de faire un trimming, c’est-à-dire de ne retenir que la plage de score de propension où les distributions se chevauchent. Dans ce cas et pour les études observationnelles classiques l’estimand change est devient l’estimand ATO (average treatment effect in the overlap population ) qui peut s’interpréter comme l’effet causal du traitement évalué chez les patients pour lesquels les médecins sont encore ambivalents quant au choix du traitement (il y a équipoise pour ces patients) [144] . Cependant si cette approche améliore les performances statistiques elle limite l’interprétation et la généralisabilitée des résultats. L’ATO est l’estimand d’un effet traitement dans une population difficile à définir de façon clinique. Son utilisation dans les comparaisons externes est à exclure.

Dans le cas des comparaisons à un groupe contrôle externe l’interprétation de l’estimand obtenu après trimming est moins évident. D’autres solutions en cas de non-positivité sont en cours de développement [145] .

Figure 10 – Représentation en nuage de points des scores de propension des deux groupes comparés. Apparaissent sur les patients (points) des deux groupes qui sont en dehors de la région commune (common support ) et ceux du groupe contrôle qui n’ont pas pu être appariés.

Figure 11 – Représentation en boxplot des distributions des score de propension avant et après appariement