2 TL ; DR - Guide d’évaluation des comparaisons à un groupe contrôle externe
3 Les études de comparaison externe, de quoi s’agit-il ?
5 Les problématiques méthodologiques soulevées par les comparaisons externes
6 Les comparaisons externes sont des études observationnelles
7 Position des agences de régulation et de HTA
8 De la nécessité d’avoir des preuves de l’intérêt cliniques des nouveaux traitements
9 Les sources de données utilisables
10 Les problématiques liées à l’aspect rétrospectif de ces études
12 Démarche hypothético déductive
13 L’inférence causale et les hypothèses sous-jacentes
15 Les techniques d’analyses statistiques
15.1 Les techniques basées sur l’appariement (matching )
15.2.2 Le calcul du score de propension
15.2.3 L’importance du chevauchement des distributions des scores de propension
15.3 L’appariement sur le score de propension
§ Limites de l’appariement sur le score de propension
15.4 Les méthodes de pondération
§ L’effective sample size (ESS)
§ Distribution des poids, hypothèse de positivité
15.4.2 Pondérations non basées sur le score de propension
15.5 La g computation (g formula)
15.6 Les méthodes doubles robustes
15.7 Les méthodes de régression
15.8 Les techniques d e maching learning (IA)
16 Le diagnostic d’absence de biais de confusion résiduel
18 Identifications des patients dans la source de données
21 Les outils d’évaluation du risque de biais
22 L’émulation d’un essai cible
23 Le benchmarking et les contrôles positifs
24 Analyses de sensibilité , analyses quantitatives du biais
26 Contrôle du risque alpha global
La distribution des scores de propension dans les deux groupes permet d’explorer le respect de l’hypothèse de positivité de l’inférence causale (cf. section 13.1.1).
Cette hypothèse stipule que tous les patients, quelles que soient leurs caractéristiques étaient susceptibles de recevoir les deux traitements. Il n’existe pas de patients qui compte tenu de leurs caractéristiques avaient une probabilité nulle de recevoir l’un des deux traitements, c’est-à-dire qu’ils ne pouvaient pas recevoir l’un des deux traitements.
Comme le score de propension est un condensé de caractéristiques des patients, l’hypothèse de positivité sera non vérifiée si pour certains scores de propension existent que des patients traités avec l’un ou l’autre des deux traitements. Ce point peut se vérifier en comparant la distribution des scores de propension dans les 2 groupes (Figure 8, Figure 9, Figure 10 et Figure 11). Cette hypothèse sera vérifiée quand les deux distributions se chevauchent parfaitement.

Figure 8 – Exploration du chevauchement des distributions du score de propension dans les deux groupes de traitement (DMT A et DMT B). les deux distributions se chevauchent très largement permettant de conclure que l’hypothèse de positivité n’est pas violée (d’après ref [143] ).

Figure 9 – Situation caractéristique d’un non-respect de l’hypothèse de positivité. Les deux distributions ne se chevauchent pas. Pour un score de propension inférieure à environ 0.25 les patients avaient une probabilité nulle de recevoir le traitement bleu et pour les scores supérieurs à 0.8, les patients avaient une probabilité nulle de recevoir le traitement rouge.
En cas de non-vérification de l’hypothèse de positivité du fait d’un non-chevauchement des distributions, il est parfois proposé de faire un trimming, c’est-à-dire de ne retenir que la plage de score de propension où les distributions se chevauchent. Dans ce cas et pour les études observationnelles classiques l’estimand change est devient l’estimand ATO (average treatment effect in the overlap population ) qui peut s’interpréter comme l’effet causal du traitement évalué chez les patients pour lesquels les médecins sont encore ambivalents quant au choix du traitement (il y a équipoise pour ces patients) [144] . Cependant si cette approche améliore les performances statistiques elle limite l’interprétation et la généralisabilitée des résultats. L’ATO est l’estimand d’un effet traitement dans une population difficile à définir de façon clinique. Son utilisation dans les comparaisons externes est à exclure.
Dans le cas des comparaisons à un groupe contrôle externe l’interprétation de l’estimand obtenu après trimming est moins évident. D’autres solutions en cas de non-positivité sont en cours de développement [145] .

Figure 10 – Représentation en nuage de points des scores de propension des deux groupes comparés. Apparaissent sur les patients (points) des deux groupes qui sont en dehors de la région commune (common support ) et ceux du groupe contrôle qui n’ont pas pu être appariés.

Figure 11 – Représentation en boxplot des distributions des score de propension avant et après appariement