2 TL ; DR - Guide d’évaluation des comparaisons à un groupe contrôle externe
3 Les études de comparaison externe, de quoi s’agit-il ?
5 Les problématiques méthodologiques soulevées par les comparaisons externes
6 Les comparaisons externes sont des études observationnelles
7 Position des agences de régulation et de HTA
8 De la nécessité d’avoir des preuves de l’intérêt cliniques des nouveaux traitements
9 Les sources de données utilisables
10 Les problématiques liées à l’aspect rétrospectif de ces études
12 Démarche hypothético déductive
13 L’inférence causale et les hypothèses sous-jacentes
15 Les techniques d’analyses statistiques
15.1 Les techniques basées sur l’appariement (matching )
15.2.2 Le calcul du score de propension
15.2.3 L’importance du chevauchement des distributions des scores de propension
15.3 L’appariement sur le score de propension
§ Limites de l’appariement sur le score de propension
15.4 Les méthodes de pondération
§ L’effective sample size (ESS)
§ Distribution des poids, hypothèse de positivité
15.4.2 Pondérations non basées sur le score de propension
15.5 La g computation (g formula)
15.6 Les méthodes doubles robustes
15.7 Les méthodes de régression
15.8 Les techniques d e maching learning (IA)
16 Le diagnostic d’absence de biais de confusion résiduel
18 Identifications des patients dans la source de données
21 Les outils d’évaluation du risque de biais
22 L’émulation d’un essai cible
23 Le benchmarking et les contrôles positifs
24 Analyses de sensibilité , analyses quantitatives du biais
26 Contrôle du risque alpha global
Le score de propension est déterminé par une modélisation du traitement (treatment model ) à l’aide d’un modèle cherchant à prédire le traitement des patients en fonction de leurs caractéristiques [139] [140] . Plus précisément, il s’agit d’un modèle prédisant la probabilité de recevoir le nouveau traitement (traitement étudié) en fonction des caractéristiques des patients.
Bien qu’il s’agisse structurellement d’un modèle prédictif du traitement (la variable à expliquer est le traitement), sa construction, c’est à dire le choix des variables explicatives, ne s’effectuera pas avec la logique habituelle de construction des outils prédictifs [141] . En fait ce modèle traitement n’a pas pour fonction d’être un vrai outil de prédiction comme l’est, par exemple, une équation de risque cardiovasculaire. Un tel outil prédictif n’aurait d’ailleurs pas beaucoup d’utilité en pratique. Ce « modèle traitement » n’est en fait qu’un « intermédiaire calculatoire » permettant, in fine, par différentes méthodes, d’équilibrer les groupes sur les facteurs de confusion. Les variables à prendre en compte dans ce modèle ne sont pas les prédicteurs du traitement, mais les variables de confusion qui sont, avant tout, des prédicteurs de l’outcome. Il existe une littérature fournie sur la nature des variables à prendre en compte dans le score de propension et les conceptions ont évolué au cours du temps. Le consensus actuel peut se résumer de la façon suivante [141] [142] :
Les variables associées avec l’outcome (critère de jugement) doivent toujours être introduites dans le score propension. Si elles ne sont pas des facteurs de confusion (car elles ne sont pas aussi associées au traitement) elles ne contribueront pas à réduire le biais, mais elles permettront de réduire la variance de l’estimation de l’effet traitement recherché et donc d’améliorer précision et puissance statistique.
Pour les petits effectifs, il est cependant conseillé de ne pas retenir les variables fortement reliées au traitement et faiblement reliées à l’outcome.
Les variables strictement associées avec le traitement (appelées « variables instrumentales » ou simplement « instruments ») ne doivent pas être introduites dans le score de propension (ce qui parait paradoxal au premier abord quand le score de propension est présenté, de façon simpliste, comme étant un modèle prédictif du traitement, cf. discussion ci-dessus).
Les collisionneurs (collider ) doivent aussi être tenus en dehors du score de propension tout comme les médiateurs (variables intermédiaires dans le chemin causale entre le traitement et l’outcome).
De ces règles découlent tout l’intérêt de la revue systématique à la recherche des facteurs pronostiques des critères de jugement (cf. section 14.2.2 ) et la réalisation des graphiques de causalités (à l’aide de DAG par exemple, cf. section 14.2.1 ) pour identifier les variables à ne pas introduire dans le score de propension (collisionneurs et variable instrumentale).
[intertitreCxSpFirst] Les variables prédictives de l’outcome DOIVENT être dans le modèle
[intertitreCxSpLast] Une variable qui n’est pas prédictive de l’outcome Ne DOIT PAS être dans le modèle même si elle est prédictive du traitement
Une fois le modèle estimé à partir des données de l’étude, il est utilisé pour calculer, pour chaque patient de l’étude, son score de propension à partir de ses valeurs des variables qui sont prises en considération par le modèle.
Le calcul du score de propension est donc une procédure à deux étapes :
Au niveau calculatoire le modèle traitement est le plus souvent établi à l’aide d’une régression logistique, mais d’autres techniques en particulier de machine learning peuvent être utilisées (cf. section 15.7).
Le modèle peut être adapté itérativement (en retirant ou rajoutant des variables) en fonction des résultats qu’ils donnent en termes d’équilibrage des facteurs de confusion entre les groupes, à la condition expresse, cependant, que cette adaptation ignore complètement les résultats produits en termes d’estimation de l’effet du traitement. Autrement, ce processus s’apparenterait au p hacking. Il est donc indispensable que cette adaptation se fasse avant toute analyse inférentielle et ne porte que sur l’équilibre des facteurs de confusion note n° 18 . Ces itérations de mises au point du modèle doivent être rapportées en toutes transparences.
[18] De manière générale plusieurs méthodes de prise en compte peuvent être essayer afin de déterminer celle qui conduit à la meilleure comparabilité des groupes après ajustement. Cela ne peut être accepté que s’il est certain qu’aucune analyse inférentielle n’a été réalisée durant ce process.