Comparaisons à un groupe contrôle externe

Le score de propension est déterminé par une modélisation du traitement (treatment model ) à l’aide d’un modèle cherchant à prédire le traitement des patients en fonction de leurs caractéristiques [139] [140] . Plus précisément, il s’agit d’un modèle prédisant la probabilité de recevoir le nouveau traitement (traitement étudié) en fonction des caractéristiques des patients.

Bien qu’il s’agisse structurellement d’un modèle prédictif du traitement (la variable à expliquer est le traitement), sa construction, c’est à dire le choix des variables explicatives, ne s’effectuera pas avec la logique habituelle de construction des outils prédictifs [141] . En fait ce modèle traitement n’a pas pour fonction d’être un vrai outil de prédiction comme l’est, par exemple, une équation de risque cardiovasculaire. Un tel outil prédictif n’aurait d’ailleurs pas beaucoup d’utilité en pratique. Ce « modèle traitement » n’est en fait qu’un « intermédiaire calculatoire » permettant, in fine, par différentes méthodes, d’équilibrer les groupes sur les facteurs de confusion. Les variables à prendre en compte dans ce modèle ne sont pas les prédicteurs du traitement, mais les variables de confusion qui sont, avant tout, des prédicteurs de l’outcome. Il existe une littérature fournie sur la nature des variables à prendre en compte dans le score de propension et les conceptions ont évolué au cours du temps. Le consensus actuel peut se résumer de la façon suivante [141] [142] :

Les variables associées avec l’outcome (critère de jugement) doivent toujours être introduites dans le score propension. Si elles ne sont pas des facteurs de confusion (car elles ne sont pas aussi associées au traitement) elles ne contribueront pas à réduire le biais, mais elles permettront de réduire la variance de l’estimation de l’effet traitement recherché et donc d’améliorer précision et puissance statistique.

Pour les petits effectifs, il est cependant conseillé de ne pas retenir les variables fortement reliées au traitement et faiblement reliées à l’outcome.

Les variables strictement associées avec le traitement (appelées « variables instrumentales » ou simplement « instruments ») ne doivent pas être introduites dans le score de propension (ce qui parait paradoxal au premier abord quand le score de propension est présenté, de façon simpliste, comme étant un modèle prédictif du traitement, cf. discussion ci-dessus).

Les collisionneurs (collider ) doivent aussi être tenus en dehors du score de propension tout comme les médiateurs (variables intermédiaires dans le chemin causale entre le traitement et l’outcome).

De ces règles découlent tout l’intérêt de la revue systématique à la recherche des facteurs pronostiques des critères de jugement (cf. section 14.2.2 ) et la réalisation des graphiques de causalités (à l’aide de DAG par exemple, cf. section 14.2.1 ) pour identifier les variables à ne pas introduire dans le score de propension (collisionneurs et variable instrumentale).

[intertitreCxSpFirst] Les variables prédictives de l’outcome DOIVENT être dans le modèle

[intertitreCxSpLast] Une variable qui n’est pas prédictive de l’outcome Ne DOIT PAS être dans le modèle même si elle est prédictive du traitement

Une fois le modèle estimé à partir des données de l’étude, il est utilisé pour calculer, pour chaque patient de l’étude, son score de propension à partir de ses valeurs des variables qui sont prises en considération par le modèle.

Le calcul du score de propension est donc une procédure à deux étapes :

Construire un modèle à partir des données de l’étude prédisant la probabilité de recevoir l traitement étudié en fonction des facteurs de confusion
Utiliser numériquement ce modèle pour calculer pour chaque patient son propre score de propension à partir de ses valeurs sur les facteurs de confusion (pris en compte dans le modèle)

Au niveau calculatoire le modèle traitement est le plus souvent établi à l’aide d’une régression logistique, mais d’autres techniques en particulier de machine learning peuvent être utilisées (cf. section 15.7).

Le modèle peut être adapté itérativement (en retirant ou rajoutant des variables) en fonction des résultats qu’ils donnent en termes d’équilibrage des facteurs de confusion entre les groupes, à la condition expresse, cependant, que cette adaptation ignore complètement les résultats produits en termes d’estimation de l’effet du traitement. Autrement, ce processus s’apparenterait au p hacking. Il est donc indispensable que cette adaptation se fasse avant toute analyse inférentielle et ne porte que sur l’équilibre des facteurs de confusion note n° 18 . Ces itérations de mises au point du modèle doivent être rapportées en toutes transparences.

[18] De manière générale plusieurs méthodes de prise en compte peuvent être essayer afin de déterminer celle qui conduit à la meilleure comparabilité des groupes après ajustement. Cela ne peut être accepté que s’il est certain qu’aucune analyse inférentielle n’a été réalisée durant ce process.