Comparaisons à un groupe contrôle externe

1 Introduction

2 TL ; DR - Guide d’évaluation des comparaisons à un groupe contrôle externe

3 Les études de comparaison externe, de quoi s’agit-il ?

4 Pour quels usages

5 Les problématiques méthodologiques soulevées par les comparaisons externes

6 Les comparaisons externes sont des études observationnelles

7 Position des agences de régulation et de HTA

8 De la nécessité d’avoir des preuves de l’intérêt cliniques des nouveaux traitements

9 Les sources de données utilisables

10 Les problématiques liées à l’aspect rétrospectif de ces études

11 Rédaction du protocole

12 Démarche hypothético déductive

13 L’inférence causale et les hypothèses sous-jacentes

14 Le biais de confusion

15 Les techniques d’analyses statistiques

15.1 Les techniques basées sur l’appariement (matching )

15.2 Le score de propension

15.2.1 Définition

15.2.2 Le calcul du score de propension

15.2.3 L’importance du chevauchement des distributions des scores de propension

15.3 L’appariement sur le score de propension

§ Limites de l’appariement sur le score de propension

15.4 Les méthodes de pondération

15.4.1 Principes

§ L’effective sample size (ESS)

§ Distribution des poids, hypothèse de positivité

15.4.2 Pondérations non basées sur le score de propension

15.5 La g computation (g formula)

15.6 Les méthodes doubles robustes

15.7 Les méthodes de régression

15.8 Les techniques d e maching learning (IA)

16 Le diagnostic d’absence de biais de confusion résiduel

17 Les biais de sélection

18 Identifications des patients dans la source de données

19 Biais liés aux données

20 La qualité des données

21 Les outils d’évaluation du risque de biais

22 L’émulation d’un essai cible

23 Le benchmarking et les contrôles positifs

24 Analyses de sensibilité , analyses quantitatives du biais

25 Calcul d’effectif

26 Contrôle du risque alpha global

27 Pertinence clinique

28 Méta-épidémiologie et étude de cas

29 Synopsis - les critères d’acceptabilité des études de comparaisons externes pour la modification des stratégies thérapeutiques

Références

30 Annexes

PDF

15.2.2 Le calcul du score de propension

Le score de propension est déterminé par une modélisation du traitement (treatment model ) à l’aide d’un modèle cherchant à prédire le traitement des patients en fonction de leurs caractéristiques [139] [140] . Plus précisément, il s’agit d’un modèle prédisant la probabilité de recevoir le nouveau traitement (traitement étudié) en fonction des caractéristiques des patients.

Bien qu’il s’agisse structurellement d’un modèle prédictif du traitement (la variable à expliquer est le traitement), sa construction, c’est à dire le choix des variables explicatives, ne s’effectuera pas avec la logique habituelle de construction des outils prédictifs [141] . En fait ce modèle traitement n’a pas pour fonction d’être un vrai outil de prédiction comme l’est, par exemple, une équation de risque cardiovasculaire. Un tel outil prédictif n’aurait d’ailleurs pas beaucoup d’utilité en pratique. Ce « modèle traitement » n’est en fait qu’un « intermédiaire calculatoire » permettant, in fine, par différentes méthodes, d’équilibrer les groupes sur les facteurs de confusion. Les variables à prendre en compte dans ce modèle ne sont pas les prédicteurs du traitement, mais les variables de confusion qui sont, avant tout, des prédicteurs de l’outcome. Il existe une littérature fournie sur la nature des variables à prendre en compte dans le score de propension et les conceptions ont évolué au cours du temps. Le consensus actuel peut se résumer de la façon suivante [141] [142] :

Les variables associées avec l’outcome (critère de jugement) doivent toujours être introduites dans le score propension. Si elles ne sont pas des facteurs de confusion (car elles ne sont pas aussi associées au traitement) elles ne contribueront pas à réduire le biais, mais elles permettront de réduire la variance de l’estimation de l’effet traitement recherché et donc d’améliorer précision et puissance statistique.

Pour les petits effectifs, il est cependant conseillé de ne pas retenir les variables fortement reliées au traitement et faiblement reliées à l’outcome.

Les variables strictement associées avec le traitement (appelées « variables instrumentales » ou simplement « instruments ») ne doivent pas être introduites dans le score de propension (ce qui parait paradoxal au premier abord quand le score de propension est présenté, de façon simpliste, comme étant un modèle prédictif du traitement, cf. discussion ci-dessus).

Les collisionneurs (collider ) doivent aussi être tenus en dehors du score de propension tout comme les médiateurs (variables intermédiaires dans le chemin causale entre le traitement et l’outcome).

De ces règles découlent tout l’intérêt de la revue systématique à la recherche des facteurs pronostiques des critères de jugement (cf. section 14.2.2 ) et la réalisation des graphiques de causalités (à l’aide de DAG par exemple, cf. section 14.2.1 ) pour identifier les variables à ne pas introduire dans le score de propension (collisionneurs et variable instrumentale).

[intertitreCxSpFirst] Les variables prédictives de l’outcome DOIVENT être dans le modèle

[intertitreCxSpLast] Une variable qui n’est pas prédictive de l’outcome Ne DOIT PAS être dans le modèle même si elle est prédictive du traitement

Une fois le modèle estimé à partir des données de l’étude, il est utilisé pour calculer, pour chaque patient de l’étude, son score de propension à partir de ses valeurs des variables qui sont prises en considération par le modèle.

Le calcul du score de propension est donc une procédure à deux étapes :

  • Construire un modèle à partir des données de l’étude prédisant la probabilité de recevoir l traitement étudié en fonction des facteurs de confusion
  • Utiliser numériquement ce modèle pour calculer pour chaque patient son propre score de propension à partir de ses valeurs sur les facteurs de confusion (pris en compte dans le modèle)

Au niveau calculatoire le modèle traitement est le plus souvent établi à l’aide d’une régression logistique, mais d’autres techniques en particulier de machine learning peuvent être utilisées (cf. section 15.7).

Le modèle peut être adapté itérativement (en retirant ou rajoutant des variables) en fonction des résultats qu’ils donnent en termes d’équilibrage des facteurs de confusion entre les groupes, à la condition expresse, cependant, que cette adaptation ignore complètement les résultats produits en termes d’estimation de l’effet du traitement. Autrement, ce processus s’apparenterait au p hacking. Il est donc indispensable que cette adaptation se fasse avant toute analyse inférentielle et ne porte que sur l’équilibre des facteurs de confusion note n° 18 . Ces itérations de mises au point du modèle doivent être rapportées en toutes transparences.


[18] De manière générale plusieurs méthodes de prise en compte peuvent être essayer afin de déterminer celle qui conduit à la meilleure comparabilité des groupes après ajustement. Cela ne peut être accepté que s’il est certain qu’aucune analyse inférentielle n’a été réalisée durant ce process.