Comparaisons à un groupe contrôle externe

1 Introduction

2 TL ; DR - Guide d’évaluation des comparaisons à un groupe contrôle externe

2.1 Validité méthodologique et épistémique

2.2 Biais de confusion

2.3 Biais de sélection

2.4 Autres biais

2.5 Autres points : assurance qualité, multiplicité des comparaisons, pertinence clinique

3 Les études de comparaison externe, de quoi s’agit-il ?

4 Pour quels usages

5 Les problématiques méthodologiques soulevées par les comparaisons externes

6 Les comparaisons externes sont des études observationnelles

7 Position des agences de régulation et de HTA

8 De la nécessité d’avoir des preuves de l’intérêt cliniques des nouveaux traitements

9 Les sources de données utilisables

10 Les problématiques liées à l’aspect rétrospectif de ces études

11 Rédaction du protocole

12 Démarche hypothético déductive

13 L’inférence causale et les hypothèses sous-jacentes

14 Le biais de confusion

15 Les techniques d’analyses statistiques

16 Le diagnostic d’absence de biais de confusion résiduel

17 Les biais de sélection

18 Identifications des patients dans la source de données

19 Biais liés aux données

20 La qualité des données

21 Les outils d’évaluation du risque de biais

22 L’émulation d’un essai cible

23 Le benchmarking et les contrôles positifs

24 Analyses de sensibilité , analyses quantitatives du biais

25 Calcul d’effectif

26 Contrôle du risque alpha global

27 Pertinence clinique

28 Méta-épidémiologie et étude de cas

29 Synopsis - les critères d’acceptabilité des études de comparaisons externes pour la modification des stratégies thérapeutiques

Références

30 Annexes

PDF

2.4 Autres biais

Une erreur de classification des expositions (traitement) est-elle exclue ?

Ce type d’erreur est exclu dans le groupe traité (étude monobras expérimentale ou RCT), sauf cas exceptionnel de défaut de réalisation non détecté par le système d’assurance de qualité et les audits de ces études. Ce questionnement est cependant pleinement légitime pour le groupe contrôle externe, car cette erreur de classification peut affecter les sources de données de vraie vie, en particulier lorsqu’il s’agit de traitement pouvant être administré hors dispensation (vaccins, OTC, etc.) ou quand la dispensation peut ne pas être destinée au porteur de l’ordonnance.

Pour un groupe contrôle se voulant être traité avec un certain traitement de référence, ces erreurs consistent soit 1) à la présence de patient non traité (augmentant la fréquence apparente des événements, favorisant la conclusion à la supériorité du nouveau traitement), soit 2) à la présence de patients traités avec un autre traitement actif que le contrôle voulu, conduisant à un biais dans un sens ou l’autre en fonction de l’efficacité relative des traitements effectivement reçus par rapport au traitement attendu.

Pour un groupe contrôle voulu non traité, ces erreurs peuvent conduire à la présence de patients en réalité traités, ce qui conduit à une sous-estimation de la fréquence des événements de ce groupe pouvant conduire à une étude de supériorité négative à tort.

Une erreur de classification des critères de jugement est-elle exclue dans le groupe contrôle ? Si une erreur est possible est-elle aussi présente de façon similaire dans le groupe traité ?

Dans le groupe contrôle expérimental (monobras ou RCT), tout a été mis en œuvre pour assurer l’exactitude des données (data management, procédures opératoires standards, bonnes pratiques cliniques, monitorage sur site, ARC, etc.). Toute erreur dans le groupe contrôle devient donc une erreur asymétrique susceptible d’entrainer un biais (cf. section 19.1.1) qui sera problématique si cette erreur augmente le nombre d’événements dans le groupe contrôle (faux positif, définition des événements plus large que dans le groupe traité, etc.).

La définition des événements n’est pas sur large que celle utilisée pour le groupe traité ? En cas de données issues d’une base administrative, les algorithmes phénotypiques utilisés couvrent-ils la même définition des critères de jugement que dans le groupe traité ?

Si le résultat est en faveur d’une absence de différence, le raisonnement s’inverse : la définition des événements dans le bras de contrôle n’est pas plus restrictive que celle utilisée dans le bras traité ? Peut-on exclure une détection du critère de jugement dans le groupe contrôle propice aux faux négatifs ?

Existe-t-il des données manquantes sur les critères de jugement ?

Les données manquantes au niveau des critères de jugement sont susceptibles d’induire un biais d’attrition (forme spéciale du biais de sélection). Il est donc important d’avoir une documentation de leur fréquence, de leur répartition entre les deux groupes (elles peuvent aussi survenir dans le groupe traité expérimental).

Les données manquantes au niveau des critères de jugement ont-elles été remplacées de manière conservatrice ?

Compte tenu du biais potentiel qu’elles peuvent induire, les données manquantes des critères de jugement doivent être remplacées par une méthode conservatrice à même de produire un résultat robuste vis-à-vis d ce biais (méthode du biais maximum par exemple). Les méthodes d’imputation basées sur l’hypothèse MAR (missing at random , les données manquantes le sont uniquement par hasard) comme les méthodes d’imputation multiple n’effectuent pas un remplacement conservateur.

Existe-t-il des données manquantes sur les covariables ? Ont-elles été imputées de manière satisfaisante ?

Contrairement à l’essai randomisé, les covariables (comme les facteurs de confusion, les contrôles externes, etc.) jouent un rôle primordial dans les comparaisons externes. Les données manquantes à leur niveau sont susceptibles d’induire un biais sur les estimations des effets traitements.

Une imputation basée sur l’hypothèse MAR (missing at random ) peut être acceptable si cette hypothèse est plausible.

Une différence de traitements concomitants entre les deux groupes est exclue ?

Les patients ont pu bénéficier de la même manière dans les deux groupes des traitements concomitants, des traitements de secours ou des traitements ultérieurs durant toute la période de suivi de l’étude de comparaisons externe ?

Des analyses de sensibilités ont-elles étaient réalisées ? Pour évaluer quel type de robustesse ?

Les analyses de sensibilité réalisée remplissaient-elles leur objectif (cf. section 24.1) ? Les résultats des analyses de sensibilité confirment-ils la robustesse des résultats ?