Comparaisons à un groupe contrôle externe

1 Introduction

2 TL ; DR - Guide d’évaluation des comparaisons à un groupe contrôle externe

3 Les études de comparaison externe, de quoi s’agit-il ?

4 Pour quels usages

5 Les problématiques méthodologiques soulevées par les comparaisons externes

6 Les comparaisons externes sont des études observationnelles

7 Position des agences de régulation et de HTA

8 De la nécessité d’avoir des preuves de l’intérêt cliniques des nouveaux traitements

9 Les sources de données utilisables

10 Les problématiques liées à l’aspect rétrospectif de ces études

11 Rédaction du protocole

12 Démarche hypothético déductive

13 L’inférence causale et les hypothèses sous-jacentes

14 Le biais de confusion

15 Les techniques d’analyses statistiques

16 Le diagnostic d’absence de biais de confusion résiduel

17 Les biais de sélection

18 Identifications des patients dans la source de données

19 Biais liés aux données

20 La qualité des données

20.1 Exactitudes (accuracy)

20.1.1 Généralités

20.1.2 Origine des erreurs de classification

20.2 Complétudes, exhaustivité

20.3 Informativité, pertinence (relevance )

20.3.1 Critères de jugement

20.3.2 Critères d’éligibilité (de sélection des patients de la population visée)

20.3.3 Facteurs de confusion

20.3.4 Chainage

20.4 Origine des données

20.5 La validation des données

20.6 Recommandations pour la constitution des sources de données

20.7 La rwPFS en oncologie

21 Les outils d’évaluation du risque de biais

22 L’émulation d’un essai cible

23 Le benchmarking et les contrôles positifs

24 Analyses de sensibilité , analyses quantitatives du biais

25 Calcul d’effectif

26 Contrôle du risque alpha global

27 Pertinence clinique

28 Méta-épidémiologie et étude de cas

29 Synopsis - les critères d’acceptabilité des études de comparaisons externes pour la modification des stratégies thérapeutiques

Références

30 Annexes

PDF

20.2 Complétudes, exhaustivité


La complétude des données fait référence à la proportion de données manquantes.

Les données manquantes ont la potentialité de fausser les résultats de l’étude de plusieurs manières en introduisant un biais de sélection et/ou un biais d’attrition. Les techniques utilisées pour gérer les données manquantes entrainent soit une réduction de puissance/précision soit une sous-estimation des tailles d’effet quand ces données manquantes sont remplacées de manière conservatrice.

Les données manquantes rendent inutilisable pour l’analyse des patients (à partir du moment où il y a une donnée manquante sur une des variables nécessaires à cette analyse) ce qui conduit à les remplacer/imputer à l’aide d’une méthode statistique. L’imputation des données manquantes est un sujet très technique et les méthodes disponibles reposent sur des hypothèses fondamentales difficiles à vérifier. Ainsi même après remplacement les données manquantes sont susceptibles de fausser les résultats de l’étude.

La présence de données manquantes n’est vraiment identifiable que dans les sources de données structurées comme les registres, les cohortes où elles correspondent à une valeur d’une variable dont la saisie était prévue, mais qui n’a pas été renseignée. Ces valeurs manquantes font l’objet d’un code particulier. En revanche dans les sources non structurées comme les dossiers médicaux ou les bases administratives, le concept même de données manquantes n’existe pas en tant que-t-elle, étant donné qu’il n’y a pas de liste de variable à saisir. Dans ces sources, l’absence d’une information pourtant existante comme un diagnostic, un traitement ne sera pas identifiable. Sur ces variables d’occurrence aléatoire, une information existante oubliée ou non mentionnée se traduira, in fine, par la modalité d’absence de la variable, donc par un faux négatif. Par exemple la non-mention dans le dossier médical de la survenue d’une hémorragie conduira à la notion d’absence d’hémorragie et non pas à la notion de données manquantes. Dans un recueil structuré, l’absence d’hémorragie sera renseignée quand cette absence aura été vérifiée explicitement et sera codée « données manquantes » quand cette vérification explicite n’aura pas été effectuée ou s’avère impossible à faire.

Les données manquantes sont fréquentes (voire très fréquente) dans beaucoup de sources de données type registre de maladie car la saisie des informations dans ces bases de données est un travail supplémentaire à réaliser lors des consultations ou des hospitalisations des patients sans qu’une aide spécifique soit disponible. Le data management est en général inexistant ou très limité ainsi que le monitorage. Au total, beaucoup de ces bases, attractives car étant théoriquement conçues pour faire de la recherche, s’avère inutilisable à cause des données manquantes.