2 TL ; DR - Guide d’évaluation des comparaisons à un groupe contrôle externe
3 Les études de comparaison externe, de quoi s’agit-il ?
5 Les problématiques méthodologiques soulevées par les comparaisons externes
6 Les comparaisons externes sont des études observationnelles
7 Position des agences de régulation et de HTA
8 De la nécessité d’avoir des preuves de l’intérêt cliniques des nouveaux traitements
9 Les sources de données utilisables
§ Avantages inconvénients des différentes sources de données secondaires
9.2 Groupe contrôle externe prospectif
9.4 « Données de la baseline »
9.5 Recherche et qualification de la source de données
10 Les problématiques liées à l’aspect rétrospectif de ces études
12 Démarche hypothético déductive
13 L’inférence causale et les hypothèses sous-jacentes
15 Les techniques d’analyses statistiques
16 Le diagnostic d’absence de biais de confusion résiduel
18 Identifications des patients dans la source de données
21 Les outils d’évaluation du risque de biais
22 L’émulation d’un essai cible
23 Le benchmarking et les contrôles positifs
24 Analyses de sensibilité , analyses quantitatives du biais
26 Contrôle du risque alpha global
Chacune des différentes sources de données historiques possibles présente des avantages et des inconvénients.
Les données d’une étude clinique expérimentale précédente (essais randomisés, étude monobras) représentent la meilleure option sur plusieurs plans. Elles peuvent fournir des données sous placebo si celui-ci a été utilisé dans un essai précédent (par exemple pour valider la première génération de traitement de la pathologie), contrairement à toutes les autres sources. La qualité des données est optimale, car enregistrées avec un monitorage des centres et un data management. Les variables sont aussi parfaitement bien définies et recueillies directement par les investigateurs (à comparer par exemple avec les proxys ou les algorithmes phénotypiques qu’il est nécessaire d’utiliser avec les bases de données administratives). Pour une question en oncologie portant sur une tumeur solide, ce sont les seules données qui peuvent documenter les critères de jugement de réponse tumorale (critères RECIST) et de survie sans progression (PFS), ces deux critères étant complètement inaccessibles avec les données recueillies en routine (cf. section 20.7). Par contre, l’accès à ces données est difficile, car appartenant au promoteur de l’étude qui commercialise le traitement standard que le nouveau traitement concurrencera. Cette problématique est plus facile à résoudre s’il s’agit de données issues d’un essai académique précédent. Afin de faciliter l’accès à des données de ce types, plusieurs initiatives académiques ou privées se mettent en place pour regrouper des données d’études précédentes dans des entrepôts (cf. section Erreur ! Source du renvoi introuvable. ). Ces données sont aussi souvent limitées sur le plan des covariables (facteurs pronostiques des critères de jugement) et des contrôles négatifs.
Par rapport aux autres sources, les bases de données administratives n’ont pas été initialement conçues dans un but de recherche clinique, mais pour administrer le paiement des institutions et des acteurs de santé. Leur logique et leur finalité sont comptable et non scientifique. Elles ne contiennent pas directement des informations cliniques, biologiques ou d’imagerie, mais seulement des codages suivant une certaine nomenclature des diagnostics, des motifs d’hospitalisation, des actes et des traitements dispensés. Leur remplissage peut aussi être réalisé, non pas dans une logique d’exactitude scientifique, mais d’optimisation financière.
Les informations cliniques nécessaires pour les études nécessitent d’être reconstruites à partir des codages à l’aide d’algorithme phénotypique. Suivant la nature de la source de données, l’information sur les événements cliniques peut être directement présente ou nécessité un travail de reconstruction. C’est le rôle des algorithmes phénotypiques dans les bases administratives qui font cette reconstruction à partir des codages et d’autres informations. Ces algorithmes phénotypiques sont des règles structurées utilisant les données disponibles dans les données de vraie vie (RWD) pour identifier des patients avec une condition clinique, exposition ou événement spécifique.
Parfois il est nécessaire de recourir, à la place de l’entité clinique souhaitée qui est non identifiable en raison des codages utilisés, à un concept lié, appelé proxy, qui lui est accessible.
Ces éléments interrogent souvent sur l’exactitude des données qui peuvent être extraites de ces bases administratives et il est indispensable de les valider par des études spécifiques (cf. section 20.4).
Les autres sources de données sont davantage susceptibles de contenir les données cliniques nécessaires à la réalisation de l’étude de comparaison externe, mais il peut aussi subsister des problématiques de qualités des données en termes d’exactitude et surtout de complétude, la saisie des informations dans les registres se faisant souvent en sus de l’activité clinique des centres participants.
L’utilisation des dossiers médicaux nécessite un travail important d’extraction des informations nécessaires à l’étude. Ce travail peut être supprimé ou réduit par l’utilisation de techniques de traitement naturel du langage, en particulier par IA, mais débouche sur la question de la fiabilité des informations extraites. Se pose aussi la question de données manquantes indétectable.
Les questions de la qualité des données et des problématiques méthodologiques induites sont discutées en détail dans la section suivante (section 9.5).
Au-delà de ces aspects méthodologiques, l’exploitation des données secondaires est une nouvelle discipline qui couvre des aspects très variés, légaux, règlementaires, techniques, informatiques qui ne sont pas abordées dans ce document. De même les développements informatiques très prometteurs d’extraction par traitement automatisé du langage (IA) ne sont abordés.
Les sources de données type registre et cohorte présentent l’avantage d’avoir été connue et mise en place avec un objectif recherche. Elles sont bien plus riches en données médicales, biologiques, d’imagerie que les bases administratives. Une de leur limite réside dans la qualité des données, en particulier des taux importants de données manquantes. Leur utilisation comme groupe contrôle externe peut aussi être compromise du fait des publications qu’elles génèrent pour leur propre compte. En effet, la finalité de ces recueils d’information est de produire des publications indépendamment de leur éventuelle utilisation pour des groupes contrôles externes. Cependant ces publications peuvent révélées les résultats du groupe contrôle externe. En raison du HARKing qui en découle (cf. sections 10 et 10.1), ces sources peuvent ne pas être utilisables quand il s’agit de chercher un groupe contrôle externe pour un groupe traité dont on connait déjà les résultats (choix post hoc d’un groupe contrôle externe pour une étude monobras déjà terminée par exemple). L’exemple de la section 10 illustre le côté rédhibitoire que peut prendre cette problématique.