#M008 Illustration de quelques aspects de l’interprétation des courbes de survie: a propos du darolutamide dans le traitement du cancer de la prostate métastatique hormonosensible

Smith MR et al. Darolutamide and Survival in Metastatic, Hormone-Sensitive Prostate Cancer. N Engl J Med 2022; 386:1132-1142 https://doi.org10.1056/NEJMoa2119115 

Pourquoi a-t-on choisi cet article ?

L’essai ARASENS publié en mars 2022 dans le NEJM donne l’occasion d’approfondir la notion de censure et leurs impacts sur l’interprétation des courbes de survie.

Ce qu’en pense la SFPT (principaux messages de l'article)

Toutes les censures n’exposent pas au même risque de biais d’attrition :

  • Les censures dues à la date de point (patients en cours de suivi à la date de point) n’introduisent pas de biais,
  • Les censures antérieures à la date de point (suivi interrompu avant la date de point alors que le patient n’a pas encore fait l’événement) sont susceptibles d’induire un biais.

Pour approfondir :

PICOS de l'étude

Patients

Cancer de la prostate métastatique hormonosensible

Intervention

Darolutamide

Control

Placebo

Outcome

Survie globale (overall survival, OS)

Study design

Essai clinique contrôlé, randomisé, multicentrique, en double aveugle

Dates clés

Les patients ont été inclus de Nov 2016 à Juin 2018.
La date de point – également appelé cutoff, date of cut-off (DCO) – de l’analyse présentée est Oct 2021. Selon le moment où les patients ont été inclus, le délai de suivi est différent :
·       Les premiers patients inclus ont été suivis jusqu’à 60 mois (Nov 2016 à Oct 2021)
·       Les derniers patients inclus ont été suivis jusqu’à 40 mois (Juin 2018 à Oct 2021)

 Résultat sur le critère principal

A la date de point (Oct 2021), la courbe de survie globale obtenue est la suivante.

 008 6

Les cercles sur les courbes représentent les temps auxquels les patients ont été censurés. Une censure signifie qu’à la date de dernière nouvelle, le patient n’a pas présenté l’évènement d'intérêt (ici le décès). La flèche orange pointe par exemple vers un patient du groupe placebo qui a été suivi ~ 16 mois après son inclusion puis son suivi a été interrompu. Le suivi de ce patient est alors non entièrement informatif pour une analyse de la mortalité. En effet, la durée entre inclusion et décès de ce patient n’est pas connue, mais il apporte quand même de l’information : sa survie après inclusion est d’au moins 16 mois.

Les censures peuvent être le résultat de 2 situations différentes :

  • Patients censurés à la date de point. L’analyse est faite à une date de point donnée ; tous les patients vivants à cette date sont donc censurés. On parle de patients censurés vivants à la date de point. Ces patients sont toujours en cours de suivi donc si l’analyse est refaite ultérieurement – actualisation des données à une nouvelle date de point – ces patients seront de nouveau informatif avec pour certains patients, la survenue d’un décès et pour d’autres, ils seront toujours vivants à la date de point et leur censure sera donc « décalée ».
  • Patients censurés à une date antérieure à la date de point. L’autre cause de censures est l’arrêt du suivi avant la date de point. Les motifs fréquents d’arrêt de suivi sont (i) patients perdus de vue ou (ii) retrait de consentement à être suivi. Pour ces patients le suivi est plus court que ce qu’il aurait du être si le patient avait été suivi jusqu’à à la date de point. Mais le point le plus problématique est que ce type de censure peut induire un biais : le biais d’attrition. En effet, les motifs d’arrêt du suivi peuvent être liés au critère de jugement pour des raisons différentes entre les 2 groupes. Par exemple un patient tolérant mal le nouveau traitement et dont l’état se dégrade peut être tenté de quitter l’essai tandis que dans le groupe contrôle, où le profil de sécurité est meilleur, la même dégradation de l’état ne conduira pas à un retrait de consentement du patient. Ainsi le décès survenant du fait de la dégradation de l’état ne sera pas enregistré dans le groupe traité tandis qu’il le sera dans le groupe contrôle, favorisant ainsi à tort le nouveau traitement.

Comme les censures survenant avant la date de point sont à risque d’introduire un biais, il serait souhaitable d’en connaitre au moins leur nombre pour écarter la possibilité qu’elles puissent à elles seules expliquer la différence de décès entre les courbes (biais d’attrition). Bien qu’il serait simple de les individualiser en utilisant deux couleurs ou deux types de symboles, cela est rarement fait (cf. figure ci-dessus).

Le flow-chart présenté en annexe documente les interruptions de traitement mais ne présente pas les interruptions de suivi, rendant impossible l’évaluation de la possibilité d’un biais d’attrition.

 008 2

Sur les courbes de survie de l’essai ARASENS,  il est cependant possible d’identifier – au moins en partie – les interruptions de suivi ; notamment parce que le suivi des patients était plus long (≥ 40 mois) que la période d’inclusion (~ 20 mois).

On distingue en effet :

  • une accumulation de censure en fin de courbe (débutant après le suivi minimal en l’absence de décès ou d’interruption de suivi : ~ 40 mois). Ce bloc de censures en fin de courbe correspond majoritairement à des censures par date de points. En effet, les premiers patients inclus et vivants à la date de point ont un suivi d’~ 60 mois ; les derniers patients inclus et vivants à la date de point ont un suivi d’~40 mois. En l’absence d’interruption de suivi, les patients vivants ont donc un suivi compris entre 40 et 60 mois.
  • quelques censures erratiques au cours des 40 premiers mois de suivi. Ces censures correspondent à des patients censurés avant la date de point puisque leur suivi est inférieur au suivi minimal – ~ 40 mois.

008 5

La présence du bloc de censure en fin de courbe entraine une grande incertitude sur l’estimation de cette partie de la courbe de survie. En effet, lors de l’actualisation du suivi à une date de point ultérieure [DCO2], ces censures sont susceptibles de produire des « marches d’escalier » dans cette zone en cas de décès rapide après la première date de point [DCO1] ou bien de rester vivant à la seconde date de point [DCO2]. Les 2 figures issues de l’étude METEOR (analyse intermédiaire ; analyse finale) ci-dessous illustrent le risque d’interpréter les fins des courbes où s’accumulent les censures. Avec les résultats de l’analyse intermédiaire (date de point : Mai 2015), on pourrait éventuellement penser que la courbe bleue passe sous la verte suggérant que les patients décèdent plus avec le cabozantinib durant cette période. Cette hypothèse est complètement invalidée lors de l’analyse finale avec un suivi actualisé (date de point : Déc 2015).

  

008 4

En revanche, ces censures de fins de courbes ne perturbent en rien la partie des courbes située avant. Si aucune censure n’est présente sur cette partie, aucun nouveau décès ne surviendra à ce niveau lors d’une extension du suivi. Cette partie des courbes restera inchangée (cf. graphique ci-dessus)

À l’opposé, les censures avant la date de point sont susceptibles d’entrainer un biais. La possibilité de ce biais peut être appréciée visuellement en imaginant ce que deviendrait la courbe du groupe traité si les cercles représentant ces censures se transformaient en marches d’escalier, en faisant l’hypothèse du biais maximum :

  • les censures du groupe traité escamotent des décès (qui surviendrait peu de temps après l’interruption du suivi)
  • les censures du groupe contrôle ne correspondent pas à des décès rapides.

Si les courbes se rejoignent, cela signifie que la différence peut très bien provenir d’un biais d’attrition et que le résultat de l’essai n’est pas robuste.

Si on se livre à cet exercice sur les courbes de l’essai ARASENS, il apparait que compte-tenu du faible nombre de censures concernées, leur remplacement par un décès n’est pas susceptible de faire converger les 2 courbes. Le résultat est donc robuste vis-à-vis des censures avant ce point qui sont survenues dans cet essai.

En pratique l’appréciation graphique est assez approximative et cette hypothèse du biais maximum (ou moyen) peut être effectuée dans une analyse de sensibilité.

Dans un prochain post nous verrons comment déduire les censures des nombres de sujets à risque si celle-ci ne sont représentées sur les courbes.

études randomisées, Biais