Analyse en intention de traiter ou en per protocole
D. KOENIG et M.-D. DRICI, CHU de Nice
Cet article garde en filigrane la différence entre les « essais de supériorité » classiques et les essais de « non infériorité », de plus en plus nombreux ! Si un essai concluant à la supériorité d’un traitement sur l’autre inclut sa non-infériorité, le contraire n’est pas vrai. Ainsi, deux traitements non statistiquement différents de manière significative, ne sont pas forcément identiques.
Comme la supériorité d’un médicament envers un autre médicament de même classe est très difficile à prouver, on va essayer d’en déterminer sa non-infériorité. Il est ainsi devenu habituel au cours du développement de nombreux médicaments, que les industriels utilisent des essais de « non-infériorité » qui sont ensuite souvent publiés comme evidence-based medicine.
Si ces problèmes de méthodologie sont affaire de spécialistes, il est essentiel pour le médecin qui est confronté à la présentation des résultats par la visite médicale de comprendre ces différences.
L'hypothèse de ces essais est un peu particulière ainsi que leur méthodologie : il faut que la référence ait été préalablement évaluée contre un placebo, afin d’obtenir une certaine « réserve d’efficacité », que le nouveau traitement comparé soit compris dans cette « réserve », mesuré par un critère de jugement robuste. Pour minimiser les chances de faire des erreurs d’appréciation, on réalise l’analyse en « per protocole » : c’est-à-dire que seuls les patients qui ont correctement suivi le protocole et donc le traitement, sont gardés dans l’analyse statistique finale. Cela contraste avec les essais de supériorité (pour évaluer par exemple un nouveau médicament contre un placebo) où l’analyse en intention de traiter est la règle et où la totalité des patients randomisés est analysée, qu’ils aient pris correctement leur traitement ou aucun comprimé ! Définition des populations d’analyse en « intention de traiter » ou en « per protocole » ? L’essai prospectif contrôlé et randomisé constitue la méthode de référence pour démontrer l’efficacité d’un traitement. La randomisation, qui permet la comparabilité initiale des groupes, est nécessaire pour que les effets observés soient attribuables au traitement testé et non à d’autres caractéristiques. Ainsi, un traitement inefficace conduira à un nombre comparable d’événements dans les deux groupes comparés et une différence quelconque dans la survenue d’événements pourra être attribuée au traitement testé [1]. La durée d’un essai clinique peut être très variable et, durant son déroulement, les patients inclus ne vont pas tous parfaitement adhérer au protocole : certains vont arrêter, d’autres ne vont pas prendre la dose prévue, tandis que des étourdis vont consommer des médicaments interdits par le protocole. La question qui se pose est alors la suivante : doit-on exclure de l’analyse statistique les patients qui n’ont pas respecté le protocole de l’étude ? À cette question correspondent deux grandes approches concernant la population d’analyse d’une étude : l’analyse « per protocol » (PP) et l’analyse en « intention de traiter » (ITT). L’analyse en « intention de traiter » consiste à inclure dans l’analyse tous les sujets initialement randomisés, qui restent dans leur groupe quelle que soit la suite des événements (changement de traitement, arrêt, voire changement de groupe). C’est analyzed as randomised, les sujets sont analysés tels qu’ils ont été randomisés. Cette méthode d’analyse s’oppose à l’analyse dite en « per protocole » qui consiste à analyser uniquement les patients ayant scrupuleusement respecté le protocole de l’essai clinique. Analyse en intention de traiter Méthode à privilégier pour tout essai contrôlé randomisé ayant pour objectif de démontrer l’efficacité d’un traitement (« essai d’efficacité ») car cette approche permet de fournir des résultats non biaisés et représentatifs [2]. En ITT, tous les patients randomisés sont analysés, qu’ils aient respecté le protocole ou non (par exemple un patient décide d’arrêter après le premier comprimé d’un traitement antihypertenseur de 6 mois : il est analysé au même titre que les autres). L’exclusion de certains sujets compromet la comparabilité des groupes car elle survient après le début du traitement et donc de la randomisation. Cela peut avoir un impact sur l’interprétation des données si l’exclusion est liée à l’inefficacité (antalgique par exemple) ou à la tolérance du traitement (son goût, ses effets indésirables, etc.) car cette exclusion n’est alors pas indépendante du traitement reçu ! Cette approche reflète aussi au mieux les conditions réelles d’utilisation du traitement puisque, dans la « vraie vie », tous les patients ne respecteront pas les conditions idéales de l’essai clinique. Enfin, en ITT, les déviations et changements de traitement vont en principe survenir de manière semblable dans les deux groupes et donc sous-estimer l’effet réel du traitement testé et diminuer le risque de première espèce α. Cette approche est donc très « conservatrice » dans le cas d’un essai d’efficacité ou de supériorité. Ces trois raisons (respect de la randomisation, meilleur reflet des conditions réelles d’utilisation et approche conservatrice) font que l’analyse en ITT est impérative pour les essais de supériorité (« essai d’efficacité »). Analyse per protocole Cette méthode consiste à ne conserver que les patients ayant parfaitement suivi le protocole de l’étude. Les personnes qui ont arrêté ou changé de traitement sont exclus de l’analyse ainsi que les écarts au protocole (on ne garde donc que les « bien traités » dans chaque groupe). L’analyse en PP peut sembler intéressante de prime abord : en effet, ce qui est intéressant, c’est d’évaluer les effets du traitement chez les personnes qui ont réellement pris le traitement attribué lors de la randomisation, à la posologie attribuée. Les autres patients risquent de « parasiter » les résultats. Toutefois, l’effet du traitement est alors évalué dans un contexte théorique et idéal qui n’est pas réellement le reflet de ce qu’il se passe dans la « vie réelle ». Cette approche augmente le contraste entre les deux groupes comparés (sans prendre en compte le fait que les patients qui adhèrent rigoureusement au protocole ont empiriquement tendance à aller mieux que ceux qui s’écartent du protocole de l’essai clinique). L’effectif analysé est réduit par rapport à l’effectif randomisé (on parle alors « d’attrition de la cohorte ») [2]. L’exclusion des patients peut introduire un biais et augmenter le risque de première espèce (conclure à une différence qui n’existe pas). Cette approche n’est donc pas adaptée à un essai d’efficacité puisqu’elle est peu conservatrice : dans ce type d’essai, on souhaite se mettre dans les pires conditions pour pouvoir sous-entendre, en cas de supériorité d’un traitement sur l’autre, que c’est « malgré les conditions d’ITT ». Si l’analyse en ITT représente le mieux « la vraie vie » pour évaluer la supériorité d’un traitement sur l’autre, dans un essai d’équivalence ou de non-infériorité, qui a pour objectif de démontrer que deux traitements ont une efficacité similaire ou qu’un traitement n’est pas inférieur à un autre, l’approche en PP est la plus conservatrice et est donc à privilégier. L’analyse per protocole est à privilégier pour les essais d’équivalence et de non-infériorité car elle permet, alors qu’elle augmente les contrastes entre les traitements, de conclure, s’il n’y en a pas (traitement non inférieur au comparateur) que c’est « malgré le fait d’avoir analysé per protocole ». Mais il est nécessaire de bien documenter les motifs d’arrêt ou de changement de traitement, les effets indésirables, les retraits d’étude, les changements de groupe, etc. afin de justifier le choix de cette méthode d’analyse. Les essais d’équivalence et de non-infériorité La majorité des essais cliniques a pour objectif de montrer qu’un traitement est meilleur qu’une autre (essais dits de « supériorité ou d’efficacité »). Toutefois, dans de nombreuses pathologies, il existe des traitements « de référence » dont l’efficacité est scientifiquement prouvée et qui figurent généralement dans les référentiels. Lorsqu’un traitement de référence performant existe, les bénéfices attendus d’un nouveau médicament (qui est souvent un me-too, c’est-à-dire un composé de classe semblable qui diffère par des propriétés pharmacologiques minimes) sont le plus souvent réduits, voire nuls, et la démonstration statistique de la supériorité est alors difficile à démontrer (le nombre de sujets nécessaires est très important puisque la différence d’efficacité à mettre en évidence est minime). Il faut alors démontrer que le nouveau traitement est au moins aussi efficace que le traitement de référence (« essai d’équivalence ») ou au moins que ce nouveau traitement n’est pas inférieur au traitement de référence (« essai de non-infériorité »). En général, l’intérêt du nouveau est fondé sur une meilleure tolérance, une voie d’administration plus commode, un traitement moins invasif, un coût plus faible, etc. avec une efficacité comparable à celle du traitement de référence (un nouvel ARA2 dans l’hypertension artérielle, un nouvel antidiabétique, etc.). Les essais d’équivalence et de non-infériorité nécessitent des précautions méthodologiques qui diffèrent de celles des essais de supériorité. La nécessité de ce type d’étude est réelle, comme illustré par le développement d’une extension du guideline CONSORT en 2006, spécialement dédiée aux essais d’équivalence et non-infériorité, même si ce design reste encore assez peu utilisé (en 2005, Pubmed identifiait seulement 1,6 % des essais cliniques dans le cancer comme essais d’équivalence ou de non-infériorité) [3]. La stagnation des pipelines amène les industriels à utiliser de plus en plus ce type d’approche pour comparer à l’existant ses « copies conformes ». Aspects méthodologiques La méthodologie d’un essai de non-infériorité doit être irréprochable, bien plus que pour les essais de supériorité tant les enjeux sont importants. En effet, tout écart au protocole ou des erreurs méthodologiques conduisent à réduire artificiellement l’écart entre les deux groupes et donc à conclure à tort à une équivalence entre les deux traitements. Un des points méthodologiques primordiaux est le choix du traitement de référence : ce traitement doit non seulement avoir démontré son efficacité contre placebo dans les études précédentes, mais aussi toute son efficacité dans l’essai de non-infériorité réalisé. Pour vérifier cela, on parle de validité interne et externe de l’étude de non-infériorité. La validité interne est difficile à mettre en œuvre éthiquement (troisième groupe contrôle placebo) puisqu’il existe déjà un traitement de référence efficace. Toutefois, ce design « 3 bras » placebo-référence-nouveau traitement reste la référence [4]. La notion de validité interne renvoie également à un principe important : la sensibilité de l’étude (assay sensitivity
Attention, pour des raisons réglementaires ce site est réservé aux professionnels de santé.