Dans le cadre du programme 2 du SIRIC ILIAD, Fadoua Ben Azzouz, le Dr. Pascal Jézéquel et le Pr. Bertrand Michel, ont construit grâce à des modèles statistiques, un prédicteur du sous-type de cancer triple négatif afin d’améliorer la prise en charge thérapeutique des personnes touchées par la maladie.
Le cancer du sein. Ou n’est-ce pas les cancers du sein ? Il existe en réalité autant de cancers du sein que de patients. Néanmoins, malgré ces différences, il existe des similarités qui permettent aux médecins et chercheurs d’identifier des sous-types de cancer du sein. Parmi eux, on retrouve notamment le cancer du sein triple négatif (CSTN).
Représentant 15% des cancers du sein, le CSTN doit son nom à l’absence de 3 types de récepteurs : récepteurs hormonaux aux œstrogènes et à la progestérone, et récepteur de l’EGFR, HER2, qui, chacun, représentent des cibles thérapeutiques. Le CSTN est l’un des cancers du sein le plus agressif. En raison de sa grande hétérogénéité et de l’absence de cibles thérapeutiques, la prise en charge médicale de ces patientes doit être optimisée, ce qui implique de développer des thérapies ciblées en fonction des sous-types de CSTN et d’être capable d’identifier ces sous-types au moment du diagnostic.
Une équipe interdisciplinaire entre mathématiques et recherche de transfert en biologie médicale
C’est sur cette problématique que se sont penchés Fadoua Ben Azzouz, le Docteur Pascal Jézéquel et le Professeur Bertrand Michel. Expert en mathématiques et statistiques, Bertrand Michel est professeur à l’école Centrale de Nantes mais aussi chercheur au laboratoire de mathématique LMJL. A ses côtés, le Docteur Pascal Jézéquel, chercheur en biologie médicale au CRCINA et responsable de l’unité de bioinfomique (définition en bas de page) de l’ICO, apporte son expertise médicale et biologique. Cette équipe interdisciplinaire est complétée par Fadoua Ben Azzouz, qui en tant que biomathématicienne à l’ICO, marque le trait d’union entre les 2 disciplines.
Prédire à quel type de tumeur on a affaire …
Précédemment, les travaux de recherche du Dr Pascal Jézéquel ont permis de regrouper des CSTN qui se ressemblent dans 3 sous-types distincts, sur la base de données de transcriptomique, biologiques, immuno-histochimiques et de protéomique ; ces dernières ayant été produites par le Dr Catherine Guette de l’ICO. Au sein de chacun de ces sous-types des pistes thérapeutiques ont été mises en évidence. Le but est à présent de créer un test diagnostique simple et utilisable en routine clinique, qui permettra de prédire à quel sous-type appartiennent les tumeurs, uniquement grâce aux données du transcriptome.
Pour construire leur prédicteur, l’équipe de recherche a tiré profit de l’intelligence artificielle et a développé un modèle de machine learning optimisé. En utilisant les données de transcriptomique de 623 tumeurs de patientes, chacune associée à leur sous-type de CSTN, l’algorithme de machine learning a déterminé les 50 paramètres les plus pertinents parmi les millions disponibles pour différencier les 3 sous-types. Après cette phase « d’apprentissage », les chercheurs ont vérifié la robustesse de leur modèle en évaluant les tumeurs de 70 patientes. Sur ces 70 tumeurs, 64 étaient correctement prédites.
… pour mieux soigner les patients
Avant tout transfert de la méthode vers la clinique, il reste néanmoins des étapes à franchir pour l’équipe : adapter leur modèle à des données différentes, issues d’une technique plus récente de mesure du taux des ARN (RNAseq), mais aussi à d’autres méthodes de conservation des échantillons tumoraux (tumeurs conservées en paraffine). Après cette ultime étape, les cliniciens pourront utiliser ce modèle comme prédicteur du sous-type de CSTN et ainsi proposer des solutions thérapeutiques spécifiques à leurs patientes, pour une médecine de précision.
Lire la publication scientifique
Bioinfomique : La « bioinfomique » regroupe les domaines des biostatistiques et de la bioinformatique appliqués à l’analyse et la valorisation des données issues de criblages « omiques » (génomique, transcriptomique, protéomique, métabolique…). Il s’agit d’une activité de Data Science dédiée à l’analyse des données dites « omiques ».
Transcriptome : Ensemble des ARNs (molécules servant de matrice pour la synthèse des protéines) issus de l’expression d’une partie du génome d’un tissu cellulaire ou d’un type de cellule.
Machine learning (ou apprentissage automatique en français) : Champ d’étude de l’intelligence artificielle qui se fonde sur des approches informatiques, mathématiques et statistiques pour donner aux ordinateurs la capacité d’« apprendre » à partir de données.