Les protéines de liaison à l’ARN, de la régulation des transcriptomes viraux à l’assemblage des virions

Corentin Aubé

02 octobre 2024

Thèse

Infos pratiques

14h00 - 23h00
Salle Rosalind Franklin
Professionnels de la recherche et médecins
Accès mobilité réduite

Thèse préparée sous la direction de Sarah Gallois-Montbrun, équipe Interactions hôte-virus

Résumé :

En raison de la taille restreinte de leur génome, les virus ont développé diverses stratégies pour maximiser leur diversité génétique via des mécanismes comme l'épissage alternatif (EA) ou la transcription discontinue (TD). Les protéines virales elles-mêmes peuvent avoir des fonctions multiples au cours du cycle de réplication. Parallèlement, les virus ont évolué pour détourner de nombreuses protéines cellulaires afin de soutenir leur réplication. Parmi elles, un grand nombre de protéine de liaison à l’ARN (RBP) jouent un rôle essentiel à différentes étapes du cycle. Mon projet de thèse vise à étudier certaines RBP, virales ou cellulaires, qui participent aux destins des ARN viraux pendant l'infection du VIH-1 et du SARS- CoV-2. Mon projet s'articule autour de trois axes : 1-Caractériser la diversité des génomes et transcriptomes viraux en développant un outil bioinformatique d'analyse de séquençage pleine longueur : NanoViZer, 2-Caractériser le rôle inattendu de la protéine virale Tat dans la régulation de l'EA du VIH-1 et 3-Identifier des RBP cellulaires et caractériser les mécanismes participant à l'assemblage des virions du SARS-CoV-2.

Le séquençage pleine longueur a révolutionné l'étude des transcriptomes mais les outils informatiques nécessitent des fichiers d'annotations des génomes et sont limités à l'étude de mécanismes spécifiques. Dans le cadre des virus, les fichiers d'annotations sont souvent incomplets voire manquants. Afin d'analyser l'architecture des génomes et transcriptomes viraux, sans à priori sur les mécanismes impliqués, nous avons développé NanoViZer, un outil rapide et simple d'utilisation qui ne nécessite aucun fichier d'annotation. Après avoir codé l'algorithme, j'ai validé cet outil sur des données issues de la littérature pour analyser le transcriptome du VIH-1, du VHS-1 et du SARS-CoV-2. Grâce à cet outil, j'ai révélé la présence de délétions dans les génomes du virus de l'hépatite D dans le sang circulant de patients.

Dans la seconde partie de ma thèse, j'ai exploré un rôle nouveau de la protéine Tat du VIH-1 dans la régulation de l'EA. Lors de sa réplication, le VIH-1 génère plus de 50 ARNm par l'EA d'un ARN pre-messager unique. L’expression de ces ARNm viraux est finement régulée et un déséquilibre de leur niveau d’expression impacte la production de virions. Trois études suggéraient un rôle de Tat dans l'EA mais son effet et les mécanismes impliqués étaient controversés. Grâce à un modèle viral dans lequel la transactivation de la transcription du VIH-1 est indépendante de Tat (VIH-VP16) et en tirant profit du séquençage pleine longueur et de NanoViZer, nous avons mis en évidence que Tat déstabilise l'ensemble du programme d'EA viral et favorise en particulier la production des ARNm de Tat, et par là l'expression de sa propre protéine. En explorant l'activité de plusieurs mutants de Tat, nous avons ensuite montré que l'activité de Tat dans l'EA est découplée de son activité transcriptionelle. Enfin, l'analyse de la réplication de ces différents mutants suggère que le rôle de Tat dans l'EA favorise la réplication du virus, indépendamment de son rôle transcriptionnel.

Enfin, en pleine période de pandémie COVID-19, je me suis intéressé aux RBP impliquées dans les étapes tardives de réplication du SARS-CoV-2. Pour cela, des virions de SARS-CoV-2 ont été isolés à partir de deux lignées cellulaires pulmonaires infectées et analysés en spectrométrie de masse. Par analyses informatiques, j'ai déterminé 92 protéines cellulaires associées aux virions, dont de nombreuses RBP. En particulier, 27 protéines sont retrouvées dans des structures cytoplasmiques appelées granules de stress. De façon intéressante, les protéines G3BPs, protéines core des granules de stress, étaient particulièrement enrichies. En invalidant leur expression, nous avons révélé que les G3BPs interagissent avec la nucléoprotéine virale N et l'ARN du SARS-CoV-2, favorisent l'assemblage des virions du SARS- CoV-2 dans la cellule et la production de particules virales infectieuses.

Dans l’ensemble, mes travaux ont permis de développer un outil informatique, NanoViZer, permettant l’analyse sans a priori des délétions dans les génomes et transcriptomes viraux par séquençage pleine longueur. J’ai également montré des rôles nouveaux de protéines de liaison à l’ARN sur la réplication des virus. La protéine virale Tat du VIH-1 qui régule l’EA des ARN viraux et les protéines cellulaires G3BP qui favorisent l’assemblage des particules virales du SARS-CoV-2.

Mots clefs : VIH-1, SARS-CoV-2, NanoViZer, RBP, Séquençage pleine longueur, transcriptomique, protéomique, Protéine Tat, Protéine G3BP, bioinformatique