Thèse réalisée sous la direction de Julie Cocquet équipe Des gamètes à la naissance : génomique, épigénétique et physiopathologie de la reproduction
Résumé
La spermatogenèse est le processus de différenciation des cellules germinales mâles en spermatozoïdes. Elle est divisée en trois phases – la prolifération des spermatogonies, la méiose et la spermiogenèse – associées à une très grande dynamique transcriptionnelle et chromatinienne. Les études de transcriptomiques (RNA-seq) et épigénomiques (ChIP-seq) de ces processus ont permis de mettre en évidence un enrichissement de la diméthylation de la lysine 79 de l’histone H3 (marque épigénétique appelée H3K79me2) et une forte expression de sa seule méthyltransférase DOT1L aux stades méiotiques et post-méiotiques. Notre équipe a récemment produit un modèle de souris knock-out (KO) de Dot1l dans les cellules germinales mâles et montré qu’il entraîne une hypofertilité masculine, caractérisée par des malformations des spermatozoïdes ainsi que des défauts de compaction de la chromatine. L’objectif de ma thèse a été de caractériser, par des analyses bioinformatiques, le rôle moléculaire de DOT1L et de corréler la dynamique de la marque H3K79me2 avec les changements transcriptionnels et le remodelage chromatinien au cours de la spermatogenèse. Pour cela, j’ai analysé des données de ChIP-seq, RNA-seq et ATAC-seq, produites par l’équipe et issues de la littérature. Pour caractériser la dynamique de H3K79me2 au cours de la spermatogenèse, j’ai analysé des données de ChIP-seq dans 4 stades de développement des cellules germinales mâles (des spermatogonies indifférenciées aux spermatides post-méiotiques et allongées). Un pipeline d’analyse a été développé en intégrant les outils bowtie2 pour l’alignement, MACS2 pour l’enrichissement de la marque suivi de sa caractérisation par ChIPseeker et ChromHMM. ChromHMM permet de prédire les états chromatiniens des cellules germinales mâles à partir de données provenant de 6 marques d’histones différentes. Cette approche m’a conduit à développer un package R (ChromENVEE) permettant d’associer les gènes à leur région régulatrice à distance (enhancer) la plus probable. Mes analyses montrent que H3K79me2 est corrélée positivement avec la transcription, et enrichie au niveau du promoteur et du corps du gène, mais aussi au niveau des enhancers. J’ai également trouvé que H3K79me2 est impliquée dans la régulation des gènes portés par les chromosomes sexuels lors de la transition de la méiose vers les spermatides. Parallèlement, j’ai étudié l’impact du KO-Dot1l sur la transcription à différents stades de la spermatogenèse par des analyses de RNA-seq. J’ai développé un pipeline d’analyses en utilisant l’outil STAR pour l’alignement suivi par des analyses d’expression différentielle utilisant DESeq2 et edgeR. Ces analyses ont également été réalisées en utilisant une normalisation externe par « spike-in », c’est-à- dire via des séquences exogènes ajoutées aux échantillons dans une concentration connue. En intégrant nos données de RNA-seq et de ChIP-seq, nous avons montré que le KO-Dot1l conduit à la dérégulation de centaines de gènes. Nous avons trouvé que la majorité des gènes sous-exprimés dans les cellules KO correspondent à des gènes cibles « directs », c’est-à-dire enrichis en H3K79me2 au niveau du corps du gène et/ou de l’enhancer. Contre-intuitivement, nous avons trouvé beaucoup plus de gènes sur- exprimés que sous-exprimés dans les cellules KO. Ce phénomène semble indépendant de H3K79me2, et ces gènes sont principalement situés dans des états chromatiniens caractérisés par des marques bivalentes et répressives, en particulier la marque répressive H3K27me3. En conclusion, nos résultats montrent que DOT1L et H3K79me2 sont indispensables à la régulation des gènes sur l’ensemble de la spermatogenèse. En plus de son rôle d’activateur, ces résultats présentent également un nouveau rôle de répresseur de la transcription pour DOT1L en fonction de l’environnement chromatinien.
Mots clés : RNA-seq, ChIP-seq, spermatogenèse, H3K79me2, DOT1L, états chromatiniens