MOTS-CLEFS : Epigenome, ChIP-seq, bio-informatique, statistique, UNIX, R, données ‘omiques.
PRÉREQUIS : être sensibilisé à Unix et R - possibilité de suivre les modules Initiation à UNIX et à la gestion des big data et Initiation à R.
OBJECTIFS :
Le module ChIP-seq de la formation Omic Rennes vise à offrir aux participants les clés nécessaires au traitement informatique et statistique de données épigénomiques basées sur l’immunorpécipitation de la chromatine comme le ChIP-seq (facteurs de transcription et modifications d’histone) et les technologies dérivées (iChIp-seq, ChIP-exo, RIP-seq, MeDIP-seq, HITS-CLIP) ainsi qu’aux données épigénomiques aux propriétés similaires (ATAC-seq, DNase-seq, FAIRE-seq, MNase-seq).
PUBLIC CIBLÉ :
Ingénieurs, techniciens, chercheurs, cliniciens, post-doctorants, doctorants, stagiaires (master, …) des secteurs académique ou privé.
DATE ET LIEU :
30 et 31 janvier 2025 ; 9h00-17h30 ; pause déjeuner 13h00-14h00.
Agrocampus Ouest, 65 rue de saint Brieuc, Rennes.
PÉDAGOGIE :
La formation se veut équilibrée entre théorie et pratique, la pratique se faisant via l’analyse de jeu de données réel.L’ensemble des travaux pratiques reposent sur des données générées dans le cadre du projet ENCODE. Au cours de ces journées nous ferons notamment appel aux outils FastQMCF, FastQScreen, BowTie, SAMtools, HOMER, MACS2, deepTools et DiffBind. L’accent sera également mis sur les différents formats de fichiers générés lors du traitement de données NGS.
FORMATEUR : Pierre-François Roux.
TARIFS ET INSCRIPTION :
Cliquez ici pour connaître les tarifs et vous inscrire.
Tarifs préférentiels par rapport aux tarifs affichés selon convention (certaines Ecoles doctorales et centres INRA).
PROGRAMME :
1. Les étapes de prétraitement des données :
- qualité des données brutes,
- recherche de contamination,
- alignements sur génome de référence,
- prise en considération des artefacts de séquençage (multialignement, duplicats optiques, régions blacklistées).
2. Exploration des données alignées :
- efficacité de l’immunoprécipitation / qualité de la librairie,
- saturation des librairies,
- clusterisation des échantillons.
3. Détection des pics d’enrichissement :
- estimation de la taille des fragments,
- peak calling,
- integration de réplicats biologiqes par Irreproducible Discovery Rate.
4. Visualisation (sous UCSC et IGV) :
- utilisation de la base de données Ensembl,
- préparation d’une référence annotée pour IGV.
5. L’exploration fonctionnelle :
- profil d’enrichissement autour des TSS,
- clusterisation par k-means.
A l’issue de ce programme et à la demande des participants, nous pourrons arborder :
- l’analyse différentielle de données épigénomiques,
- les modalités de visualisations des données épigénomique pour publication / valorisation,
- la recherche de motifs,
- les problématiques spécifiques aux données sur lesquelles ils souhaitent travailler.