MOTS-CLEFS : NGS, RNA-seq, bio-informatique, UNIX, données ‘omiques.
PRÉREQUIS : être sensibilisé à Unix - possibilité de suivre le module Initiation à UNIX et à la gestion des big data.
OBJECTIFS :
Le module RNA-seq : Analyse bioinformatique de la formation Omic Rennes vise à offrir aux participants les clés nécessaires au traitement informatique de données transcriptomiques de type RNA-seq.
PUBLIC CIBLÉ :
Ingénieurs, techniciens, chercheurs, cliniciens, post-doctorants, doctorants, stagiaires (master, …) des secteurs académique ou privé.
DATE ET LIEU :
28 et 29 janvier 2025 ; 9h00-17h30 ; pause déjeuner 13h00-14h00.
Agrocampus Ouest, 65 rue de saint Brieuc, Rennes.
PÉDAGOGIE :
La formation se veut équilibrée entre théorie et pratique. L’ensemble des travaux pratiques reposeront sur des données mRNA-seq réelles générées par HiSeq 2500. Au cours de ces journées nous ferons notamment appel aux outils FastQC, STAR, SAMtools, PicardTools, FeatureCount, Subread et RSeqQC. L’accent sera également mis sur les différents formats de fichiers générés lors du traitement de données NGS.
FORMATEUR : Pierre-François Roux.
TARIFS ET INSCRIPTION :
Cliquez ici pour connaître les tarifs et vous inscrire.
Tarifs préférentiels par rapport aux tarifs affichés selon convention (certaines Ecoles doctorales et centres INRA).
PROGRAMME :
1. Les étapes de prétraitement des données :
- qualité des données brutes,
- recherche de contamination,
- trimming des données brutes,
- alignements splicés sur génome de référence,
- prise en considération des artefacts de séquençage (multialignement, duplicats optiques).
2. Exploration des données alignées :
- qualité des alignements et des librairies,
- saturation des librairies,
- clusterisation des échantillons.
3. Visualisation (sous UCSC et IGV) :
- utilisation de la base de données Ensembl,
- préparation d’une référence annotée pour IGV.
4. Mesure de l’expression :
- comptage par gène et exon,
- comptage par transcrit.
A l’issue de ce programme et à la demande des participants, nous pourrons arborder :
- la modélisation de transcrits,
- la détection de variants sur données RNA-seq,
- les problématiques spécifiques aux données sur lesquelles ils souhaitent travailler.