Code APOGEE | Intitulé | ECTS | CM | TD | TP | 1ère Session | 2ème Session | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
CC | Examen | Dérogatoire | Examen | ||||||||||||||
Ecrit | Oral | TP | Ecrit | Oral | TP | Ecrit | Oral | TP | Ecrit | Oral | TP | ||||||
BSAEDAM0 | Data mining | 3.0 | 15 | 6 | 9 | 70% | 30% | 70% | 30% | 70% | 30% |
Dans le cadre de données Omics, on parle souvent d'un triptyque : 1) acquisition des données via les plateformes, 2) traitement algorithmique/bioinformatique des données 3) analyse des données. Cette vision occulte un point fondamental : la gestion des données. C'est une étape clé entre le point 1) et 2). Cette étape est aussi fondamentale dans le cas d'analyses croisées entre plusieurs jeux de données (entre 1) et 3)). Il est donc indispensable que des étudiants au contact des données massives générées par la -omics, avant toute analyse, soient capables : 1) de gérer les grands volumes de données produites : cela va du "simple" déplacement, organisation, archivage, compression des données brutes produites, jusqu'a l'extraction d'informations au sein de ces données omiques pour juger de leur qualité par exemple, 2) d'explorer ces grands volumes de données : cela va de l'extraction d'information au sein de ces données, y compris des données produites par d'autres sources (par exemple les banques de données publiques) pour préparer les analyses en aval jusqu'au croisement de différents types de données hétérogènes. L'expérience montre que cette "zone de compétence" est très fortement négligée et qu'elle devient vite limitante quand le volume de données augmente. La compétence de gestion de données massives reste rare et doit être développée auprès des publiques destinés à la Omique.
Le cours permettra de maîtriser certaines notions : format de fichier, autonomie informatique, organisation informatique, outils de gestion et d'exploration des données, notions de bioinformatique et de bioanalyse. L'acquisition de ces compétences passe par une approche pragrmatique impliquant une proportion importante de TP sur informatique et sur des grands jeux de données. Une telle compétence assure alors que les étudiants développent une autonomie quant aux logiciels d'acquisition de données installés sur les plateformes et leur permettent ainsi de pouvoir développer/proposer leurs propres analyses.
TO-DO
Problem/Data-driven.
Maquette 2019/2020 - Les informations portées sur ces pages sont non-contractuelles et n'engagent en rien la responsabilité de la faculté des sciences et technologies de l'UPEC.
Site en construction