Skip to content

Latest commit

 

History

History
94 lines (57 loc) · 6.87 KB

sdd2_plan_cours_2021-2022.md

File metadata and controls

94 lines (57 loc) · 6.87 KB

Plan de cours : Science des données II : analyse et modélisation

année académique 2021-2022

Enseignants

Enseignant : Philippe Grosjean, philippe.grosjean@umons.ac.be Assistant : Guyliann Engels, guyliann.engels@umons.ac.be Assistant pédagogique : Maxime Bodson, maxime.bodson@umons.ac.be

Présentation du cours

La science des données s'intéresse à l'analyse des données sous toutes ses formes. Cette discipline requiert des compétences en informatiques, en mathématiques et dans le domaine d'expertise. La Science fait actuellement face à de nombreux changements suite à l'introduction de l'Open Science, de l'Open Data, de l'augmentation exponentielle des données, ... Les biologistes doivent être capables d'évoluer dans ce contexte grâce à une bonne connaissance de la science des données biologiques.

Ce second cours s'inscrit dans une formation continue sur trois années successives. À la fin de ce second cours, les étudiants seront capables de modéliser, de produire des analyses multivariées et de présenter clairement leurs résultats de manière reproductible avec des outils informatiques et statistiques professionnels.

La fiche ECTS reprend toutes les informations essentielles : http://applications.umons.ac.be/web/fr/pde/2021-2022/ue/US-B3-SCBIOL-006-M.htm

Organisation

Le cours de Science des données II : analyse et modélisation (UE) est une unité d'enseignement de 3 crédits est divisée en deux activités d'apprentissages (AA) : Science des données II : modélisation (Q1) et Science des données II : analyse (Q2). Ce cours comprend 8 modules. Chaque module représente une charge moyenne de travail de 13h à 15h dont 6h en présentiel et le reste en travail personnel à domicile. Vous pouvez retrouver à l'horaire les plages en présentiel et le travail à distance est à réaliser entre ces sessions. Toutes les heures en présentiel sont assimilées à des heures de travaux pratiques encadrées avec présence obligatoire. Chaque absence doit être justifiée.

Modules

Science des données II : modélisation (Q1)

  • Régression linéaire I, régression linéaire simple, outils diagnostics
  • Régression linéaire II, régression linéaire polynomiale, régression linéaire multiple, critère d'Akaike
  • Modèle linéaire et modèle linéaire généralisé
  • Régression non linéaire, courbes de croissance, courbe logistique, ...

Science des données II : analyse (Q2)

  • Classification hiérarchique et indices de distances
  • K-moyennes, positionnement multidimensionnel (MDS), carte auto-adaptatives (SOM)
  • Analyse en composantes principales, analyse factorielle des correspondances, accès aux bases de données
  • Analyse factorielle multiple et indices de biodiversité

Méthode pédagogique

Ce cours est donné en classe inversée avec l'ensemble du matériel pédagogique disponible via le lien http://bds.sciviews.org/. Les étudiants seront actifs à chaque étape de l'apprentissage. Chaque module de cours comprend des exercices classés en quatre niveaux de difficulté croissante.

  • niveau I : découverte des notions avec des exercices rapides et ciblés intégrés au sein du cours en ligne
  • niveau II : application des notions dans des exercices sous la forme de tutoriel cadré
  • niveau III : transfert de ces notions dans des projets individuels guidés et réalisés sur des données biologiques
  • niveau IV : réalisation d'analyses libres dans des projets de groupe et sur des données biologiques nouvelles

La plus grande partie de votre temps sera donc consacrée à l'analyse de données biologiques au sein des exercices de niveau III et IV.

L'apprentissage nécessite de poser régulièrement des questions. Le canal privilégié pour ces échanges est un forum de discussion spécialisé (issues GitHub) accessible depuis le site du cours. Vous pouvez également nous contacter par mail à l'adresse sdd@sciviews.org.

Évaluation

L'activité dans les différents exercices est enregistrée pour chaque étudiant et est utilisée pour une évaluation continue. Il n'y a pas d'examen en session pour ce cours. La pondération entre les AA du Q1 et du Q2 est de 50/50. Il faut avoir réalisé au minimum 80% des exercices de chaque module pour qu'il soit pris en compte dans l'évaluation.

Équipement requis

  • un ordinateur (en option)

Les heures en présentiel sont données dans des salles informatiques équipées d'ordinateurs. Il est conseillé d'utiliser son ordinateur personnel pour les étudiants qui en disposent : cela simplifie le travail en distanciel.

  • des écouteurs

Des vidéos sont présentes dans le cours en ligne.

  • un câble Ethernet (en option)

Il s'agit d'un câble RJ45 non croisé de catégorie 5E ou plus, avec adaptateur si nécessaire pour le connecter sur votre ordinateur. La connexion filaire permet un accès à Internet plus stable et plus rapide que le Wifi.

  • une clé USB (fournie au premier cours)

Vous recevrez une clé USB avec les logiciels à installer pour ce cours. Cette clé sera utilisée pour tous les cours de science des données biologiques (bab2 à ma2). Elle pourra servir à transférer les données d'un PC à un autre.

L'UMONS met également des salles informatiques à disposition des étudiants qui ne disposent pas de leur propre PC. Le travail dans les salles informatiques doit se faire dans le respect de la charte informatique de l'UMONS, voir https://go.sciviews.org/charte_info.

Protection de la vie privée

La collecte des données personnelles des étudiants dans le cadre de ce cours se fait en respect du RGPD, voir https://wp.sciviews.org/politique-de-confidentialite/.

Entraide versus plagiat

L'entraide entre les étudiants est encouragée, mais il faut citer ses sources. Le plagiat est par contre totalement interdit et sévèrement puni à l'UMONS. Les étudiants devront bien comprendre la différence entre les deux dans le cadre de cours.

Ressources