Applied Data Sciences in the Life Sciences
Allgemeine Informationen
Dozenten | Prof. Dr. Mathias Wilhelm, Prof. Dr. Melanie Schirmer, Dr. Sapna Sharma, Prof. Dr. Markus List |
ECTS | 5 ECTS |
Sprache | English |
Turnus | Sommersemester |
Anmeldung | TUMonline & Moodle |
Prüfung | Projektarbeit (finale Präsentation und schriftliche Auswertung) |
Intro
Data Science ist eine entscheidende Fähigkeit für Biologen, die es ihnen ermöglicht, Datensätze zu analysieren und zu hinterfragen, um wichtige Forschungsfragen zu beantworten. In diesem Kurs führen wir Sie in wichtige Konzepte der Datenwissenschaft ein und arbeiten mit verfügbaren Ressourcen und Datenbanken. Sie lernen, Analysen und Datenvisualisierungen in R durchzuführen, indem Sie das reichhaltige Paket-Ökosystem nutzen. Sie werden grundlegende Analysefähigkeiten für verschiedene Omics-Typen erwerben und in der Datenanalyse unabhängiger werden.
Inhalt
In diesem Modul werden die Grundlagen der Data Science im Bereich Molekularbiologie behandelt. Folgende Inhalte werden behandelt:
- Grundlagen von R, Bioconductor
- Wissenschaftliche Prinzipien von Open Science bis FAIR data
- Visualisierung von OMICS Daten
- Grundlagen des maschinellen Lernens
- Data Science Grundlagen der Metagenomik und statistische Analysen
- Data Science Grundlagen der Transkriptomik, der differenziellen Genexpressionanalyse
- Data Science Grundlagen der funktionalen Enrichment Analyse.
- Data Science Grundlagen der Proteomik
- Data Science Grundlagen der Metabolomik
Übung und Modulprüfung
Die Modulprüfung erfolgt im Rahmen einer Projektarbeit am Ende des Semesters in Gruppen von 3-4 Teilnehmern. Dazu gehören u.a. die Problemdefinition, die Rollenverteilung, die Ideenfindung, die Kriterienentwicklung, sowie die Entscheidung, Projektplanung und Durchführung. Als Projektauftrag dient die Entwicklung einer Analysepipeline, mit der die Studierenden vermitteln, dass sie Konzepte der Veranstaltung verstanden haben. Im finalen Report wird nachgewiesen, dass Teilnehmer den Sachverhalt der Ausarbeitung in vorgegebenem Umfang übersichtlich und verständlich darstellen können. Nach der Abgabe des Reports werden die Teilnehmer ein Peer-Review-Begutachtung vornehmen. Teilnehmer zeigen so, dass sie Pipelines anderer Gruppen kritisch Hinterfragen und Evaluieren können. Die Note ergibt sich zu gleichen Teilen aus dem Peer-Review und der finalen schriftlichen Auswertung. Für letztere gilt es eine Dokumentation der Software in Form einer Ausarbeitung zu erstellen. Hierbei wird besonderes Augenmerk auf die Wahl der Methodik, der richtige Umgang, Reproduzierbarkeit und korrekte Interpretation der Ergebnisse der Pipeline gelegt. Zur Notenvergabe (Einzelbewertung) müssen Leistungen der Team-Mitglieder ersichtlich sein, z.B. durch Aufteilung der Ausarbeitung sowie dem Peer-Review.
Der richtige Umgang mit den Methoden und die Erwartungen an die Modulprüfung werden durch semesterbegleitende Bearbeitung von Aufgabenblättern in Gruppen von 3-4 Teilnehmern durch die Teilnehmer praktisch erlernt. Zu den Aufgaben der Studierenden gehören u.a. das Laden, Prozessieren und Analysieren von Daten aus verschiedenen OMICS Bereichen, sowie das Interpretieren und Diskutieren der Ergebnisse unter Einbeziehung von Literatursuche. Die Studierenden dokumentieren ihre Analysen durch Skripte (z.B. Rmarkdown) und zeigen damit, dass die benötigten Werkzeuge erfolgreich beherrscht werden. Teilnehmer bekommen bei erreichen von 75% der Gesamtpunktzahl der semesterbegleitenden Aufgabenblätter einen Notenbonus von 0.3 auf die Modulprüfung.
Empfohlene Voraussetzungen
- Einführung in die Statistik