Data Science

Fachbereich Biologie, Universität Hamburg

Data Science im BIO und BMARSYS Bachelor-Programm

Das Data Science Bachelor-Programm verfolgt das Ziel der Vereinheitlichung und Optimierung der Ausbildung zum zeitgemäßen Umgang mit wissenschaftlichen Daten für zukünftige Biolog*innen. Das Programm bzw. die Module richten sich an Studierende des gesamten Fachbereiches Biologie ab dem ersten Semester.

Die Module des Programms bauen aufeinander auf. Dadurch ist sichergestellt, dass das Erlernte kontinuierlich angewendet sowie stetig eingeübt und vertieft wird. Ziel ist es, den Studierenden einen routinierten Umgang mit Daten, deren Visualisierung und deren Analyse zu lehren. Dadurch sollte auch die Auswertung der ersten eigenen Daten während der Erstellung der Bachelorarbeit reibungsloser ablaufen.

Module DS1–4 im Studienverlauf für BIO Bachelor-Studierende (BMARSYS-Studierende belegen DS1–3 sowie ein inhaltlich abweichendes DS4)

Lehrformat (DS1–DS3)

Die Module Data Science 1–3 folgen einem gemeinsamen Lehrformat:

Vorlesung (90 bzw. 45 min wöchentlich)

  • Web-basierte HTML-Vorlesungsfolien mit eingebetteten Quizzen während der VL und einem abschließenden Wissensquiz pro VL
  • Aufzeichnung der Vorlesung (über Moodle verfügbar)
  • Hilfreich: Handy, Tablet oder Computer zum Mitmachen

Übungen in Kleingruppen (90 bzw. 45 min wöchentlich) — Anwesenheitspflicht!

  • Übungen in der Programmiersprache R (mit RStudio)
  • Online-Quizze zur Lernkontrolle (Moodle)
  • Bearbeitung einer Fallstudie mit abschließender Überprüfung
  • Nötig: Computer oder Tablet

Prüfung: Klausur (benotet, 100%) + Übungsabschluss (erfolgreiche Fallstudie) — beide können unabhängig voneinander absolviert werden.

Screenshot eines Moodle-Kurses

Beispiel: Moodle-Kursseite (DS2)

Moodle dient als zentrale Plattform für Übungsmaterial, Quizze, VL-Aufzeichnungen und Kommunikation (Zugang mit der B-Kennung):

Link: UHH MIN Login

Module im Überblick

Data Science 1 — Programmieren & Visualisieren

Pflichtmodul (BSc BIO / BMARSYS) · WiSe · 4 SWS

Dies ist das erste Modul des Data-Science-Programms. Es bietet eine Einführung in die verschiedenen Data-Science-Komponenten. Nach einer Einführung in das Tabellenkalkulationsprogramm Libreoffice Calc folgt eine Einführung in die Programmiersprache R und die Entwicklungsumgebung RStudio. Vermittelt werden Methoden und Werkzeuge zur Dateneingabe und -organisation, zum Import, zur Manipulation, Visualisierung und Beschreibung von Daten.

Zum Modul

Data Science 2 — Statistik & Versuchsplanung

Pflichtmodul (BSc BIO / BMARSYS) · SoSe · 2 SWS

Aufbauend auf Data Science 1 gibt dieses Modul einen Einstieg in die Welt der Stochastik und inferenziellen Statistik. Es werden die Grundlagen der Wahrscheinlichkeitstheorie, Verteilungen und statistischer Tests vermittelt sowie das experimentelle Design und die Versuchsplanung behandelt.

Zum Modul

Data Science 3 — Explorative Datenanalyse & Data Mining

Pflichtmodul (BSc BIO / BMARSYS) · WiSe · 2 SWS

Das dritte Modul schlägt die Brücke vom eigenen Experiment zur Analyse großer Sekundärdatensätze. Das methodische Spektrum reicht von mehrfaktoriellen ANOVAs über gemischte Modelle und Resampling bis hin zu multivariater Statistik und einem Einstieg ins maschinelle Lernen.

Zum Modul

Data Science 4 — Mathematische Modellierung

Pflichtmodul (BSc BIO) · WiSe · 2 SWS

In diesem Modul werden die Grundlagen zur quantitativen Darstellung biologischer Prozesse durch mathematische Funktionen vermittelt. Hinweis: Für BMARSYS-Studierende hat DS4 einen anderen inhaltlichen Schwerpunkt.

Dieses Modul wird aktuell nicht über diese Webseite bereitgestellt.


Archiv

Hinweis📁 Data Science in R (2018)

Vorgängerkurs des heutigen Data-Science-Programms. Der Kurs wurde von 2018 bis 2020 im ersten Semester des internationalen Masterprogramms iMARSYS am Institut für Marine Ökosystem- und Fischereiwissenschaften (IMF) durchgeführt und wird nicht mehr aktualisiert.

Zur Kursseite (extern)