Data Science 1

Programmieren & Visualisieren

Steckbrief

Modulnummer BIO-03.61-006 / BMARSYS-17.61-843
Modulverantwortliche Dr. Saskia Otto, Dr. Monika Eberhard
Voraussetzungen Keine
Lehrform Vorlesung (2 SWS), Übung (2 SWS)

LibreOffice Calc und RStudio Screenshots

Im ersten Modul des Data-Science-Programms dreht sich alles um den Einstieg in die Welt der Daten. Nach einer Einführung in das Tabellenkalkulationsprogramm LibreOffice Calc taucht ihr in die Programmiersprache R und die Entwicklungsumgebung RStudio ein. Ihr lernt Daten einzulesen, aufzubereiten, zu visualisieren und zu beschreiben - von einfachen Tabellen bis hin zu aussagekräftigen Grafiken. Begleitet wird das Modul durch praxisnahe Übungen und eine Fallstudie zur deskriptiven Datenauswertung.

Lernziele

Übersicht der Lernziele in DS1

Lernziele Data Science 1

Am Ende dieses Moduls könnt Ihr:

  • die grundlegenden Konzepte des Data Science beschreiben
  • praktische Fertigkeiten der Datenverarbeitung mit einem Tabellenkalkulationsprogramm wie LibreOffice Calc anwenden
  • mit der Programmiersprache R vertraut umgehen und wohlstrukturierte Skripte zur Datenanalyse und -visualisierung schreiben
  • Euch einen Überblick über Daten verschaffen und diese bezüglich ihrer Eigenschaften beschreiben
  • sinnvolle numerische Repräsentationen für verschiedenartige Datensätze finden und diese kompakt und effizient manipulieren
  • verschiedene Visualisierungstechniken versiert anwenden

Vorlesungsfolien (WiSe 2025/2026)

Nr. Thema
00 Kurseinführung
01 Einführung in Daten und Datenmanagement
02 Grundlagen der deskriptiven Statistik
03 Biologische Prozesse mathematisch beschreiben
04 Einführung in die (R) Programmierung
05 Grundlagen in R: Variablen und Vektoren
06 Grundlagen in R: Komplexere Objekte
07 Datenaufbereitung mit tidyverse: Import/Export und Bereinigung
08 Datenaufbereitung mit tidyverse: Transformation und Anreicherung
09 Datenvisualisierung mit base R und ggplot2
10 Maßgeschneiderte ggplot2 Diagramme
11 Grundlagen der Visualisierung
12 ggplot2 Erweiterungen: Diagramme kombinieren, Karten und interaktive Grafiken
13 Handhabung spezieller Datentypen

Übungsfolien zu LibreOffice Calc

Nr. Thema
01 Overview
02 Tabellen erstellen
03 Rechnen in Calc
04 Diagramme erstellen
05 Export

Die interaktiven HTML-Vorlesungsfolien wurden von Saskia Otto mit Quarto revealjs erstellt. Beim Betrachten der Präsentation ermöglichen folgende Tastaturkombinationen unterschiedliche Anzeigemodi:

  • o zeigt den Übersichtsmodus an
  • w wechselt in den Breitbandmodus
  • f wechselt in den Vollbildmodus
  • h erlaubt das Hervorheben von Code
  • ctrl (Windows) bzw. cmd (Mac) UND + / - zum rein- und rauszoomen
  • p öffnet ein Pop-up Fenster für zusätzliche Informationen (funktioniert allerdings nicht bei Safari)
  • mit esc kann wieder in den normalen Modus gewechselt werden.

Lizenz der Vorlesungsfolien

Creative Commons License

Diese Arbeit ist lizenziert unter einer Creative Commons Attribution-ShareAlike 4.0 International License mit Ausnahme der entliehenen und mit Quellenangabe versehenen Abbildungen.

Begleitende Lernmaterialien

DS1 Handbuch Cover
Das DS1 Handbuch ist auf Moodle verfügbar.
  • Moodle-Kurs: UHH MIN Login
  • RStudio Server/Posit Workbench des Fachbereichs Biologie: die URL wird über den Moodle-Kurs bereitgestellt (Zugangsdaten werden per Email versendet)
  • RStudio Server über JupyterHub der MIN Fakultät: https://code.min.uni-hamburg.de/hub/ (Zugang über die BAN-Kennung)
  • swirl-Kurse: DSBswirl – interaktive Übungen in R (DSB-01 bis DSB-04)
  • Cheatsheets & Guides: Referenzkarten zu Calc und dem RStudio Server, zu R-Grundfunktionen und ggplot2 und zu Visualisierungstechniken

Buchempfehlungen

  • Deutsch:
    • Bärlocher, F. (1999): Biostatistik – Praktische Einführung in Konzepte und Methoden, Thieme Verlag, 206 S.
    • Eickhoff-Schachtebeck, A. & Schöbel, A. (2014): Mathematik in der Biologie, Springer Spektrum, 277 S.
  • Englisch: