Steckbrief
| Modulnummer | BIO-03.61-006 / BMARSYS-17.61-843 |
| Modulverantwortliche | Dr. Saskia Otto, Dr. Monika Eberhard |
| Voraussetzungen | Keine |
| Lehrform | Vorlesung (2 SWS), Übung (2 SWS) |

Im ersten Modul des Data-Science-Programms dreht sich alles um den Einstieg in die Welt der Daten. Nach einer Einführung in das Tabellenkalkulationsprogramm LibreOffice Calc taucht ihr in die Programmiersprache R und die Entwicklungsumgebung RStudio ein. Ihr lernt Daten einzulesen, aufzubereiten, zu visualisieren und zu beschreiben - von einfachen Tabellen bis hin zu aussagekräftigen Grafiken. Begleitet wird das Modul durch praxisnahe Übungen und eine Fallstudie zur deskriptiven Datenauswertung.
Lernziele

Am Ende dieses Moduls könnt Ihr:
- die grundlegenden Konzepte des Data Science beschreiben
- praktische Fertigkeiten der Datenverarbeitung mit einem Tabellenkalkulationsprogramm wie LibreOffice Calc anwenden
- mit der Programmiersprache R vertraut umgehen und wohlstrukturierte Skripte zur Datenanalyse und -visualisierung schreiben
- Euch einen Überblick über Daten verschaffen und diese bezüglich ihrer Eigenschaften beschreiben
- sinnvolle numerische Repräsentationen für verschiedenartige Datensätze finden und diese kompakt und effizient manipulieren
- verschiedene Visualisierungstechniken versiert anwenden
Vorlesungsfolien (WiSe 2025/2026)
Übungsfolien zu LibreOffice Calc
| Nr. | Thema |
|---|---|
| 01 | Overview |
| 02 | Tabellen erstellen |
| 03 | Rechnen in Calc |
| 04 | Diagramme erstellen |
| 05 | Export |
Die interaktiven HTML-Vorlesungsfolien wurden von Saskia Otto mit Quarto revealjs erstellt. Beim Betrachten der Präsentation ermöglichen folgende Tastaturkombinationen unterschiedliche Anzeigemodi:
- o zeigt den Übersichtsmodus an
- w wechselt in den Breitbandmodus
- f wechselt in den Vollbildmodus
- h erlaubt das Hervorheben von Code
- ctrl (Windows) bzw. cmd (Mac) UND + / - zum rein- und rauszoomen
- p öffnet ein Pop-up Fenster für zusätzliche Informationen (funktioniert allerdings nicht bei Safari)
- mit esc kann wieder in den normalen Modus gewechselt werden.
Lizenz der Vorlesungsfolien
Diese Arbeit ist lizenziert unter einer Creative Commons Attribution-ShareAlike 4.0 International License mit Ausnahme der entliehenen und mit Quellenangabe versehenen Abbildungen.
Begleitende Lernmaterialien
- Moodle-Kurs: UHH MIN Login
- RStudio Server/Posit Workbench des Fachbereichs Biologie: die URL wird über den Moodle-Kurs bereitgestellt (Zugangsdaten werden per Email versendet)
- RStudio Server über JupyterHub der MIN Fakultät: https://code.min.uni-hamburg.de/hub/ (Zugang über die BAN-Kennung)
- swirl-Kurse: DSBswirl – interaktive Übungen in R (DSB-01 bis DSB-04)
- Cheatsheets & Guides: Referenzkarten zu Calc und dem RStudio Server, zu R-Grundfunktionen und ggplot2 und zu Visualisierungstechniken
Buchempfehlungen
- Deutsch:
- Bärlocher, F. (1999): Biostatistik – Praktische Einführung in Konzepte und Methoden, Thieme Verlag, 206 S.
- Eickhoff-Schachtebeck, A. & Schöbel, A. (2014): Mathematik in der Biologie, Springer Spektrum, 277 S.
- Englisch:
- Data Science mit R
- Crawley, M.J. (2013): The R Book, 2nd edition, Wiley & Sons, West Sussex, UK, 945 S.
- Wickham, H. & Grolemund, G. (2023): R for Data Science, 2nd edition, O’Reilly Media Inc., CA, USA. Online verfügbar auf r4ds.hadley.nz
- Visualisierung mit ggplot2
- Wickham, H. (2016): ggplot2 – Elegant Graphics for Data Analysis, 2nd edition, Springer International Publishing, Switzerland, 260 S.
- Kassambara, A. (2013): Guide to Create Beautiful Graphics in R, 2nd edition, STHDA, 237 S.
- Visualisierung allgemein
- Kirk, A. (2019): Data Visualisation – A Handbook for Data Driven Design, 2nd edition, SAGE Publications Ltd., 312 S.
- Berinato, S. (2019): Good Charts Workbook, HBR Press, 279 S.
- Data Science mit R