Data Science 1

Programmieren & Visualisieren

Overview

Module code BIO-03.61-006 / BMARSYS-17.61-843
Instructors Dr. Saskia Otto, Dr. Monika Eberhard
Prerequisites None
License CC-BY-SA 4.0 International

The first module in the Data Science programme is all about getting started with data. After an introduction to the spreadsheet application LibreOffice Calc, you dive into the programming language R and the development environment RStudio. You learn to import, wrangle, visualise, and describe data – from simple tables to meaningful graphics. The module is accompanied by hands-on exercises and a case study on descriptive data analysis.

Learning Objectives

After completing this module, students can:

  • describe fundamental concepts of data science
  • apply practical data processing skills using a spreadsheet application such as LibreOffice Calc
  • confidently use the R programming language and write well-structured scripts and notebooks for data analysis and visualisation
  • gain an overview of data and describe its properties
  • find meaningful numerical representations for different types of datasets and manipulate them efficiently
  • proficiently apply various visualisation techniques

Vorlesungsfolien (WiSe 2025/2026)

Nr. Thema
00 Kurseinführung
01 Einführung in Daten und Datenmanagement
02 Grundlagen der deskriptiven Statistik
03 Biologische Prozesse mathematisch beschreiben
04 Einführung in die (R) Programmierung
05 Grundlagen in R: Variablen und Vektoren
06 Grundlagen in R: Komplexere Objekte
07 Datenaufbereitung mit tidyverse: Import/Export und Bereinigung
08 Datenaufbereitung mit tidyverse: Transformation und Anreicherung
09 Datenvisualisierung mit base R und ggplot2
10 Maßgeschneiderte ggplot2 Diagramme
11 Grundlagen der Visualisierung
12 ggplot2 Erweiterungen: Diagramme kombinieren, Karten und interaktive Grafiken
13 Handhabung spezieller Datentypen

Übungsfolien zu LibreOffice Calc

Nr. Thema
01 Overview
02 Tabellen erstellen
03 Rechnen in Calc
04 Diagramme erstellen
05 Export

Die interaktiven HTML-Vorlesungsfolien wurden von Saskia Otto mit Quarto revealjs erstellt. Beim Betrachten der Präsentation ermöglichen folgende Tastaturkombinationen unterschiedliche Anzeigemodi:

  • o zeigt den Übersichtsmodus an
  • w wechselt in den Breitbandmodus
  • f wechselt in den Vollbildmodus
  • h erlaubt das Hervorheben von Code
  • ctrl (Windows) bzw. cmd (Mac) UND + / - zum rein- und rauszoomen
  • p öffnet ein Pop-up Fenster für zusätzliche Informationen (funktioniert allerdings nicht bei Safari)
  • mit esc kann wieder in den normalen Modus gewechselt werden.

Lizenz der Vorlesungsfolien

Creative Commons License

Diese Arbeit ist lizenziert unter einer Creative Commons Attribution-ShareAlike 4.0 International License mit Ausnahme der entliehenen und mit Quellenangabe versehenen Abbildungen.

Accompanying Learning Materials

DS1 Handbook Cover
The DS1 handbook is available on Moodle.
  • Moodle course: UHH MIN Login
  • RStudio Server/Posit Workbench of the Department of Biology: the URL is provided via the Moodle course (login credentials are sent by email)
  • RStudio Server via JupyterHub of the MIN Faculty: https://code.min.uni-hamburg.de/hub/ (access via BAN credentials)
  • swirl courses: DSBswirl – interactive exercises in R (DSB-01 to DSB-04)
  • Cheatsheets & Guides: Reference cards on Calc and the RStudio Server, on basic R functions and ggplot2, and on visualisation techniques
  • Open Science templates: UHHformats, UHHthesis (BITTE AUSFÜHREN)

Book Recommendations

  • German:
    • Bärlocher, F. (1999): Biostatistik – Praktische Einführung in Konzepte und Methoden, Thieme Verlag, 206 pp.
    • Eickhoff-Schachtebeck, A. & Schöbel, A. (2014): Mathematik in der Biologie, Springer Spektrum, 277 pp.
  • English: