Data Science 2

Grundlagen der Statistik und des experimentellen Designs

Steckbrief

Modulnummer BIO-06.61-015 / BMARSYS-18.61-847
Modulverantwortliche Dr. Saskia Otto
Voraussetzungen Data Science 1
Lehrform Vorlesung (1 SWS), Übung (1 SWS)

Im zweiten Modul geht es um die Grundlagen der inferenziellen Statistik und des experimentellen Designs. Aufbauend auf den R-Kenntnissen aus Data Science 1 lernt ihr, wie man Daten erhebt, Stichprobenpläne und Versuchsdesigns bewertet und statistische Hypothesentests durchführt. Der Schwerpunkt liegt auf den klassischen frequentistischen Ansätzen und deren Anwendung in der biologischen Forschung mit R. Begleitet wird das Modul durch anwendungsbezogene Übungen sowie eine Fallstudie, in der ihr den vollständigen Workflow – von der eigenen Datenerhebung und Digitalisierung bis zur inferenziellen statistischen Auswertung – in der Praxis erprobt.

Lernziele

Am Ende dieses Moduls könnt Ihr:

  • die Grundlagen der deskriptiven und inferenziellen Statistik anwenden
  • Stichprobendesigns und Versuchspläne bewerten
  • Hypothesen formulieren und statistische Hypothesentests durchführen und interpretieren
  • lineare Modelle in R aufstellen und prüfen
  • Modellannahmen überprüfen und diagnostizieren
  • Ergebnisse statistischer Analysen angemessen berichten

Vorlesungsfolien (SoSe 2026)

Nr. Thema
01 Einführung in die mathematische Statistik
02 Wahrscheinlichkeitstheorie
03 Wahrscheinlichkeitsverteilungen
04 Schätzverfahren oder was ist ein KI?
05 Hypothesentest oder was ist eine H0?
06 Klassische Tests (Teil 1: t-Tests und nicht-parametrische Alternativen)
07 Klassische Tests (Teil 2: Chi-Quadrat-Tests)
08 Mehrstichprobentests & Einführung in die Varianzanalyse
09 Korrelation & Transformation
10 Lineare Regression
11 Grundlagen des experimentellen Designs (Teil 1: Kriterien der Versuchsplanung & Poweranalyse)
12 Grundlagen des experimentellen Designs (Teil 2: Grundgleichung & Designtypen)
Add-On Beispiele zur Auswahl und Interpretation statistischer Tests

Die interaktiven HTML-Vorlesungsfolien wurden von Saskia Otto mit Quarto revealjs erstellt. Beim Betrachten der Präsentation ermöglichen folgende Tastaturkombinationen unterschiedliche Anzeigemodi:

  • o zeigt den Übersichtsmodus an
  • w wechselt in den Breitbandmodus
  • f wechselt in den Vollbildmodus
  • h erlaubt das Hervorheben von Code
  • ctrl (Windows) bzw. cmd (Mac) UND + / - zum rein- und rauszoomen
  • p öffnet ein Pop-up Fenster für zusätzliche Informationen (funktioniert allerdings nicht bei Safari)
  • mit esc kann wieder in den normalen Modus gewechselt werden.

Lizenz der Vorlesungsfolien

Creative Commons License

Diese Arbeit ist lizenziert unter einer Creative Commons Attribution-ShareAlike 4.0 International License mit Ausnahme der entliehenen und mit Quellenangabe versehenen Abbildungen.

Begleitende Lernmaterialien

DS2 Handbuch Cover
Das DS2 Handbuch ist auf Moodle verfügbar.
  • Moodle-Kurs: UHH MIN Login
  • RStudio Server/Posit Workbench des Fachbereichs Biologie: die URL wird über den Moodle-Kurs bereitgestellt (Zugangsdaten werden per Email im 1. Semester versendet)
  • RStudio Server über JupyterHub der MIN Fakultät: https://code.min.uni-hamburg.de/hub/ (Zugang über die BAN-Kennung)
  • Cheatsheets: Referenzkarten zur Statistik mit R
  • Fallstudien: Showcases aus dem Kurs

Literaturempfehlungen

Bücher

  • Deutsch:
    • Bärlocher, F. (1999): Biostatistik – Praktische Einführung in Konzepte und Methoden, Thieme Verlag, 206 S.
    • Eickhoff-Schachtebeck, A. & Schöbel, A. (2014): Mathematik in der Biologie, Springer Spektrum, 277 S.
  • Englisch:
    • Crawley, M.J. (2013): The R Book, 2nd edition, Wiley & Sons, West Sussex, UK, 945 S.
    • Quinn, G.P. & Keough, M.J. (2002): Experimental Design and Data Analysis for Biologists, Cambridge University Press, UK, 553 S.
    • Lazic, S.E. (2017): Experimental Design for Laboratory Biologists – Maximising Information and Improving Reproducibility, Cambridge University Press, 422 S.
    • Cohen, J. (1988): Statistical Power Analysis for the Behavioral Sciences, 2nd edition, Lawrence Erlbaum Associates, Hillsdale, NJ, 567 S.

Artikel zum Experimentellen Design

  • Englisch:
    • Underwood, A.J. (2009): Components of design in ecological field experiments, Annales Zoologici Fennici, 46(2): 93-111
    • Hurbert, S.H. (1984): Pseudoreplication and the design of ecological field experiments, Ecological Monographs 54(2): 187-211
    • Dutilleul, P. (1993): Spatial Heterogeneity and the Design of Ecological Field Experiments, Ecology 74(6): 1646-1658
    • Krzywinski, M., Altman, N. & Blainey, P. (2014): Nested designs, Nature Methods 11: 977–978
    • Altman, N. & Krzywinski, M. (2015): Split-plot design, Nature Methods 12: 165–166
    • Stallings, W.M. & Gillmore, G.M. (1971): A Note on ‘Accuracy’ and ‘Precision’, Journal of Educational Measurement 8(2): 127-129
    • Cohen, J. (1992): A Power Primer, Psychological Bulletin 112(1): 155-159
    • Faul, F., Erdfelder, E., Lang, A.-G., & Buchner, A. (2007): G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods 39: 175-191.