Software

Programmiersprachen

Die Programmiersprache Python

Python ist eine vielseitige, universell einsetzbare Programmiersprache, die zunehmend in der Datenwissenschaft und im maschinellen Lernen eingesetzt wird. Durch ihre klare und gut lesbare Syntax ist Python besonders einsteigerfreundlich. Dank eines riesigen Ökosystems an Bibliotheken deckt Python ein breites Spektrum an Anwendungen ab – von Datenanalyse und Visualisierung über statistische Modellierung bis hin zu Deep Learning.

Installation

Für die Arbeit mit Python in der Datenwissenschaft empfehlen wir die Installation über eine der folgenden Distributionen:

  • Miniforge – Schlanke, Open-Source-Distribution mit conda-forge als Standard-Kanal. Empfohlen für erfahrene Nutzer.
  • Anaconda – Umfangreiche Distribution mit vielen vorinstallierten Paketen für Data Science. Ideal für Einsteiger.

Beide Distributionen enthalten den Paketmanager conda, der die Installation und Verwaltung von Paketen und Umgebungen vereinfacht.

TippEmpfehlung

Wir empfehlen Miniforge für eine schlanke Installation, bei der du nur die Pakete installierst, die du tatsächlich benötigst. Alternativ bietet Anaconda eine komfortable Lösung mit vielen vorinstallierten Paketen.

Nach der Installation von Miniforge oder Anaconda kannst du Python-Bibliotheken mit conda installieren:

conda install pandas numpy matplotlib seaborn scikit-learn scipy statsmodels

Die Grafische Benutzeroberfläche (GUI)

Python selbst hat keine grafische Benutzeroberfläche – es wird typischerweise über die Kommandozeile oder innerhalb einer Entwicklungsumgebung (IDE) verwendet. Für die Arbeit mit Python empfehlen wir eine der folgenden IDEs:

  • Positron – Neue IDE von Posit mit nativer Unterstützung für R und Python
  • Visual Studio Code – Vielseitiger Code-Editor mit Python-Erweiterung
  • JupyterLab – Interaktive Notebook-Umgebung, besonders beliebt in der Datenwissenschaft
TippHinweis

JupyterLab ist in Anaconda bereits enthalten und kann auch über Miniforge installiert werden: conda install jupyterlab

Wichtige Bibliotheken

Bibliothek Beschreibung
pandas Datenmanipulation und -analyse
numpy Numerische Berechnungen und Array-Operationen
matplotlib Grundlegende Datenvisualisierung
seaborn Statistische Visualisierung (aufbauend auf matplotlib)
scikit-learn Maschinelles Lernen (Klassifikation, Regression, Clustering)
scipy Wissenschaftliches Rechnen und statistische Tests
statsmodels Statistische Modelle und ökonometrische Analysen