Python für Data Science und KI

Dreitägiger praxisorientierter Kurs zur datengetriebenen Entwicklung mit Python – von Datenanalyse und Algorithmusdesign bis zur Bereitstellung von KI-Anwendungen

3 Tage
Einsteiger bis leicht fortgeschritten
Loslegen

Python für Data Science und KI

Kursübersicht

Dieser intensive 3-Tages-Kurs richtet sich an Entwickler mit grundlegenden Programmierkenntnissen, die in die Welt von Data Science und Künstlicher Intelligenz mit Python einsteigen möchten. Im Mittelpunkt stehen praktische Datenanalysen, der Aufbau und die Bewertung von Machine-Learning-Modellen sowie der Einsatz etablierter Bibliotheken wie NumPy, Pandas, Scikit-learn und TensorFlow. Ein eigenes Modul behandelt die Produktivsetzung von KI-Anwendungen.

Was Sie lernen werden

  • Datenanalyse mit Python: Importieren, Bereinigen, Transformieren und Visualisieren von Daten
  • Algorithmusentwicklung: Entwicklung und Training von ML-Modellen mit realen Datensätzen
  • Wichtige Bibliotheken: NumPy, Pandas, Matplotlib, Scikit-learn, TensorFlow, Keras
  • Modellbewertung & Optimierung: Metriken, Cross-Validation, Hyperparameter-Tuning
  • Bereitstellung von KI-Anwendungen: Modell-Export, APIs mit FastAPI/Flask, Containerisierung

Kursmodule

Grundlagen: Data Science mit Python

Daten vorbereiten und analysieren

  • Daten importieren (CSV, Excel, JSON, APIs)
  • Arbeiten mit Pandas: DataFrames und Series
  • Datenbereinigung: fehlende Werte, Duplikate, Formatierung
  • Transformation & Aggregation
  • Übung: Analyse eines realen Datensatzes (z. B. Titanic, Iris)

Daten visualisieren & statistisch auswerten

  • Grundlagen der Visualisierung mit Matplotlib und Seaborn
  • Beschreibende Statistik, Verteilungen, Korrelationen
  • Gruppierungen und Pivot-Tabellen
  • Übung: Entwicklung eines kleinen Dashboards zur Datenanalyse

Machine Learning & Algorithmusentwicklung

Einführung in maschinelles Lernen

  • Überwachtes vs. unüberwachtes Lernen
  • Feature Engineering & Vorverarbeitung
  • Trainings-/Testdaten, Modelltraining und Prognose
  • Frameworks: Scikit-learn, Keras (Einführung)

Modellentwicklung

  • Klassifikation: Logistische Regression, Entscheidungsbäume, Random Forest
  • Regression: Lineare Regression, Ridge, Lasso
  • Clustering: K-Means, DBSCAN
  • Übung: Training und Vergleich mehrerer Modelle auf einem Beispieldatensatz

Modellbewertung

  • Accuracy, Precision, Recall, F1-Score
  • Confusion Matrix & ROC-Kurve
  • Cross-Validation & Vermeidung von Overfitting
  • Übung: Modelloptimierung mit GridSearchCV

Produktivsetzung von KI-Anwendungen

Vom Notebook zur Anwendung

  • Modell exportieren: Pickle, Joblib, SavedModel
  • Aufbau eines API-Endpunkts mit FastAPI oder Flask
  • Erstellung eines einfachen Frontends oder CLI-Tools zur Inferenz
  • Übung: Modell in eine API einbetten und per HTTP ansprechen

Bereitstellung in der Praxis

  • Modellversionierung und Dokumentation
  • Umgebungsmanagement mit virtualenv oder conda
  • Deployment mit Docker
  • Logging, Fehlermanagement, Überwachung
  • Übung: Containerisierung und lokaler Betrieb eines ML-Microservices

Voraussetzungen

  • Grundlegende Programmiererfahrung (beliebige Sprache, idealerweise Python)
  • Vertrautheit mit Datentypen, Schleifen, Funktionen und Kontrollstrukturen
  • Keine Vorkenntnisse in Data Science oder Machine Learning notwendig

Wer sollte teilnehmen

  • Entwickler und Software Engineers mit Interesse an datengetriebener Entwicklung
  • Junior Data Scientists und ML-Einsteiger
  • Technische Fachkräfte, die mit Geschäftsdaten und Kennzahlen arbeiten
  • Teams, die KI-Lösungen prototypisch oder produktiv einsetzen möchten