Python für Data Science und KI

Kursübersicht

Dieser intensive 3-Tages-Kurs richtet sich an Entwickler mit grundlegenden Programmierkenntnissen, die in die Welt von Data Science und Künstlicher Intelligenz mit Python einsteigen möchten. Im Mittelpunkt stehen praktische Datenanalysen, der Aufbau und die Bewertung von Machine-Learning-Modellen sowie der Einsatz etablierter Bibliotheken wie NumPy, Pandas, Scikit-learn und TensorFlow. Ein eigenes Modul behandelt die Produktivsetzung von KI-Anwendungen.

Was Sie lernen werden

Datenanalyse mit Python: Importieren, Bereinigen, Transformieren und Visualisieren von Daten
Algorithmusentwicklung: Entwicklung und Training von ML-Modellen mit realen Datensätzen
Wichtige Bibliotheken: NumPy, Pandas, Matplotlib, Scikit-learn, TensorFlow, Keras
Modellbewertung & Optimierung: Metriken, Cross-Validation, Hyperparameter-Tuning
Bereitstellung von KI-Anwendungen: Modell-Export, APIs mit FastAPI/Flask, Containerisierung

Kursmodule

Grundlagen: Data Science mit Python

Daten vorbereiten und analysieren

Daten importieren (CSV, Excel, JSON, APIs)
Arbeiten mit Pandas: DataFrames und Series
Datenbereinigung: fehlende Werte, Duplikate, Formatierung
Transformation & Aggregation
Übung: Analyse eines realen Datensatzes (z. B. Titanic, Iris)

Daten visualisieren & statistisch auswerten

Grundlagen der Visualisierung mit Matplotlib und Seaborn
Beschreibende Statistik, Verteilungen, Korrelationen
Gruppierungen und Pivot-Tabellen
Übung: Entwicklung eines kleinen Dashboards zur Datenanalyse

Machine Learning & Algorithmusentwicklung

Einführung in maschinelles Lernen

Überwachtes vs. unüberwachtes Lernen
Feature Engineering & Vorverarbeitung
Trainings-/Testdaten, Modelltraining und Prognose
Frameworks: Scikit-learn, Keras (Einführung)

Modellentwicklung

Klassifikation: Logistische Regression, Entscheidungsbäume, Random Forest
Regression: Lineare Regression, Ridge, Lasso
Clustering: K-Means, DBSCAN
Übung: Training und Vergleich mehrerer Modelle auf einem Beispieldatensatz

Modellbewertung

Accuracy, Precision, Recall, F1-Score
Confusion Matrix & ROC-Kurve
Cross-Validation & Vermeidung von Overfitting
Übung: Modelloptimierung mit GridSearchCV

Produktivsetzung von KI-Anwendungen

Vom Notebook zur Anwendung

Modell exportieren: Pickle, Joblib, SavedModel
Aufbau eines API-Endpunkts mit FastAPI oder Flask
Erstellung eines einfachen Frontends oder CLI-Tools zur Inferenz
Übung: Modell in eine API einbetten und per HTTP ansprechen

Bereitstellung in der Praxis

Modellversionierung und Dokumentation
Umgebungsmanagement mit virtualenv oder conda
Deployment mit Docker
Logging, Fehlermanagement, Überwachung
Übung: Containerisierung und lokaler Betrieb eines ML-Microservices

Voraussetzungen

Grundlegende Programmiererfahrung (beliebige Sprache, idealerweise Python)
Vertrautheit mit Datentypen, Schleifen, Funktionen und Kontrollstrukturen
Keine Vorkenntnisse in Data Science oder Machine Learning notwendig

Wer sollte teilnehmen

Entwickler und Software Engineers mit Interesse an datengetriebener Entwicklung
Junior Data Scientists und ML-Einsteiger
Technische Fachkräfte, die mit Geschäftsdaten und Kennzahlen arbeiten
Teams, die KI-Lösungen prototypisch oder produktiv einsetzen möchten