Python für Data Science und KI
Kursübersicht
Dieser intensive 3-Tages-Kurs richtet sich an Entwickler mit grundlegenden Programmierkenntnissen, die in die Welt von Data Science und Künstlicher Intelligenz mit Python einsteigen möchten. Im Mittelpunkt stehen praktische Datenanalysen, der Aufbau und die Bewertung von Machine-Learning-Modellen sowie der Einsatz etablierter Bibliotheken wie NumPy, Pandas, Scikit-learn und TensorFlow. Ein eigenes Modul behandelt die Produktivsetzung von KI-Anwendungen.
Was Sie lernen werden
- Datenanalyse mit Python: Importieren, Bereinigen, Transformieren und Visualisieren von Daten
- Algorithmusentwicklung: Entwicklung und Training von ML-Modellen mit realen Datensätzen
- Wichtige Bibliotheken: NumPy, Pandas, Matplotlib, Scikit-learn, TensorFlow, Keras
- Modellbewertung & Optimierung: Metriken, Cross-Validation, Hyperparameter-Tuning
- Bereitstellung von KI-Anwendungen: Modell-Export, APIs mit FastAPI/Flask, Containerisierung
Kursmodule
Grundlagen: Data Science mit Python
Daten vorbereiten und analysieren
- Daten importieren (CSV, Excel, JSON, APIs)
- Arbeiten mit Pandas: DataFrames und Series
- Datenbereinigung: fehlende Werte, Duplikate, Formatierung
- Transformation & Aggregation
- Übung: Analyse eines realen Datensatzes (z. B. Titanic, Iris)
Daten visualisieren & statistisch auswerten
- Grundlagen der Visualisierung mit Matplotlib und Seaborn
- Beschreibende Statistik, Verteilungen, Korrelationen
- Gruppierungen und Pivot-Tabellen
- Übung: Entwicklung eines kleinen Dashboards zur Datenanalyse
Machine Learning & Algorithmusentwicklung
Einführung in maschinelles Lernen
- Überwachtes vs. unüberwachtes Lernen
- Feature Engineering & Vorverarbeitung
- Trainings-/Testdaten, Modelltraining und Prognose
- Frameworks: Scikit-learn, Keras (Einführung)
Modellentwicklung
- Klassifikation: Logistische Regression, Entscheidungsbäume, Random Forest
- Regression: Lineare Regression, Ridge, Lasso
- Clustering: K-Means, DBSCAN
- Übung: Training und Vergleich mehrerer Modelle auf einem Beispieldatensatz
Modellbewertung
- Accuracy, Precision, Recall, F1-Score
- Confusion Matrix & ROC-Kurve
- Cross-Validation & Vermeidung von Overfitting
- Übung: Modelloptimierung mit GridSearchCV
Produktivsetzung von KI-Anwendungen
Vom Notebook zur Anwendung
- Modell exportieren: Pickle, Joblib, SavedModel
- Aufbau eines API-Endpunkts mit FastAPI oder Flask
- Erstellung eines einfachen Frontends oder CLI-Tools zur Inferenz
- Übung: Modell in eine API einbetten und per HTTP ansprechen
Bereitstellung in der Praxis
- Modellversionierung und Dokumentation
- Umgebungsmanagement mit virtualenv oder conda
- Deployment mit Docker
- Logging, Fehlermanagement, Überwachung
- Übung: Containerisierung und lokaler Betrieb eines ML-Microservices
Voraussetzungen
- Grundlegende Programmiererfahrung (beliebige Sprache, idealerweise Python)
- Vertrautheit mit Datentypen, Schleifen, Funktionen und Kontrollstrukturen
- Keine Vorkenntnisse in Data Science oder Machine Learning notwendig
Wer sollte teilnehmen
- Entwickler und Software Engineers mit Interesse an datengetriebener Entwicklung
- Junior Data Scientists und ML-Einsteiger
- Technische Fachkräfte, die mit Geschäftsdaten und Kennzahlen arbeiten
- Teams, die KI-Lösungen prototypisch oder produktiv einsetzen möchten