Machine Learning mit „Dirty Data“ – Herausforderungen und Lösungen aus der Praxis
„Garbage in, garbage out“ – diese Faustregel gilt bei Daten im maschinellen Lernen. Doch wie erkennen wir schlechte Daten, sogenannte Dirty Data, und wie können wir als Data Scientists die Mängel in den Daten reduzieren oder vermeiden? In Hands-on-Sessions werden wir uns zusammen intensiv mit realen Datenbeispielen beschäftigen. Ihr lernt dabei sowohl den Umgang mit Dirty Data für tabellarisches maschinelles Lernen als auch im Kontext des modernen Natural Language Processing (LLMs, RAG).
Level 2-3: für Fortgeschrittene und Erfahrene
Anforderungen: eigener Laptop, Python Vorkenntnisse und Grundlagen Machine Learning vorhanden
Dozentinnen
Katharina Strecker, M.Sc
Mein Name ist Katharina Strecker und ich bin wissenschaftliche Mitarbeiterin am Zentrum für Sonnenergie- und Wasserstoff-Forschung Baden-Württemberg (ZSW) im Bereich Maschinelles Lernen. Studiert habe ich Computer Science and Media an der Hochschule der Medien in Stuttgart.
Seit 2020 beschäftige ich mich in meiner Arbeit am ZSW mit Problemstellungen aus dem Bereich Erneuerbare Energien und wie diese mit Maschinellem Lernen gelöst werden können. Zusätzlich forsche ich im Bereich Data-Centric Automated Machine Learning (AutoML) .
Profil ansehen
M.Sc. Jessica Hofmann
Mein Name ist Jessica Hofmann und ich arbeite am Zentrum für Sonnenenergie- und Wasserstoff-Forschung Baden-Württemberg als wissenschaftliche Mitarbeiterin im KI-Team. 2023 habe ich mein Masterstudium in der Medieninformatik am ZSW mit dem Thema Multi-Objective-Optimierung abgeschlossen. Ich beschäftige mich hauptsächlich mit dem Einsatz von Maschinellem Lernen im Kontext der Erneuerbaren Energien. Meine Schwerpunkte liegen neben dem klassischen Maschinellen Lernen auf tabellarischen Daten auf der Integration großer Sprachmodelle und Agenten.
Profil ansehen
