In diesem Modul schlüpfen die Studierenden in die Rolle eines echten Datenwissenschaftlers, der ein Problem zu lösen hat. Sie folgen der Anleitung des Dozenten und durchlaufen die Schritte eines Datenwissenschaftlers - von der Datenbeschaffung über die Problembeschreibung bis hin zur Lösung des Problems.
Diese Disziplin, die auch als Datenwissenschaft bezeichnet wird, ist einer der Zweige der Informatik, der in den letzten zehn Jahren einen Aufschwung erlebt hat und als Grundlage für viele der Möglichkeiten dient, die das Internet heute bietet. Sie steht in engem Zusammenhang mit populären Konzepten wie künstliche Intelligenz, maschinelles Lernen, Big Data, Vorhersagen, Deep Learning und anderen. Es ist ein Bereich, in den große Unternehmen wie Google, Facebook, Amazon, Apple, IBM, Microsoft und andere erhebliche Summen investieren.
Nach Abschluss des Moduls werden die Studierenden Folgendes lernen:
- Verschiedene Methoden der Datenstrukturierung.
- Verschiedene Arten von Daten mit ihren Vor- und Nachteilen.
- Wie man einen Datensatz untersucht und relevante Kriterien berücksichtigt.
- Einfache Vorhersagealgorithmen (Entscheidungsbaum, Random Forest, SVM, KNN).
- Das Konzept der Statistik zur Interpretation der Ergebnisse.
- Einfache Clustering-/Gruppierungsalgorithmen (K-Means, DBScan) mit ihren Vor- und Nachteilen.
- Möglichkeiten der Ergebnisdarstellung und grundlegende Arten von Diagrammen.