In diesem Modul schlüpfen die Teilnehmer in die Rolle eines echten Datenwissenschaftlers (Data Analyst), der ein Problem zu lösen hat. Sie folgen der Anleitung des Dozenten und durchlaufen die Schritte eines Datenwissenschaftlers - von der Datenbeschaffung über die Problembeschreibung bis hin zur Problemlösung.
Der Bereich Datenwissenschaft (Data Science) ist einer der Zweige in der Informatik, der im letzten Jahrzehnt einen Aufschwung erlebt hat und als Grundlage für viele weiteren Bereiche in der IT dient. Sie steht in engem Zusammenhang mit populären Konzepten wie die künstliche Intelligenz (KI), maschinelles Lernen, Big Data, Vorhersagen, Deep Learning und vieles mehr. Es ist ein Bereich, in denen große Unternehmen wie zum Beispiel Google, Facebook, Amazon, Apple, IBM investieren.
Nach Abschluss dieses Moduls werden die Teilnehmer folgendes können:
- verschiedene Methoden der Datenstrukturierung kennen (inkl. ihrer Vor – und Nachteile)
- wie man einen Datensatz untersucht und relevante Kriterien berücksichtigt
- einfache Vorhersagealgorithmen (Entscheidungsbaum, Random Forest, SVM und KNN)
- das Konzept der Statistik zur Interpretation der Ergebnisse verstehen
- einfache Clustering-/ Gruppierungsalgorithmen (K-Means, DBScan) verstehen und ihre Vor – und Nachteile kennen
- besserer Umgang mit Informationen
- Präsentation im Projektteam