Data Science ist einer der Bereiche der Informatik, der sich im letzten Jahrzehnt am stärksten entwickelt hat und die Grundlage für viele der Annehmlichkeiten bildet, die uns das Internet heute bietet. Dieser Bereich steht in engem Zusammenhang mit populären Konzepten wie künstlicher Intelligenz, maschinellem Lernen, Big Data, Prognosen, Deep Learning und vielen weiteren. Hier investieren große Unternehmen wie Google, Facebook, Amazon, Apple, IBM, Microsoft und andere viel Geld.
In diesem Modul schlüpfen die Studierenden in die Rolle eines echten Wissenschaftlers bzw. Analysten, der ein Problem lösen muss. Sie folgen den Anweisungen des Dozenten und setzen die Schritte eines Data Scientists um – von der Beschaffung der Daten über die Beschreibung des Problems bis hin zu dessen Lösung.
Nach Abschluss des Moduls haben die Studierenden Folgendes gelernt:
- Verschiedene Methoden der Datenstrukturierung
- Verschiedene Datentypen mit ihren Vor- und Nachteilen
- Wie der Datensatz untersucht werden kann und welche Kriterien dabei berücksichtigt werden können
- Einfache Vorhersagealgorithmen (Entscheidungsbaum, Random Forest, SVM, KNN)
- Statistische Konzepte zur Interpretation der Ergebnisse
- Einfache Clustering-/Gruppierungsalgorithmen (K-Means, DBScan) mit Vor- und Nachteilen
- Möglichkeiten zur Darstellung der Ergebnisse und einfache Diagrammtypen
Soft Skills: Umgang mit Informationen, Aufmerksamkeitssteuerung und Verständnis der eigenen Aufgabe in der Teamarbeit