Da viel Zeit vergangen ist, ist schon einiges passiert im Kurs. Daher wird’s diesmal eine eher grobe Zusammenfassung ohne sehr ins Detail zu gehen. Nachdem wir also im ersten Termin inhaltlich noch nicht viel besprochen hatten, wurde im zweiten Termin ausführlich das Thema Datenqualität behandelt, siehe Folie unten. Zu den einzelnen Punkten kann man sich vermutlich etwas vorstellen bzw. lässt es sich auch leicht recherchieren. Danach hat Matthias den Ablauf eines Datenanalyse-Prozesses erläutert. Dies ist der Fahrplan, an dem sich der Kurs inhaltlich orientieren wird. Somit haben wir kurz über den Schritt der Datenvorbereitung gesprochen, und sind dann in den schwer gewichteten Block der Datenverarbeitung eingestiegen. Dies ist ein wichtiger Schritt, da hierbei die zur Analyse herangezogenen Daten so aufbereitet werden, dass am Ende auch korrekte Ergebnisse rauskommen. Wenn z.B. Fehler nicht korrigiert werden, kann dies das Ergebnis verfälschen. Daneben dienen alle Vorgänge der Vorverarbeitung dazu, die anschließende Analyse zu vereinfachen. Also haben wir uns ausgiebig mit Datenvorverarbeitung beschäftigt, und haben uns nach dem theoretischen Teil dazu schnell der Praxis zugewendet. Als erstes Tool zur Datenvorverarbeitung und auch Visualisierung haben wir mit „Google Looker Studio“ gearbeitet. Hier haben wir im Wesentlichen gelernt Daten zu importieren, und anschließend zu bereinigen und zu transformieren. Unter Transformieren versteht u.a. Datentypen anzupassen. Um es nicht zu langweilig zu gestalten, Hat Matthias zügig auch das Erstellen von Visualisierungen gezeigt, was jeder parallel oder im Nachgang zum Unterricht selber ausprobieren sollte. Möglichkeiten der Visualisierung – also die Darstellung von Daten – gibt es eine große Menge. Klassisch sind Linien oder- Säulendiagramme, wie man sie aus Excel kennt. Excel stellt für die Datenanalyse häufig die Grundlage dar. D.h. die Daten, oder besser „Datensätze“, liegen in Form von Exceltabellen vor. Generell gibt es viele verschiedene „Datenquellen“, auch die Vorgehensweise bei der Vorverarbeitung kann umfangreich sein, und wie gesagt können viele Visualisierungen erstellt werden. Das ganze Spektrum zu erläutern würde hier zu weit führen, wie zu Beginn erwähnt.
Das zweite und mächtigere Tool, das wir kennengelernt haben, ist „Power BI Desktop“. Es ist ähnlich zu Google Looker, hat aber noch einige Funktionalitäten mehr. Mir persönlich gefällt es auch besser, da die Bedienung einfacher ist. Hier haben wir ebenfalls die erwähnten grundlegenden Vorgänge durchgeführt, und sollten zwischen den Unterrichtseinheiten Übungen machen, um damit vertraut zu werden. Mit Power BI werde ich auf jeden Fall mein Abschlussprojekt bearbeiten. Erste Daten habe ich mir schon ausgesucht, und auch schon Visualisierungen erstellt. Mehr dazu berichte dann nächstes Mal.



