Datenexpertise
Worum geht es hier?
Wie der Begriff Data Science bereits vermuten lässt, bilden die Daten das Herzstück eines Data Science Projektes. Es gibt im Allgemeinen zwei Möglichkeiten für die Herkunft der Daten:
- Wir erheben die Daten selbst:
Wir können die Daten zum Beispiel mit einer Umfrage erheben oder Daten "scrapen", d.h. automatisiert im Internet auslesen. Achtung: Hier sollten wir immer rechtliche und ethische Aspekte im Auge behalten! - Wir nutzen Daten, die bereits von anderen Personen erhoben wurden:
Es gibt viele Plattformen oder Privatpersonen, die im Internet Datensätze frei zugänglich zur Verfügung stellen. Beispiele hierfür sind Kaggle oder ProCivicStat. Bei der Nutzung von fremden Datensätzen muss immer auf die Lizenz geachtet werden, unter der die Datensätze veröffentlich wurden. Geeignet sind zum Beispiel alle Datensätze mit CC0 Lizenz.
Hier lernst du...
- ...wie du den Aufbau eines Datensatz gestaltest (Variante I) bzw. untersuchst (Variante II).
- ...auf was du bei der Visualisierung von Daten achten solltest.
- ...wie Daten mit der python Bibliothek matplotlib visualisiert werden.
- ...wie eine erste Analyse der Daten mit der python Bibliothek pandas aussehen kann.
- ...was eine gute Datenübersicht am Beispiel eines Data Dashboards ausmacht.
- ...was Jupyter Notebooks sind und wie du sie verwendest.