i

Datenexpertise

Verortung Daten Ziel der Phase "Datenexpertise" ist das Sammeln von Daten (falls noch nicht vorhanden) und eine Analyse der Daten, sodass nach diesen ersten Analysen entschieden werden kann, ob die Datengrundlage für das Projekt ausreicht. Falls dies nicht der Fall ist werden weitere Daten erhoben oder die Fragestellung wird in einer weiteren Phase "Bereichsexpertise" überarbeitet.

Worum geht es hier?

Wie der Begriff Data Science bereits vermuten lässt, bilden die Daten das Herzstück eines Data Science Projektes. Es gibt im Allgemeinen zwei Möglichkeiten für die Herkunft der Daten:

  • Wir erheben die Daten selbst:
    Wir können die Daten zum Beispiel mit einer Umfrage erheben oder Daten "scrapen", d.h. automatisiert im Internet auslesen. Achtung: Hier sollten wir immer rechtliche und ethische Aspekte im Auge behalten!
  • Wir nutzen Daten, die bereits von anderen Personen erhoben wurden:
    Es gibt viele Plattformen oder Privatpersonen, die im Internet Datensätze frei zugänglich zur Verfügung stellen. Beispiele hierfür sind Kaggle oder ProCivicStat. Bei der Nutzung von fremden Datensätzen muss immer auf die Lizenz geachtet werden, unter der die Datensätze veröffentlich wurden. Geeignet sind zum Beispiel alle Datensätze mit CC0 Lizenz.
Dieses Kapitel beinhaltet beide Varianten. In Variante I wirst du die Daten selbst erheben, in Variante II arbeitest du mit einem bereits erhobenen Datensatz, der bezüglich seiner Größe und des Inhalts jenem des Netflix Prize ähnelt. Du wirst in diesem Kapitel die Datensätze durch verschiedene Analysen und Visualisierungen besser kennenlernen.

Hier lernst du...

  • ...wie du den Aufbau eines Datensatz gestaltest (Variante I) bzw. untersuchst (Variante II).
  • ...auf was du bei der Visualisierung von Daten achten solltest.
  • ...wie Daten mit der python Bibliothek matplotlib visualisiert werden.
  • ...wie eine erste Analyse der Daten mit der python Bibliothek pandas aussehen kann.
  • ...was eine gute Datenübersicht am Beispiel eines Data Dashboards ausmacht.
  • ...was Jupyter Notebooks sind und wie du sie verwendest.

Suche

v
14.5.1.1.2
dev.inf-schule.de/projekte/datascience/projekt_empfehlungssysteme/projektexpertise/datenexpertise
dev.inf-schule.de/14.5.1.1.2
dev.inf-schule.de/@/page/pp96XEOkEcekQVYY

Rückmeldung geben