i

Datenbereinigung und -formatierung

Die Datenbereinigung und -formatierung macht den größten Teil eines Data Science Projekts aus. Dabei stellt man sich vor allem folgende Fragen:

  • Sind die Daten richtig (treten beispielsweise falsche Schreibweisen oder Tippfehler auf)?
  • Sind Daten doppelt in der Datenbank vorhanden?
  • Fehlen bestimmte Daten?
  • Liegen die Daten im richtigen Format vor?
  • Sind Daten in mehreren Dateien abgelegt? Wenn ja, wie hängen die Dateien zusammen?
Abhängig davon, was die Antworten auf diese Fragen sind, müssen unterschiedliche Operationen auf den Daten ausgeführt werden.

Aufgabe - Datenbereinigung und -formatierung unseren Datensatz

Lade dir das herunter und speichere es im gleichen Ordner wie den Filmdatensatz.

Bearbeite die Aufgaben im Jupyter Notebook.

Suche

v
5.1.3.3.1.2.1
dev.inf-schule.de/ki/menueansicht/maschinelles_lernen_mit_python/data_science/projekt_empfehlungssysteme/datenvorbereitung/datenbereinigung
dev.inf-schule.de/5.1.3.3.1.2.1
dev.inf-schule.de/@/page/zNPMlZXqQvBKYI9i

Rückmeldung geben