Gefeliciteerd!

Data opschonen in R

Maggie Matsui

Content Developer, DataCamp

Wat je hebt geleerd

Zelfde diagram als Les 1.1 met diagnose van rommelige data, gevolgen daarvan en het opschonen.

Data opschonen in R

Hoofdstuk 1: Veelvoorkomende dataproblemen

 

Links: een tablet met lijnen naar een map, cloud, database en papier voor datatypebeperkingen (strings, numeriek). Midden: een getallenlijn met twee markeringen en dubbele pijl voor bereikbeperkingen (waarden buiten bereik). Rechts: matroesjka-poppen voor uniekheidsregels (duplicaten vinden en behandelen).

Data opschonen in R

Hoofdstuk 2: Tekst en categorische data

Links: een toegangspas voor lidmaatschapsregels, zoals inconsistente categorieën vinden en met joins oplossen. Midden: vierkantjes met lijnen voor categorische variabelen, zoals inconsistente categorieën vinden en samenvoegen. Rechts: twee tekstballonnen voor tekst opschonen, zoals formats uniformeren en lengtes vinden.

Data opschonen in R

Hoofdstuk 3: Geavanceerde dataproblemen

Links: zes scheidsrechtershirts voor uniformiteit, zoals valuta- en datumformaten gelijkmaken. Midden: een tabel met drie kolommen voor veldkruisvalidering, zoals rij-sommen en leeftijd valideren. Rechts: een puzzel met ontbrekend stuk voor volledigheid, zoals missende data vinden en behandelen.

Data opschonen in R

Hoofdstuk 4: Record linkage

Diagram met stappen van record linkage

Data opschonen in R

Brei voort op je nieuwe skills

Data opschonen in R

Gefeliciteerd!

Data opschonen in R

Preparing Video For Download...