Selamat!

Membersihkan Data di R

Maggie Matsui

Content Developer, DataCamp

Yang Anda pelajari

Diagram yang sama dari Pelajaran 1.1 menampilkan mendiagnosis data kotor, dampaknya, dan cara membersihkan data.

Membersihkan Data di R

Bab 1: Masalah Data Umum

 

Kiri: Tablet dengan garis ke folder, cloud, basis data, dan kertas untuk mewakili batasan tipe data seperti string dan numerik. Tengah: Garis bilangan dengan dua penanda dan panah ganda di antaranya untuk mewakili batasan rentang data, seperti data/ nilai di luar rentang. Kanan: Boneka matryoshka untuk mewakili batasan keunikan seperti menemukan dan menangani duplikat.

Membersihkan Data di R

Bab 2: Data Teks dan Kategorikal

Kiri: Lencana akses keamanan untuk mewakili batasan keanggotaan seperti menemukan kategori tidak konsisten dan menanganinya dengan join. Tengah: Bujur sangkar terhubung garis untuk mewakili variabel kategorikal seperti menemukan kategori tidak konsisten dan mereduksinya. Kanan: Dua gelembung teks untuk mewakili pembersihan data teks, seperti menyeragamkan format dan menemukan panjang.

Membersihkan Data di R

Bab 3: Masalah Data Lanjutan

Kiri: Enam seragam wasit untuk mewakili keseragaman, seperti menyeragamkan format mata uang dan tanggal. Tengah: Tabel data tiga kolom untuk mewakili validasi lintas kolom, seperti penjumlahan baris dan validasi umur. Kanan: Puzzle dengan kepingan hilang untuk mewakili kelengkapan, seperti menemukan data hilang dan menanganinya.

Membersihkan Data di R

Bab 4: Record Linkage

Diagram yang menampilkan langkah-langkah record linkage

Membersihkan Data di R

Kembangkan dan tingkatkan keterampilan baru Anda

Membersihkan Data di R

Selamat!

Membersihkan Data di R

Preparing Video For Download...