Veri temizleme
Veri Ambarı Kavramları
Aaren Stubberfield
Data Scientist
Video gündemi
Veri biçimi revizyonu
Adres ayrıştırma
Veri doğrulama
Yinelenenleri kaldırma
Veri biçimi temizliği
Değerleri beklenen biçime güncelleyin
Tarihler
Seçenek adları
Büyük/küçük harf
Çıktının tutarlı biçimde olmasını sağlar
Taksi verisi örneği
Adres ayrıştırma
Sokak adresini bileşenlerine ayırma
Adresleri doğrulamak için araçlar kullanılabilir
Adres
1234 S Normal St, Cleveland, OH 44102
Adres
Şehir
Eyalet
Posta Kodu
1234 S Normal St
Cleveland
OH
44102
Veri doğrulama
Aralık kontrolü
Değer beklenen aralıkta mı?
Örnek: Bir kişinin yaşı
Tür kontrolü
Değer doğru veri türünde mi?
Örnek: Yaşın metin yerine sayı olarak saklanması
Çift satırları kaldırma
Bu süreç yinelenen kayıtları kaldırır
Veri yönetişimi
Haydi pratik yapalım!
Veri Ambarı Kavramları
Preparing Video For Download...