Veri görselleştirmeye giriş

Databricks'te Veri Görselleştirme

Gang Wang

Senior Data Scientist

Veri görselleştirme yol arkadaşınız

       

       

Gang Wang

Kıdemli Veri Bilimci

Origin Energy, Avustralya (2021-Günümüz)

Doktora sonrası 9+ yıl deneyim

Databricks'te Veri Görselleştirme

Veri görselleştirme nedir?

 

Veri görselleştirme, veriyi görsel biçimde sunma uygulamasıdır.

Biçimler: grafikler, diyagramlar, haritalar ve infografikler.

Temel amaç:

  • Karmaşık veriyi daha erişilebilir kılmak
  • Anlamayı ve kullanılabilirliği artırmak

Kişi başına GSYİH'nın zamana göre nasıl değiştiğini gösteren bir çizgi grafik örneği.

Farklı ülkelerdeki demografik dağılımı gösteren bir çubuk grafik örneği.

1 Görseller: Economist Writing Every Day, The Economist
Databricks'te Veri Görselleştirme

Neden veri görselleştirmeye ihtiyaç duyarız?

Faydalar:

  • Karmaşık veriyi basitleştirir
  • Önemli örüntü ve eğilimleri vurgular
  • Görsel işlemeyi güçlendirir
  • Anlama ve kalıcılığı artırır
  • Karar verme ve planlamayı destekler
  • Erişilebilirlik ve işbirliğini artırır

Veri görselleştirmenin karmaşık veriyi nasıl basitleştirdiğini, temel eğilimleri öne çıkardığını ve bilgiyi daha erişilebilir ve anlaşılır kılarak karar vermeyi nasıl güçlendirdiğini gösteren kavramsal bir görsel.

1 Görseller: Kovair
Databricks'te Veri Görselleştirme

Görselleştirme için temel istatistik kavramları

Ayrık ve sürekli veriler

  • Ayrık veri: sayılabilir, ayrı değerler
  • Sürekli veri: ölçülebilir büyüklükler, değer aralığı vardır

Betimsel istatistikler

  • Eğilimleri, örüntüleri ve aykırı değerleri özetler
  • Örnekler: ortalama, medyan, frekans dağılımları

Ayrık vs. sürekli veriler

1 Görseller: AgencyAnalytics
Databricks'te Veri Görselleştirme

Veri görselleştirme için Databricks

Faydalar:

  • Büyük veri kümelerini verimli işleme
  • Yerleşik görselleştirme seçenekleri
  • Etkileşimli panolar
  • İşbirliğine uygun ortam

Etkileşimli görselleştirmeler, gerçek zamanlı içgörüler ve özelleştirilebilir bileşenlerle etkili veri analizi ve karar verme sağlayan bir Databricks Panosu örneği.

Databricks'te Veri Görselleştirme

Veri kümemizi anlama

Veri kümesi: Databricks NYC Taxi veri kümesi

İçerik: alınış/bırakılış konumları, zamanları, mesafe ve ücretler

Sütun Adı Açıklama
tpep_pickup_datetime Yolculuğun başladığı tarih-saat
tpep_dropoff_datetime Yolculuğun bittiği tarih-saat
trip_distance Yolculuk mesafesi (mil)
fare_amount Yolculuk ücreti (USD)
pickup_zip Yolcunun alındığı bölge kodu (ZIP)
dropoff_zip Yolcunun bırakıldığı bölge kodu (ZIP)
Databricks'te Veri Görselleştirme

Hadi pratik yapalım!

Databricks'te Veri Görselleştirme

Preparing Video For Download...