Hipotez oluşturma

Python ile Keşifsel Veri Analizi

George Boorman

Curriculum Manager, DataCamp

Ne biliyoruz?

Jet Airways’in Birinci Sınıf biletlerde en yüksek sayıda olduğu, farklı fiyat kategorilerinde havayolu başına uçuş sayısını gösteren countplot

Python ile Keşifsel Veri Analizi

Ne biliyoruz?

sns.heatmap(planes.corr(numeric_only=True), annot=True)
plt.show()

planes veri setindeki değişkenler arasındaki Pearson korelasyon katsayılarını gösteren ısı haritası

Python ile Keşifsel Veri Analizi

Sahte korelasyon

sns.scatterplot(data=planes, x="Duration", y="Price", hue="Total_Stops")
plt.show()

Toplam Duruşlar faktörüyle Fiyat’a karşı Süre saçılım grafiği

Python ile Keşifsel Veri Analizi

Nasıl biliyoruz?

Her duruş sayısı için korelasyon katsayılarını gösteren ısı haritası

Python ile Keşifsel Veri Analizi

Gerçek olan nedir?

"Yalan Haber" yazan daktilo

  • Farklı bir zamana ait veriler aynı sonuçları verir mi?

  • İlişkileri, farkları ve desenleri tespit etmek için:

    • Hipotez Testi kullanırız
  • Hipotez testi, veri toplamadan önce şunları gerektirir:

    • Bir hipotez veya soru oluşturma
    • Kullanılacak istatistiksel teste karar verme
1 Görsel kredisi: https://unsplash.com/@markuswinkler
Python ile Keşifsel Veri Analizi

Veri gözetleme

 

Bir havaalanı pistine bakan manzaralı ofis

Bir çubuk grafiğe bakan büyüteç

Python ile Keşifsel Veri Analizi

Hipotez oluşturma

sns.barplot(data=planes, x="Airline", y="Duration")
plt.show()

Süreye karşı havayolu çubuk grafiği

Python ile Keşifsel Veri Analizi

Hipotez oluşturma

sns.barplot(data=planes, x="Destination", y="Price")
plt.show()

Ortalama fiyatı gösteren çubuk grafik

Python ile Keşifsel Veri Analizi

Sonraki adımlar

  • Deneyi tasarlayın

  • Aşağıdaki adımları içerir:

    • Örnek seçme
    • Kaç veri noktasına ihtiyaç olduğunu hesaplama
    • Hangi istatistiksel testin uygulanacağını belirleme
Python ile Keşifsel Veri Analizi

Haydi pratik yapalım!

Python ile Keşifsel Veri Analizi

Preparing Video For Download...