Betimsel ve Çıkarımsal İstatistikler

Python ile Anket Verilerini Analiz Etme

EbunOluwa Andrew

Data Scientist

Betimsel istatistikler

  • Anket verilerini özetleyen temel ölçüler
  • Örnekler: ortalama, medyan, mod, aralık, standart sapma vb.
  • .describe()

Fotoğraf: Lukas - grafiğe yakın plan

1 Fotoğraf: Lukas
Python ile Anket Verilerini Analiz Etme

.describe() fonksiyonu

data.describe()
|      | year     | satisfaction_rating
|------|----------|--------------------
| count|       42 |                  42
| mean | 2012.381 |            7192.857
| std  |    4.196 |             945.178
| min  |     2006 |                5500
| 25%  |     2009 |                6325
| 50%  |   2012.5 |                7400
| 75%  |     2016 |                8000
| max  |     2019 |                8600
data.describe(include = np.object)
|        | category    |
|--------|-------------|
| count  | 42          |
| unique | 3           |
| top    | Residential |
| freq   | 14          |
Python ile Anket Verilerini Analiz Etme

.describe() çıktısını yorumlama

  • Aykırı değer = maksimum > ortalama ve medyan
  • Olası olmayan değerler = mantıksız görünen değerler
|       | year     | satisfaction_rating |
|-------|----------|---------------------|
| count |       42 |                  42 |
| mean  | 2012.381 |            7192.857 |
| std   |    4.196 |             945.178 |
| min   |     2006 |                5500 |
| 25%   |     2009 |                6325 |
| 50%   |   2012.5 |                7400 |
| 75%   |     2016 |                8000 |
| max   |     2019 |                8600 |
Python ile Anket Verilerini Analiz Etme

.describe() çıktısını yorumlama

  • Top = mod = en sık görülen sınıf
  • Freq = bu sınıfın görülme sayısı
|        | category    |
|--------|-------------|
| count  | 42          |
| unique | 3           |
| top    | Residential |
| freq   | 14          |
Python ile Anket Verilerini Analiz Etme

electric_satisfaction üzerinde .describe()

import pandas as pd

electric_satisfaction = pd.read_csv("austin-energy-customer-satisfaction.csv")
Python ile Anket Verilerini Analiz Etme

electric_satisfaction üzerinde .describe()

electric_satisfaction.describe()
|      | year     | satisfaction_rating
|------|----------|--------------------
| count|       42 |                  42
| mean | 2012.381 |            7192.857
| std  |    4.196 |             945.178
| min  |     2006 |                5500
| 25%  |     2009 |                6325
| 50%  |   2012.5 |                7400
| 75%  |     2016 |                8000
| max  |     2019 |                8600
  • satisfaction_rating aykırı değerler içeriyor
    1. yüzdelik = medyan
Python ile Anket Verilerini Analiz Etme

electric_satisfaction üzerinde .describe()

|        | category    |
|--------|-------------|
| count  | 42          |
| unique | 3           |
| top    | Residential |
| freq   | 14          |
  • Mod = konut (residential) yanıtlayıcılar
Python ile Anket Verilerini Analiz Etme

Çıkarımsal istatistikler

  • Verinin daha büyük bir popülasyona genellenebilirliğini belirleyin
  • Örneklem < popülasyon -> örnekleme hatası
  • Popülasyon parametrelerini tahmin edin
    • Güven aralıkları
      • norm.interval() fonksiyonu

Fotoğraf: Pexels’ten Andrea Piacquadio - ampul tutan kadın

1 Fotoğraf: Pexels’ten Andrea Piacquadio
Python ile Anket Verilerini Analiz Etme

norm.interval() fonksiyonu

  • Büyük veri kümeleri için
  • Örneklem ortalamasının dağılımı normal varsayılır
import scipy.stats
scipy.stats.norm.interval(alpha, loc, scale)
  • alpha = güven düzeyi
  • loc = örneklem ortalaması
  • scale= örneklem standart hatası
Python ile Anket Verilerini Analiz Etme

electric_satisfaction üzerinde norm.interval()’ı yorumlama

electric_satisfaction = pd.read_csv(
  "austin-energy-customer-satisfaction.csv")

conf_interval = st.norm.interval(
  alpha = 0.99,
  loc = np.mean(electric_satisfaction.satisfaction),
  scale=st.sem(electric_satisfaction.satisfaction))

print(conf_interval)
(6817.187361704269, 7568.526924010017)
Python ile Anket Verilerini Analiz Etme

Haydi pratik yapalım!

Python ile Anket Verilerini Analiz Etme

Preparing Video For Download...