İki değişkenin öyküsü

Python ile statsmodels kullanarak Regresyona Giriş

Maarten Van den Broeck

Content Developer at DataCamp

İsveç motor sigortası verisi

  • Her satır İsveç’te bir coğrafi bölgeyi temsil eder.
  • 63 satır vardır.
n_claims total_payment_sek
108 392.5
19 46.2
13 15.7
124 422.2
40 119.4
... ...
Python ile statsmodels kullanarak Regresyona Giriş

Tanımlayıcı istatistikler

import pandas as pd
print(swedish_motor_insurance.mean())
n_claims             22.904762
total_payment_sek    98.187302
dtype: float64
print(swedish_motor_insurance['n_claims'].corr(swedish_motor_insurance['total_payment_sek']))
0.9128782350234068
Python ile statsmodels kullanarak Regresyona Giriş

Regresyon nedir?

  • Bir tepki değişkeni ile bazı açıklayıcı değişkenler arasındaki ilişkiyi incelemek için istatistiksel modeller.
  • Açıklayıcı değişkenlerin değerleri verildiğinde, tepki değişkeninin değerlerini tahmin edebilirsiniz.
n_claims total_payment_sek
108 3925
19 462
13 157
124 4222
40 1194
200 ???
Python ile statsmodels kullanarak Regresyona Giriş

Terimler

Tepki değişkeni (bağımlı değişken)

Tahmin etmek istediğiniz değişken.

Açıklayıcı değişkenler (bağımsız değişkenler)

Tepki değişkeninin nasıl değişeceğini açıklayan değişkenler.

Python ile statsmodels kullanarak Regresyona Giriş

Doğrusal ve lojistik regresyon

Doğrusal regresyon

  • Tepki değişkeni sayısaldır.

Lojistik regresyon

  • Tepki değişkeni mantıksaldır.

Basit doğrusal/lojistik regresyon

  • Yalnızca bir açıklayıcı değişken vardır.
Python ile statsmodels kullanarak Regresyona Giriş

Değişken çiftlerini görselleştirme

import matplotlib.pyplot as plt
import seaborn as sns

sns.scatterplot(x="n_claims",
                y="total_payment_sek",    
                data=swedish_motor_insurance)

plt.show()

Toplam ödeme ile talep sayısı saçılım grafiği. Talep sayısı arttıkça ödeme artar.

Python ile statsmodels kullanarak Regresyona Giriş

Doğrusal trend çizgisi ekleme

sns.regplot(x="n_claims",
            y="total_payment_sek",
            data=swedish_motor_insurance,
            ci=None)

Aynı saçılım grafiği, doğrusal regresyonla hesaplanan bir trend çizgisi eklenmiş. Veriye makul bir uyum sağlar.

Python ile statsmodels kullanarak Regresyona Giriş

Ders akışı

Bölüm 1

Doğrusal regresyon modellerini görselleştirme ve uydurma.

Bölüm 2

Doğrusal regresyon modellerinden tahmin yapma ve model katsayılarını anlama.

Bölüm 3

Doğrusal regresyon modelinin kalitesini değerlendirme.

Bölüm 4

Aynısı lojistik regresyon için.

Python ile statsmodels kullanarak Regresyona Giriş

Regresyon için Python paketleri

statsmodels

  • İçgörü için optimize edildi (bu derste odak)

scikit-learn

  • Tahmin için optimize edildi (diğer DataCamp derslerinde odak)
Python ile statsmodels kullanarak Regresyona Giriş

Hadi pratik yapalım!

Python ile statsmodels kullanarak Regresyona Giriş

Preparing Video For Download...