Regresyon analizi

Python ile Anket Verilerini Analiz Etme

EbunOluwa Andrew

Data Scientist

Regresyon analizi

  • Değişkenler arasındaki ilişkiyi anlama
  • Kesin bir sonucu tahmin etmede kullanılır
  • Farklı bağımsız değişkenlerin bağımlı değişken üzerindeki etkisini ölçer
  • Olası gelecekteki fırsat ve riskleri öngörür
  • Ham veriyi eyleme dönük bilgiye indirger
  • Bilinçli kararlar için olgusal destek sağlar

Aşağı yönlü finansal oku durdurmaya çalışan insanlar

Python ile Anket Verilerini Analiz Etme

En küçük kareler (OLS) ile doğrusal regresyon

  • Doğrusal regresyon modeli
    • x ve y arasında doğrusal ilişki varsayar
    • y = m * x + b
    • En Küçük Kareler (OLS) yöntemi
    • Sum((hesaplanan-gözlenen)^2) => en aza indirilir

https://seeing-theory.brown.edu/regression-analysis/index.html

1 https://seeing-theory.brown.edu/regression-analysis/index.html
Python ile Anket Verilerini Analiz Etme

Verileri yükleme

import pandas as pd

import numpy as np
import matplotlib.pyplot as plt
import statsmodels.api as sm
exercise_data = pd.read_csv('workout_survey_data.csv') print(exercise_data.head())
| workout_minutes | calories_burned |
|-----------------|-----------------|
| 77              | 79.775152       |
| 21              | 23.177279       |
| 22              | 25.609262       |
| 20              | 17.857388       |
Python ile Anket Verilerini Analiz Etme

Değişkenleri tanımlayın

x = bağımsız değişken y = bağımlı değişken

x = exercise_data.minutes.tolist()
y = exercise_data.calories.tolist() 
print(x,'\n',y)
| [77, 21, 22, 20, 36...           |
|----------------------------------|
| [79.7, 23.1, 25.6, 17.8, 41.8... |

Anket verisi

workout_minutes calories_burned
77 79.775152
21 23.177279
22 25.609262
20 17.857388
36 41.849864
Python ile Anket Verilerini Analiz Etme

Sabit terim ekleyin

x = sm.add_constant(x)
print (x)
  • Modele b için bir değer uydurmasını söyler

Python ile Anket Verilerini Analiz Etme

Regresyonu çalıştırın ve modeli uydurun

result = sm.OLS(y,x).fit()
print(result.summary())

Python ile Anket Verilerini Analiz Etme

m ve b değerlerini alma

Python ile Anket Verilerini Analiz Etme

Orijinal değerleri görselleştirme

x = exercise_data.minutes.tolist()
y = exercise_data.calories.tolist()
plt.scatter(x,y)
plt.xlabel('minutes')
plt.ylabel('calories')
plt.show()

Python ile Anket Verilerini Analiz Etme

Regresyon doğrusunu çizme

max_x = exercise_data.minutes.max()
min_x = exercise_data.minutes.min()
x = np.arange(min_x, max_x, 1)

y = 1.0072*x + 0.1552
plt.plot(y, 'r') plt.show()

Python ile Anket Verilerini Analiz Etme

Yanıt tahmini

y = 1.0072 * 30 + 0.1552
print(y)
30.3712
Python ile Anket Verilerini Analiz Etme

Doğrusal regresyon: artılar ve eksiler

  • Artı
    • Veri doğrusal ayrılabiliyorsa iyi sonuç verir
  • Eksi
    • Doğrusal olmayan durumlarda doğrusal ilişki varsayar

Python ile Anket Verilerini Analiz Etme

Hadi pratik yapalım!

Python ile Anket Verilerini Analiz Etme

Preparing Video For Download...