Menghapus fitur yang sangat berkorelasi

Pengurangan Dimensi dengan Python

Jeroen Boeye

Head of Machine Learning, Faktion

Data sangat berkorelasi

pairplot sangat berkorelasi

Pengurangan Dimensi dengan Python

Fitur yang sangat berkorelasi

matriks sangat berkorelasi

Pengurangan Dimensi dengan Python

Menghapus fitur yang sangat berkorelasi

# Create positive correlation matrix
corr_df = chest_df.corr().abs()

# Create and apply mask mask = np.triu(np.ones_like(corr_df, dtype=bool))
tri_df = corr_df.mask(mask) tri_df

Pengurangan Dimensi dengan Python

Menghapus fitur yang sangat berkorelasi

# Find columns that meet threshold 
to_drop = [c for c in tri_df.columns if any(tri_df[c] > 0.95)]

print(to_drop)
['Suprasternale height', 'Cervicale height']
# Drop those columns
reduced_df = chest_df.drop(to_drop, axis=1)
Pengurangan Dimensi dengan Python

Seleksi fitur

Skema seleksi fitur

Ekstraksi fitur

Skema ekstraksi fitur

Pengurangan Dimensi dengan Python

Catatan korelasi - Kuartet Anscombe

Kuartet Anscombe

Pengurangan Dimensi dengan Python

Catatan korelasi - kausalitas

sns.scatterplot(x="N firetrucks sent to fire", 
                y="N wounded by fire",data=fire_df)

mobil pemadam vs. korban luka

Pengurangan Dimensi dengan Python

Ayo berlatih!

Pengurangan Dimensi dengan Python

Preparing Video For Download...