Koşullu DataFrame sütun işlemleri

PySpark ile Veri Temizleme

Mike Metzger

Data Engineering Consultant

Koşullu ifadeler

Koşullu ifadeler şunlardır:

  • if / then / else’in satır içi sürümü
  • .when()
  • .otherwise()
PySpark ile Veri Temizleme

Koşullu örnek

.when(<if koşulu>, <then x>)

df.select(df.Name, df.Age, F.when(df.Age >= 18, "Adult"))

Name Age
Alice 14
Bob 18 Adult
Candice 38 Adult
PySpark ile Veri Temizleme

Başka bir örnek

Birden çok .when()

df.select(df.Name, df.Age, 
          .when(df.Age >= 18, "Adult")
          .when(df.Age < 18, "Minor"))
Name Age
Alice 14 Minor
Bob 18 Adult
Candice 38 Adult
PySpark ile Veri Temizleme

Otherwise

.otherwise() else gibidir

df.select(df.Name, df.Age,
          .when(df.Age >= 18, "Adult")
          .otherwise("Minor"))
Name Age
Alice 14 Minor
Bob 18 Adult
Candice 38 Adult
PySpark ile Veri Temizleme

Hadi pratik yapalım!

PySpark ile Veri Temizleme

Preparing Video For Download...