PySpark ile Veri Temizleme
Mike Metzger
Data Engineering Consultant
Python değişkenleri:
Değişmez değişkenler:
Yeni bir veri çerçevesi tanımlayın:
voter_df = spark.read.csv('voterdata.csv')
Değişiklik yapma:
voter_df = voter_df.withColumn('fullyear', voter_df.year + 2000)voter_df = voter_df.drop(voter_df.year)
voter_df = voter_df.withColumn('fullyear',
voter_df.year + 2000)
voter_df = voter_df.drop(voter_df.year)
voter_df.count()
PySpark ile Veri Temizleme