PySpark ile Veri Temizleme
Mike Metzger
Data Engineering Consultant
Normal ID alanları:
| id | soyadı | adı | eyalet |
|---|---|---|---|
| 0 | Smith | John | TX |
| 1 | Wilson | A. | IL |
| 2 | Adams | Wendy | OR |
pyspark.sql.functions.monotonically_increasing_id()
| id | soyadı | adı | eyalet |
|---|---|---|---|
| 0 | Smith | John | TX |
| 134520871 | Wilson | A. | IL |
| 675824594 | Adams | Wendy | OR |
Unutmayın, Spark tembeldir!
PySpark ile Veri Temizleme