Python ile Spark SQL'e Giriş
Mark Plutowski
Data Scientist
df.cache()
df.unpersist()
df.is_cached
False
df.cache()
df.is_cached
True
df.unpersist()
df.is_cached()
False
df.unpersist()
df.cache()
df.storageLevel
StorageLevel(True, True, False, True, 1)
Yukarıdaki depolama düzeyinde aşağıdakiler geçerlidir:
useDisk = TrueuseMemory = TrueuseOffHeap = Falsedeserialized = Truereplication = 1Spark 2.1+ sürümünde aşağıdakiler eşdeğerdir:
df.persist()
df.persist(storageLevel=pyspark.StorageLevel.MEMORY_AND_DISK)
df.cache(), df.persist() ile aynıdır
df.createOrReplaceTempView('df')
spark.catalog.isCached(tableName='df')
False
spark.catalog.cacheTable('df')
spark.catalog.isCached(tableName='df')
True
spark.catalog.uncacheTable('df')
spark.catalog.isCached(tableName='df')
False
spark.catalog.clearCache()
Python ile Spark SQL'e Giriş