PySpark ile Machine Learning
Andrew Collier
Data Scientist, Fathom Data

Spark ile etkileşim için diller.
Python’dan pyspark modülünü içe aktarın.
import pyspark
pyspark sürümünü kontrol edin.
pyspark.__version__
'2.4.1'
pyspark’a ek olarak şunlar vardır:
pyspark.sqlpyspark.streamingpyspark.mllib (kullanımdan kalktı) ve pyspark.mlUzak Küme Spark URL ile — spark://<IP address | DNS name>:<port>
Örnek:
spark://13.59.151.161:7077Yerel Küme
Örnekler:
local — yalnızca 1 çekirdek;local[4] — 4 çekirdek; veyalocal[*] — tüm çekirdekler.from pyspark.sql import SparkSession
Bir SparkSession oluşturucu ile yerel küme başlatın.
spark = SparkSession.builder \
.master('local[*]') \
.appName('first_spark_application') \
.getOrCreate()
Sparklа etkileşim...
# Spark bağlantısını kapat
>>> spark.stop()
PySpark ile Machine Learning