Metin Sınıflandırma

Python ile Spark SQL'e Giriş

Mark Plutowski

Data Scientist

Son kelime Tahmini

Python ile Spark SQL'e Giriş

Dizi oku

Python ile Spark SQL'e Giriş

Son kelime

Python ile Spark SQL'e Giriş

Son kelime ayraç

Python ile Spark SQL'e Giriş

Karıştır 1

Python ile Spark SQL'e Giriş

Karıştır 2

Python ile Spark SQL'e Giriş

Şarkılar

Python ile Spark SQL'e Giriş

Videolar

Python ile Spark SQL'e Giriş

Veriyi seçme

df_true = df.where("endword in ('she', 'he', 'hers', 'his', 'her', 'him')")\
            .withColumn('label', lit(1))

df_false = df.where("endword not in ('she', 'he', 'hers', 'his', 'her', 'him')")\
           .withColumn('label', lit(0))
Python ile Spark SQL'e Giriş

Pozitif ve negatif veriyi birleştirme

df_examples = df_true.union(df_false)
Python ile Spark SQL'e Giriş

Veriyi eğitim ve değerlendirme kümelerine ayırma

df_train, df_eval = df_examples.randomSplit((0.60, 0.40), 42)
Python ile Spark SQL'e Giriş

Eğitim

from pyspark.ml.classification import LogisticRegression

logistic = LogisticRegression(maxIter=50, regParam=0.6, elasticNetParam=0.3)
model = logistic.fit(df_train)
print("Training iterations: ", model.summary.totalIterations)
Python ile Spark SQL'e Giriş

Haydi pratik yapalım!

Python ile Spark SQL'e Giriş

Preparing Video For Download...