Parabéns!

Fundamentos de Big Data com PySpark

Upendra Devisetty

Science Analyst, CyVerse

Fundamentos de Big Data e Apache Spark

Capítulo 1: Fundamentos de Big Data e introdução ao Spark como framework de computação distribuída
- Componentes principais: Spark Core e bibliotecas nativas — Spark SQL, Spark MLlib, GraphX e Spark Streaming
- PySpark: API Python do Apache Spark para executar jobs no Spark
- Shell do PySpark: para desenvolver apps interativas em Python
- Modos do Spark: local e cluster

Componentes do Spark

Capítulo 2: Introdução a RDDs, recursos de RDDs, criação de RDDs e operações (Transformations e Actions)
Capítulo 3: Introdução ao Spark SQL, abstração DataFrame, criação de DataFrames, operações e visualização de Big Data com DataFrames
Capítulo 4: Introdução ao Spark MLlib, os três Cs de Machine Learning (Collaborative Filtering, Classification e Clustering)

Próximos passos

Fundamentos de Big Data com PySpark

Preparing Video For Download...