¡Enhorabuena!

Fundamentos de big data con PySpark

Upendra Devisetty

Science Analyst, CyVerse

Fundamentos de Big Data y Apache Spark

Capítulo 1: Fundamentos de Big Data e introducción a Spark como framework de computación distribuida
- Componentes clave: Spark Core y librerías integradas: Spark SQL, Spark MLlib, GraphX y Spark Streaming
- PySpark: API de Python de Apache Spark para ejecutar trabajos en Spark
- Consola de PySpark: para desarrollar aplicaciones interactivas en Python
- Modos de Spark: local y clúster

Componentes de Spark

Capítulo 2: Introducción a los RDD, sus características, creación de RDD y operaciones (transformaciones y acciones)
Capítulo 3: Introducción a Spark SQL, DataFrame como abstracción, creación de DataFrames, operaciones y visualización de Big Data con DataFrames
Capítulo 4: Introducción a Spark MLlib y las tres C del aprendizaje automático (filtrado colaborativo, clasificación y clustering)

¿Qué sigue?

Fundamentos de big data con PySpark

Preparing Video For Download...