Introducción a canalizaciones ETL y ELT

ETL y ELT en Python

Jake Roach

Data Engineer

$$

Gráfico de business intelligence, machine learning y IA.

ETL y ELT en Python

Canalizaciones de datos

... mueven datos de un origen a un destino y los transforman en el proceso.

$$

Orígenes y destinos de una canalización de datos.

ETL y ELT en Python

ETL

  • Extraer, transformar, cargar
  • Patrón tradicional de canalización de datos
  • Fuentes tabulares o no tabulares
  • Usar Python con pandas

$$

$$

$$

$$

ELT

  • Extraer, cargar, transformar
  • Patrón más reciente
  • Data warehouses
  • Normalmente datos tabulares
ETL y ELT en Python

Extraer, transformar, cargar (ETL)

def load(data_frame, target_table):
    # Some custom-built Python logic to load data to SQL
    data_frame.to_sql(name=target_table, con=POSTGRES_CONNECTION)
    print(f"Loading data to the {target_table} table")

# Now, run the data pipeline
extracted_data = extract(file_name="raw_data.csv")
transformed_data = transform(data_frame=extracted_data)
load(data_frame=transformed_data, target_table="cleaned_data")
Extracting data from raw_data.csv
Transforming data to remove 'null' records
Loading data to the cleaned_data table
ETL y ELT en Python

Extraer, cargar, transformar (ELT)

...
def transform(source_table, target_table):
    data_warehouse.run_sql("""
        CREATE TABLE {target_table} AS
          SELECT
              <field-name>, <field-name>, ...
          FROM {source_table};
    """)

# Similar to ETL pipelines, call the extract, load, and transform functions
extracted_data = extract(file_name="raw_data.csv")
load(data_frame=extracted_data, table_name="raw_data")
transform(source_table="raw_data", target_table="cleaned_data")
ETL y ELT en Python

También veremos...

$$

Gráfico que muestra temas que se verán más adelante en el curso.

ETL y ELT en Python

¡Vamos a practicar!

ETL y ELT en Python

Preparing Video For Download...