Data laden naar een SQL-database met pandas

ETL en ELT in Python

Jake Roach

Data Engineer

Data laden naar een SQL-database met pandas

ETL-pijplijn met de load-stap gemarkeerd.

ETL en ELT in Python

Data laden in een SQL-database met pandas

Datagebruikers die een SQL-database benaderen.

pandas heeft .to_sql() om data naar SQL weg te schrijven

  • name
  • con
  • if_exists
  • index
  • index_label
ETL en ELT in Python

Data wegschrijven naar Postgres met pandas

# Create a connection object
connection_uri = "postgresql+psycopg2://repl:password@localhost:5432/market"
db_engine = sqlalchemy.create_engine(connection_uri)
# Use the .to_sql() method to persist data to SQL
clean_stock_data.to_sql(
    name="filtered_stock_data",
    con=db_engine, 
    if_exists="append",
    index=True,
    index_label="timestamps"
)
ETL en ELT in Python

Validatie van datapersistentie met pandas

Het is belangrijk te checken dat data correct is weggeschreven.

  • Controleer of je kunt query'en
  • Zorg dat aantallen kloppen
  • Check dat elke rij aanwezig is
# Pull data written to SQL table
to_validate = pd.read_sql("SELECT * FROM cleaned_stock_data", db_engine)
# Validate counts, record equality, etc
...
ETL en ELT in Python

Laten we oefenen!

ETL en ELT in Python

Preparing Video For Download...