Python ile ETL ve ELT
Jake Roach
Data Engineer
Bu derste:
Veri ayrıca şuralardan gelir:
Parquet dosyaları:
import pandas as pd
# Parquet dosyasını belleğe oku
raw_stock_data = pd.read_parquet("raw_stock_data.parquet", engine="fastparquet")
pandas DataFrame’e çekilebilirimport sqlalchemy
import pandas as pd
# Connection URI: schema_identifier://username:password@host:port/db
connection_uri = "postgresql+psycopg2://repl:password@localhost:5432/market"
db_engine = sqlalchemy.create_engine(connection_uri)
# SQL veritabanını sorgula
raw_stock_data = pd.read_sql("SELECT * FROM raw_stock_data LIMIT 10", db_engine)
Mantığı işlevlere ayırma
def extract_from_sql(connection_uri, query):
# Engine oluştur, veriyi sorgula ve DataFrame döndür
db_engine = sqlalchemy.create_engine(connection_uri)
return pd.read_sql(query, db_engine)
extract_from_sql("postgresql+psycopg2://.../market", "SELECT ... LIMIT 10;")
Python ile ETL ve ELT