ETL en ELT in Python
Jake Roach
Data Engineer
Data naar een bestand laden:
.to_csv()-methode
import pandas as pd
# Data-extractie en -transformatie
raw_data = pd.read_csv("raw_stock_data.csv")
stock_data = raw_data.loc[raw_data["open"] > 100, ["timestamps", "open"]]
# Data naar een .csv-bestand laden
stock_data.to_csv("stock_data.csv")
.to_csv aangeroepen op de DataFrame"stock_data.csv"stock_data.to_csv("./stock_data.csv", header=True)
True, False of een lijst met stringsstock_data.to_csv("./stock_data.csv", index=True)
True of Falseindex-kolom naar het bestand wordt geschrevenstock_data.to_csv("./stock_data.csv", sep="|")
| is een veelgebruikte optieHeeft tegenhangers:
.to_parquet().to_json().to_sql()Is de DataFrame correct opgeslagen naar het CSV-bestand?
import pandas
import os # Import the os module
# Extract, transform and load data
raw_data = pd.read_csv("raw_stock_data.csv")
stock_data = raw_data.loc[raw_data["open"] > 100, ["timestamps", "open"]]
stock_data.to_csv("stock_data.csv")
# Check that the path exists
file_exists = os.path.exists("stock_data.csv")
print(file_exists)
True
ETL en ELT in Python