ETL e ELT em Python
Jake Roach
Data Engineer
Carregar dados para um arquivo:
Método .to_csv()
import pandas as pd
# Extração e transformação
raw_data = pd.read_csv("raw_stock_data.csv")
stock_data = raw_data.loc[raw_data["open"] > 100, ["timestamps", "open"]]
# Carregar para um arquivo .csv
stock_data.to_csv("stock_data.csv")
.to_csv chamado no DataFrame"stock_data.csv"stock_data.to_csv("./stock_data.csv", header=True)
True, False ou lista de stringsstock_data.to_csv("./stock_data.csv", index=True)
True ou Falseindex será escrita no arquivostock_data.to_csv("./stock_data.csv", sep="|")
| é comumTem equivalentes:
.to_parquet().to_json().to_sql()O DataFrame foi salvo corretamente no arquivo CSV?
import pandas
import os # Importa o módulo os
# Extrair, transformar e carregar dados
raw_data = pd.read_csv("raw_stock_data.csv")
stock_data = raw_data.loc[raw_data["open"] > 100, ["timestamps", "open"]]
stock_data.to_csv("stock_data.csv")
# Verificar se o caminho existe
file_exists = os.path.exists("stock_data.csv")
print(file_exists)
True
ETL e ELT em Python