ETL e ELT em Python
Jake Roach
Data Engineer

A maior parte dos dados produzidos e consumidos é não estruturada

API (Application Programming Interface)
$$

JSON (JavaScript Object Notation)
dict){
"key": "value",
...
"open": 0.121875
}
{
"timestamps": [863703000, 863789400, ...],
"open": [0.121875, 0.098438, ...],
"close": [...],
"volume": [...]
}
Use a função .read_json()
# Leia um arquivo JSON no formato acima
raw_stock_data = pd.read_json("raw_stock_data.json", orient="columns")
Nem sempre os dados estão prontos para DataFrame
{
"863703000": {
"volume": 1443120000,
"price": {
"close": 0.09791,
"open": 0.12187
}
},
"863789400": {
...
}, ...
}
import json
with open("raw_stock_data.json", "r") as file:
# Carrega o arquivo em um dicionário
raw_stock_data = json.load(file)
# Confirma o tipo da variável raw_stock_data
print(type(raw_stock_data))
<class 'dict'>
ETL e ELT em Python