pandas ile veriyi kalıcı hale getirme

Python ile ETL ve ELT

Jake Roach

Data Engineer

ETL hattında veriyi kalıcılaştırma

Dosyaya veri yükleme:

  • Veri tüketicilerine dönüştürülmüş veriye istikrarlı erişim sağlar
  • ETL sürecinin sonunda ve ayrık adımlar arasında gerçekleşir
  • Verinin bir “anlık görüntüsünü” yakalar
Python ile ETL ve ELT

pandas ile veriyi CSV’ye yazma

.to_csv() yöntemi

import pandas as pd

# Data extraction and transformation
raw_data = pd.read_csv("raw_stock_data.csv")
stock_data = raw_data.loc[raw_data["open"] > 100, ["timestamps", "open"]]

# Load data to a .csv file
stock_data.to_csv("stock_data.csv")
  • DataFrame üzerinde .to_csv çağrılır
  • DataFrame’i "stock_data.csv" yoluna yazar
Python ile ETL ve ELT

CSV çıktılarını özelleştirme

stock_data.to_csv("./stock_data.csv", header=True)
  • True, False veya dize listesini alır
stock_data.to_csv("./stock_data.csv", index=True)
  • True veya False alır
  • index sütununun dosyaya yazılıp yazılmayacağını belirler
stock_data.to_csv("./stock_data.csv", sep="|")
  • Dosyada sütunları ayırmak için kullanılan bir dize alır
  • | karakteri yaygın bir seçenektir

Şunların karşılığı vardır:

  • .to_parquet()
  • .to_json()
  • .to_sql()
1 https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.to_csv.html
Python ile ETL ve ELT

Veri kalıcılığını sağlama

DataFrame CSV dosyasına doğru kaydedildi mi?

import pandas
import os  # Import the os module

# Extract, transform and load data
raw_data = pd.read_csv("raw_stock_data.csv")
stock_data = raw_data.loc[raw_data["open"] > 100, ["timestamps", "open"]]
stock_data.to_csv("stock_data.csv")

# Check that the path exists
file_exists = os.path.exists("stock_data.csv")
print(file_exists)
True
Python ile ETL ve ELT

Hadi pratik yapalım!

Python ile ETL ve ELT

Preparing Video For Download...