Conteggio, somma e raggruppamento dei dati

Introduzione ai database in Python

Jason Myers

Co-Author of Essential SQLAlchemy and Software Engineer

Funzioni SQL

  • Es. COUNT, SUM
  • from sqlalchemy import func
  • Più efficiente che farlo in Python
  • Aggrega i dati
Introduzione ai database in Python

Esempio di somma

from sqlalchemy import func

stmt = select([func.sum(census.columns.pop2008)])
results = connection.execute(stmt).scalar()
print(results)
302876613
Introduzione ai database in Python

Group by

  • Permette di raggruppare righe per valori comuni
Introduzione ai database in Python

Group by

stmt = select([census.columns.sex, 
  func.sum(census.columns.pop2008)])

stmt = stmt.group_by(census.columns.sex)
results = connection.execute(stmt).fetchall()
print(results)
[('F', 153959198), ('M', 148917415)]
Introduzione ai database in Python

Group by

  • Supporta più colonne da raggruppare con uno schema simile a order_by()
  • Richiede che tutte le colonne selezionate siano raggruppate o aggregate da una funzione
Introduzione ai database in Python

Raggruppa per più colonne

stmt = select([census.columns.sex,
        census.columns.age,
        func.sum(census.columns.pop2008)
    ])

stmt = stmt.group_by(census.columns.sex, census.columns.age)
results = connection.execute(stmt).fetchall() print(results)
[('F', 0, 2105442), ('F', 1, 2087705), ('F', 2, 2037280),
('F', 3, 2012742), ('F', 4, 2014825), ('F', 5, 1991082),
('F', 6, 1977923), ('F', 7, 2005470), ('F', 8, 1925725), ...
Introduzione ai database in Python

Gestire i ResultSet delle funzioni

  • SQLAlchemy genera automaticamente i "nomi colonna" per le funzioni nel ResultSet
  • Spesso i nomi sono func_# come count_1
  • Sostituiscili con il metodo label()
Introduzione ai database in Python

Uso di label()

print(results[0].keys())
['sex', u'sum_1']
stmt = select([census.columns.sex,
        func.sum(census.columns.pop2008).label('pop2008_sum')
    ])

stmt = stmt.group_by(census.columns.sex)
results = connection.execute(stmt).fetchall() print(results[0].keys())
['sex', 'pop2008_sum']
Introduzione ai database in Python

Passons à la pratique !

Introduzione ai database in Python

Preparing Video For Download...