Introduzione al DataFrame Polars

Introduzione a Polars

Liam Brannigan

Data Scientist and Polars Contributor

Conosci l'istruttore

$$

  • Liam Brannigan, Lead Data Scientist
  • Specialista in ML e Data Engineering
  • Contributor di Polars

Foto profilo dell'istruttore.

Introduzione a Polars

Dati tabellari

shape: (49, 8)
| name        | type    | price | bedrooms | doubles | singles | review | beach |
| ---         | ---     | ---   | ---      | ---     | ---     | ---    | ---   |
| str         | str     | i64   | i64      | i64     | i64     | f64    | bool  |
|-------------|---------|-------|----------|---------|---------|--------|-------|
| Waves       | Cottage | 540   | 4        | 1       | 2       | 8.9    | false |
| Seashells   | Cottage | 540   | 4        | 2       | 2       | 8.7    | true  |
| Lake view   | Cottage | 714   | 3        | 1       | 4       | 9.2    | true  |
| Piran View  | null    | 775   | null     | 1       | 3       | 9.6    | false |
| Palma Villa | Cottage | 1772  | 4        | 1       | 2       | 9.6    | true  |
Introduzione a Polars

Immagine affiancata di un orso polare che cammina nella neve e un panda in una foresta.

  • Polars è di solito più veloce di Pandas → calcolo parallelo
  • La lazy mode di Polars ottimizza le query
Introduzione a Polars

I loghi di Apache Arrow e Rust.

  • Apache Arrow: memorizza dati tabellari in memoria
  • Rust: linguaggio veloce per l'elaborazione dati
Introduzione a Polars

Schema di un database per illustrare il caricamento dei dati.

  • Caricare e ispezionare i dati
Introduzione a Polars

Schema di un database e ingranaggi per illustrare una trasformazione.

  • Caricare e ispezionare i dati
  • Trasformazioni e ottimizzazione
Introduzione a Polars

Schema di un database, ingranaggi e un grafico per illustrare l'analisi.

  • Caricare e ispezionare i dati
  • Trasformazioni e ottimizzazione
  • Analisi dei dati
Introduzione a Polars

Lettura di un CSV

import polars as pl


rentals = pl.read_csv("vacation_rentals.csv")
Introduzione a Polars

Prime righe di un DataFrame

rentals.head(3)

Prime righe del DataFrame rentals.

Introduzione a Polars

Prime righe di un DataFrame

rentals.head(3)

Il DataFrame rentals con la shape evidenziata.

Introduzione a Polars

Prime righe di un DataFrame

rentals.head(3)

Il DataFrame rentals con la prima colonna evidenziata.

  • dtype: tipo di dati in una colonna
Introduzione a Polars

Prime righe di un DataFrame

rentals.head(3)

Il DataFrame rentals con la colonna rentals evidenziata.

Introduzione a Polars

Ultime righe di un DataFrame

rentals.tail()
shape: (5, 8)
| name                | type      | price | bedrooms | doubles | singles | review | beach |
| ---                 | ---       | ---   | ---      | ---     | ---     | ---    | ---   |
| str                 | str       | i64   | i64      | i64     | i64     | f64    | bool  |
|---------------------|-----------|-------|----------|---------|---------|--------|-------|
| Hengar Manor House  | Cottage   | 615   | 4        | 1       | 5       | 9.4    | false |
| Tudor Cottage Hayle | Cottage   | 489   | 3        | 2       | 3       | 8.9    | false |
| Tolcarne Apartments | Apartment | 1764  | 3        | 1       | 4       | 9.3    | true  |
| Tolcarne Apartments | Apartment | 1605  | 3        | 1       | 4       | 9.3    | true  |
| Tehidy Holiday Park | Cottage   | 637   | 4        | 2       | 4       | 9.0    | false |
Introduzione a Polars

Metadati del DataFrame

rentals.shape
(49, 8)
rentals.columns
['name', 'type', 'price', 'bedrooms', 'doubles', 'singles', 'review', 'beach']
Introduzione a Polars

Schema del DataFrame

rentals.schema
Schema([('name', String),
        ('type', String),
        ('price', Int64),
        ('bedrooms', Int64),
        ('doubles', Int64),
        ('singles', Int64),
        ('review', Float64),
        ('beach', Boolean)])
Introduzione a Polars

Ispezionare un DataFrame

rentals.glimpse()
Rows: 49
Columns: 8
$ name      <str> 'Waves', 'Seashells', 'Lake view', 'Piran View',...
$ type      <str> 'Cottage', 'Cottage', 'Cottage', None, 'Cottage',...
$ price     <i64> 540, 540, 714, 775, 1772, 934, 1947, 1026, 705, 863
$ bedrooms  <i64> 4, 4, 3, None, 4, 3, 4, 3, 4, 3
$ doubles   <i64> 1, 2, 1, 1, 1, 1, 1, 1, 1, 1
$ singles   <i64> 2, 2, 4, 3, 2, 4, 2, 4, 2, 2
$ review    <f64> 8.9, 8.7, 9.2, 9.6, 9.6, 8.6, 9.6, 8.6, 9.7, 9.1
$ beach    <bool> False, True, True, False, True, True, True, True, True, True
Introduzione a Polars

Vamos praticar!

Introduzione a Polars

Preparing Video For Download...