Pengenalan Polars DataFrame

Pengantar Polars

Liam Brannigan

Data Scientist and Polars Contributor

Kenali instruktur Anda

$$

  • Liam Brannigan, Lead Data Scientist
  • Spesialis ML dan Data Engineering
  • Kontributor Polars

Foto profil instruktur.

Pengantar Polars

Data tabular

shape: (49, 8)
| name        | type    | price | bedrooms | doubles | singles | review | beach |
| ---         | ---     | ---   | ---      | ---     | ---     | ---    | ---   |
| str         | str     | i64   | i64      | i64     | i64     | f64    | bool  |
|-------------|---------|-------|----------|---------|---------|--------|-------|
| Waves       | Cottage | 540   | 4        | 1       | 2       | 8.9    | false |
| Seashells   | Cottage | 540   | 4        | 2       | 2       | 8.7    | true  |
| Lake view   | Cottage | 714   | 3        | 1       | 4       | 9.2    | true  |
| Piran View  | null    | 775   | null     | 1       | 3       | 9.6    | false |
| Palma Villa | Cottage | 1772  | 4        | 1       | 2       | 9.6    | true  |
Pengantar Polars

Gambar berdampingan: Beruang kutub berjalan di salju dan Panda di hutan.

  • Polars biasanya lebih cepat dari Pandas → komputasi paralel
  • Mode malas Polars memungkinkan kueri teroptimasi
Pengantar Polars

Logo Apache Arrow dan Rust.

  • Apache Arrow: menyimpan data tabular di memori
  • Rust: bahasa cepat untuk pemrosesan data
Pengantar Polars

Skema basis data untuk menggambarkan pemuatan data.

  • Memuat dan meninjau data
Pengantar Polars

Skema basis data dan roda gigi untuk menggambarkan transformasi.

  • Memuat dan meninjau data
  • Transformasi data dan optimasi
Pengantar Polars

Skema basis data, roda gigi, dan bagan untuk menggambarkan analisis.

  • Memuat dan meninjau data
  • Transformasi data dan optimasi
  • Analisis data
Pengantar Polars

Membaca CSV

import polars as pl


rentals = pl.read_csv("vacation_rentals.csv")
Pengantar Polars

Baris pertama DataFrame

rentals.head(3)

Baris pertama DataFrame rentals.

Pengantar Polars

Baris pertama DataFrame

rentals.head(3)

DataFrame rentals dengan shape disorot.

Pengantar Polars

Baris pertama DataFrame

rentals.head(3)

DataFrame rentals dengan kolom pertama disorot.

  • dtype: jenis data dalam kolom
Pengantar Polars

Baris pertama DataFrame

rentals.head(3)

DataFrame rentals dengan kolom rentals disorot.

Pengantar Polars

Baris terakhir DataFrame

rentals.tail()
shape: (5, 8)
| name                | type      | price | bedrooms | doubles | singles | review | beach |
| ---                 | ---       | ---   | ---      | ---     | ---     | ---    | ---   |
| str                 | str       | i64   | i64      | i64     | i64     | f64    | bool  |
|---------------------|-----------|-------|----------|---------|---------|--------|-------|
| Hengar Manor House  | Cottage   | 615   | 4        | 1       | 5       | 9.4    | false |
| Tudor Cottage Hayle | Cottage   | 489   | 3        | 2       | 3       | 8.9    | false |
| Tolcarne Apartments | Apartment | 1764  | 3        | 1       | 4       | 9.3    | true  |
| Tolcarne Apartments | Apartment | 1605  | 3        | 1       | 4       | 9.3    | true  |
| Tehidy Holiday Park | Cottage   | 637   | 4        | 2       | 4       | 9.0    | false |
Pengantar Polars

Metadata DataFrame

rentals.shape
(49, 8)
rentals.columns
['name', 'type', 'price', 'bedrooms', 'doubles', 'singles', 'review', 'beach']
Pengantar Polars

Skema DataFrame

rentals.schema
Schema([('name', String),
        ('type', String),
        ('price', Int64),
        ('bedrooms', Int64),
        ('doubles', Int64),
        ('singles', Int64),
        ('review', Float64),
        ('beach', Boolean)])
Pengantar Polars

Meninjau DataFrame

rentals.glimpse()
Rows: 49
Columns: 8
$ name      <str> 'Waves', 'Seashells', 'Lake view', 'Piran View',...
$ type      <str> 'Cottage', 'Cottage', 'Cottage', None, 'Cottage',...
$ price     <i64> 540, 540, 714, 775, 1772, 934, 1947, 1026, 705, 863
$ bedrooms  <i64> 4, 4, 3, None, 4, 3, 4, 3, 4, 3
$ doubles   <i64> 1, 2, 1, 1, 1, 1, 1, 1, 1, 1
$ singles   <i64> 2, 2, 4, 3, 2, 4, 2, 4, 2, 2
$ review    <f64> 8.9, 8.7, 9.2, 9.6, 9.6, 8.6, 9.6, 8.6, 9.7, 9.1
$ beach    <bool> False, True, True, False, True, True, True, True, True, True
Pengantar Polars

Ayo berlatih!

Pengantar Polars

Preparing Video For Download...