Pola Perjalanan Kerja

Menganalisis Data Sensus AS dengan Python

Lee Hachadoorian

Asst. Professor of Instruction, Temple University

Tabel Perjalanan Kerja

Topik Perjalanan Kerja

Moda transportasi (mobil, transportasi umum, dll.)
Waktu tempuh
Jam berangkat/tiba di tempat kerja

Geografi Perjalanan Kerja

Tempat tinggal: lokasi orang bermalam
Tempat kerja: lokasi bekerja; dapat digunakan untuk menghitung populasi tenaga kerja per county, tract, dll.

Harga Kemacetan di New York City

Sedang diperdebatkan di NYC (awal 2019)
Upaya sebelumnya gagal (2007)
Kekhawatiran biaya bagi rumah tangga berpendapatan rendah dan menengah

Foto dari atas menampilkan mobil dan taksi di jalan New York City.

¹ Foto oleh Brian Jeffery Beggerly (CC BY 2.0)

Tabel B08519: Moda Transportasi ke Tempat Kerja menurut Pendapatan Pekerja dalam 12 Bulan Terakhir (dalam Dolar 2017 disesuaikan inflasi) untuk Geografi Tempat Kerja

Total
    $1 hingga $9.999 atau rugi
    $10.000 hingga $14.999
    $15.000 hingga $24.999
    $25.000 hingga $34.999
    $35.000 hingga $49.999
    $50.000 hingga $64.999
    $65.000 hingga $74.999
    $75.000 atau lebih
Mobil truk atau van - menyetir sendiri
    <ulang kategori pendapatan>
Mobil truk atau van - berbagi tumpangan
    <ulang kategori pendapatan>
Transportasi umum (tidak termasuk taksi)
    <ulang kategori pendapatan>
 dll...

Respons API

print(r.json())

[['B08519_011E', 'B08519_012E', 'B08519_013E', 'B08519_014E', 'B08519_015E',
  'B08519_016E', 'B08519_017E', 'B08519_018E', 'B08519_020E', 'B08519_021E', 
  ... 
  'B08519_061E', 'B08519_062E', 'B08519_063E', 'state', 'county'], 
 ['10927', '9172', '19659', '22110', '32287', 
  '32977', '15693', '106972', '3663', '2518', 
  ...
  '7457', '2664', '20684', '36', '061']]

Merapikan Data

# Read data row into list
data_row = r.json()[1][:-2]

# Break data row into list of lists
iter_len = 8
data = [data_row[i:i+iter_len] for i in range(0, len(data_row), iter_len)]

print(data)

[['10927', '9172', '19659', '22110', '32287', '32977', '15693', '106972'], 
['3663', '2518', '5484', '5625', '8028', '7990', '3369', '22958'], 
['139358', '97178', '200514', '184510', '255491', '240973', '116673', '700808'], 
['16743', '9117', '15900', '13710', '17442', '20206', '10370', '85879'], ...]

Membangun DataFrame

# Define row names and column names
modes = ["drove_alone", "carpooled", "public", "walked", "taxi", 
         "worked_at_home"]

incomes = ["0k", "10k", "15k", "25k", "35k", "50k", "65k", "75k"]

# Create DataFrame
manhattan = pd.DataFrame(data=data, index=modes, columns=incomes)
manhattan = manhattan.astype(int)

Membangun DataFrame

print(manhattan)

                    0k    10k     15k   ...       50k     65k     75k
drove_alone      10716   8965   19294   ...     31502   15519  104078
carpooled         3740   2451    5852   ...      7994    3438   22625
public          140957  99474  197241   ...    235158  111959  654800
walked           16795   9045   15451   ...     20704   10663   83681
taxi              3201   2209    4515   ...      6551    3029   35572
worked_at_home    6854   3885    5489   ...      7776    2809   19598

[6 rows x 8 columns]

Membuat Heatmap

# Create heatmap of commuters by mode by income
sns.heatmap(manhattan, annot=manhattan // 1000, fmt="d", cmap="YlGnBu")

Heatmap dengan baris moda perjalanan dan kolom kategori pendapatan, diwarnai menurut jumlah komuter per sel. Baris transportasi umum lebih gelap, dan sel transportasi umum dengan pendapatan > $75.000 paling gelap.

Ayo berlatih!

Menganalisis Data Sensus AS dengan Python