Menangani kolom data bertingkat

Mengubah Bentuk Data dengan pandas

Maria Eugenia Inzaugarat

Data Scientist

Ulasan

  • Cara membaca JSON bertingkat ke DataFrame dengan json_normalize().
Mengubah Bentuk Data dengan pandas

Data bertingkat di kolom

writers = ["Mary Shelley", "Ernest Hemingway"]
books = ["{'title': 'Frankenstein', 'year': 1818}", 
        "{'title': 'The Old Man and the Sea', 'year': 1951}"]

collection = pd.DataFrame( )
Mengubah Bentuk Data dengan pandas

Data bertingkat di kolom

writers = ["Mary Shelley", "Ernest Hemingway"]
books = ["{'title': 'Frankenstein', 'year': 1818}", 
        "{'title': 'The Old Man and the Sea', 'year': 1951}"]

collection = pd.DataFrame(dict( ))
Mengubah Bentuk Data dengan pandas

Data bertingkat di kolom

writers = ["Mary Shelley", "Ernest Hemingway"]
books = ['{"title": "Frankenstein", "year": "1818"}',
         '{"title": "The Old Man and the Sea", "year":"1951"}']

collection = pd.DataFrame(dict(writers=writers, books=books))
collection
            writers                                               books
0      Mary Shelley             {'title': 'Frankenstein', 'year': 1818}
1  Ernest Hemingway  {'title': 'The Old Man and the Sea', 'year': 1951}
Mengubah Bentuk Data dengan pandas

Mengonversi data bertingkat

import json

books = collection['books']
Mengubah Bentuk Data dengan pandas

Mengonversi data bertingkat

import json

books = collection['books'].apply( )
Mengubah Bentuk Data dengan pandas

Mengonversi data bertingkat

import json

books = collection['books'].apply(json.loads)
Mengubah Bentuk Data dengan pandas

Mengonversi data bertingkat

import json

books = collection['books'].apply(json.loads).apply(pd.Series)
books
                     title  year
0             Frankenstein  1818
1  The Old Man and the Sea  1951
Mengubah Bentuk Data dengan pandas

Gabungkan kembali

collection = collection.drop(columns='books')

pd.concat([collection, books], axis=1)
            writers                    title  year
0      Mary Shelley             Frankenstein  1818
1  Ernest Hemingway  The Old Man and the Sea  1951
Mengubah Bentuk Data dengan pandas

Mendump data bertingkat

import json
books = collection['books'].apply(json.loads)



Mengubah Bentuk Data dengan pandas

Mendump data bertingkat

import json
books = collection['books'].apply(json.loads).to_list()

books_dump = json.dumps(books)
new_books = pd.read_json(books_dump)
new_books
                     title  year
0             Frankenstein  1818
1  The Old Man and the Sea  1951
Mengubah Bentuk Data dengan pandas

Mendump data bertingkat

pd.concat([collection['writers'], new_books], axis=1)
            writers                    title  year
0      Mary Shelley             Frankenstein  1818
1  Ernest Hemingway  The Old Man and the Sea  1951
Mengubah Bentuk Data dengan pandas

Ayo berlatih!

Mengubah Bentuk Data dengan pandas

Preparing Video For Download...