HDF5-bestanden importeren

Introductie tot data importeren in Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

HDF5-bestanden

  • Hierarchical Data Format versie 5
  • Standaard voor het opslaan van grote hoeveelheden numerieke data
  • Datasets kunnen honderden GB’s of zelfs TB’s zijn
  • HDF5 schaalt tot exabytes
Introductie tot data importeren in Python

HDF5-bestanden importeren

import h5py
filename = 'H-H1_LOSC_4_V1-815411200-4096.hdf5'
data = h5py.File(filename, 'r') # 'r' is to read
print(type(data))
<class 'h5py._hl.files.File'>
Introductie tot data importeren in Python

De structuur van HDF5-bestanden

for key in data.keys():
    print(key)
meta
quality
strain
print(type(data['meta']))
<class 'h5py._hl.group.Group'>

Structuur van HDF5-bestanden

Introductie tot data importeren in Python

De structuur van HDF5-bestanden

for key in data['meta'].keys():
    print(key)
Description
DescriptionURL
Detector
Duration
GPSstart
Observatory
Type
UTCstart
print(np.array(data['meta']['Description']), np.array(data['meta']['Detector']))
b'Strain data time series from LIGO' b'H1'
Introductie tot data importeren in Python

Het HDF-project

  • Actief onderhouden door de HDF Group

Het HDF-project

  • Gevestigd in Champaign, Illinois
Introductie tot data importeren in Python

Laten we oefenen!

Introductie tot data importeren in Python

Preparing Video For Download...