HDF5-Dateien importieren

Einführung in das Importieren von Daten in Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

HDF5-Dateien

  • Hierarchisches Datenformat Version 5
  • Standard für die Speicherung großer Mengen numerischer Daten
  • Datensätze können hunderte Gigabyte oder sogar Terabyte groß sein
  • HDF5 kann auf Exabytes skaliert werden
Einführung in das Importieren von Daten in Python

HDF5-Dateien importieren

import h5py
filename = 'H-H1_LOSC_4_V1-815411200-4096.hdf5'
data = h5py.File(filename, 'r') # 'r' is to read
print(type(data))
<class 'h5py._hl.files.File'>
Einführung in das Importieren von Daten in Python

Der Aufbau von HDF5-Dateien

for key in data.keys():
    print(key)
meta
quality
strain
print(type(data['meta']))
<class 'h5py._hl.group.Group'>

ch_2_3.014.png

Einführung in das Importieren von Daten in Python

Der Aufbau von HDF5-Dateien

for key in data['meta'].keys():
    print(key)
Description
DescriptionURL
Detector
Duration
GPSstart
Observatory
Type
UTCstart
print(np.array(data['meta']['Description']), np.array(data['meta']['Detector']))
b'Strain data time series from LIGO' b'H1'
Einführung in das Importieren von Daten in Python

Das HDF-Projekt

  • Wird aktiv von der HDF-Gruppe gepflegt

ch_2_3.019.png

  • Sitz in Champaign, Illinois
Einführung in das Importieren von Daten in Python

Lass uns üben!

Einführung in das Importieren von Daten in Python

Preparing Video For Download...