Importation de fichiers HDF5

Introduction à l'importation de données en Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Fichiers HDF5

  • Format de données hiérarchique version 5
  • Norme pour le stockage de grandes quantités de données numériques
  • Les ensembles de données peuvent atteindre plusieurs centaines de gigaoctets ou téraoctets
  • HDF5 peut évoluer jusqu'à l'exaoctet
Introduction à l'importation de données en Python

Importation de fichiers HDF5

import h5py
filename = 'H-H1_LOSC_4_V1-815411200-4096.hdf5'
data = h5py.File(filename, 'r') # 'r' is to read
print(type(data))
<class 'h5py._hl.files.File'>
Introduction à l'importation de données en Python

La structure des fichiers HDF5

for key in data.keys():
    print(key)
meta
quality
strain
print(type(data['meta']))
<class 'h5py._hl.group.Group'>

ch_2_3.014.png

Introduction à l'importation de données en Python

La structure des fichiers HDF5

for key in data['meta'].keys():
    print(key)
Description
DescriptionURL
Detector
Duration
GPSstart
Observatory
Type
UTCstart
print(np.array(data['meta']['Description']), np.array(data['meta']['Detector']))
b'Strain data time series from LIGO' b'H1'
Introduction à l'importation de données en Python

Le projet HDF

  • Géré activement par le groupe HDF

ch_2_3.019.png

  • Situé à Champaign, dans l'Illinois
Introduction à l'importation de données en Python

Passons à la pratique !

Introduction à l'importation de données en Python

Preparing Video For Download...