Importación de archivos HDF5

Introducción a la importación de datos en Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Archivos HDF5

  • Formato Jerárquico de Datos versión 5
  • Estándar para grandes volúmenes de datos numéricos
  • Conjuntos de datos de cientos de GB o TB
  • HDF5 escala hasta exabytes
Introducción a la importación de datos en Python

Importación de archivos HDF5

import h5py
filename = 'H-H1_LOSC_4_V1-815411200-4096.hdf5'
data = h5py.File(filename, 'r') # 'r' es para leer
print(type(data))
<class 'h5py._hl.files.File'>
Introducción a la importación de datos en Python

Estructura de los archivos HDF5

for key in data.keys():
    print(key)
meta
quality
strain
print(type(data['meta']))
<class 'h5py._hl.group.Group'>

ch_2_3.014.png

Introducción a la importación de datos en Python

Estructura de los archivos HDF5

for key in data['meta'].keys():
    print(key)
Description
DescriptionURL
Detector
Duration
GPSstart
Observatory
Type
UTCstart
print(np.array(data['meta']['Description']), np.array(data['meta']['Detector']))
b'Strain data time series from LIGO' b'H1'
Introducción a la importación de datos en Python

El proyecto HDF

  • Mantenido activamente por The HDF Group

ch_2_3.019.png

  • Con sede en Champaign, Illinois
Introducción a la importación de datos en Python

¡Vamos a practicar!

Introducción a la importación de datos en Python

Preparing Video For Download...