Importando arquivos HDF5

Introdução à importação de dados em Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Arquivos HDF5

  • Hierarchical Data Format versão 5
  • Padrão para armazenar grandes quantidades de dados numéricos
  • Conjuntos de dados podem ter centenas de GB ou TB
  • HDF5 escala até exabytes
Introdução à importação de dados em Python

Importando arquivos HDF5

import h5py
filename = 'H-H1_LOSC_4_V1-815411200-4096.hdf5'
data = h5py.File(filename, 'r') # 'r' é para leitura
print(type(data))
<class 'h5py._hl.files.File'>
Introdução à importação de dados em Python

A estrutura de arquivos HDF5

for key in data.keys():
    print(key)
meta
quality
strain
print(type(data['meta']))
<class 'h5py._hl.group.Group'>

ch_2_3.014.png

Introdução à importação de dados em Python

A estrutura de arquivos HDF5

for key in data['meta'].keys():
    print(key)
Description
DescriptionURL
Detector
Duration
GPSstart
Observatory
Type
UTCstart
print(np.array(data['meta']['Description']), np.array(data['meta']['Detector']))
b'Strain data time series from LIGO' b'H1'
Introdução à importação de dados em Python

O Projeto HDF

  • Mantido ativamente pelo HDF Group

ch_2_3.019.png

  • Sediado em Champaign, Illinois
Introdução à importação de dados em Python

Vamos praticar!

Introdução à importação de dados em Python

Preparing Video For Download...