Introducción a otros tipos de archivos

Introducción a la importación de datos en Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Otros tipos de archivos

  • Hojas de cálculo de Excel
  • Archivos de MATLAB
  • Archivos de SAS
  • Archivos de Stata
  • Archivos HDF5
Introducción a la importación de datos en Python

Archivos pickle

  • Tipo de archivo nativo de Python
  • Motivación: muchos tipos de datos difíciles de almacenar
  • Los archivos pickle están serializados
  • Serializar = convertir un objeto en un flujo de bytes
Introducción a la importación de datos en Python

Archivos pickle

import pickle
with open('pickled_fruit.pkl', 'rb') as file:
    data = pickle.load(file)    
print(data)
{'peaches': 13, 'apples': 4, 'oranges': 11}
Introducción a la importación de datos en Python

Importar hojas de cálculo de Excel

import pandas as pd
file = 'urbanpop.xlsx'
data = pd.ExcelFile(file)
print(data.sheet_names)
['1960-1966', '1967-1974', '1975-2011']
df1 = data.parse('1960-1966') # sheet name, as a string
df2 = data.parse(0) # sheet index, as a float
Introducción a la importación de datos en Python

Aprenderás a:

  • Cómo personalizar la importación
  • Omitir filas
  • Importar columnas concretas
  • Cambiar nombres de columnas
Introducción a la importación de datos en Python

¡Vamos a practicar!

Introducción a la importación de datos en Python

Preparing Video For Download...