Importar archivos planos con pandas

Introducción a la importación de datos en Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Lo que necesita una persona de datos

  • Estructura de datos bidimensional con etiquetas
  • Columnas de tipos potencialmente distintos
  • Manipular, dividir, reestructurar, groupby, join, merge
  • Calcular estadísticas
  • Trabajar con series temporales
Introducción a la importación de datos en Python

Pandas y el DataFrame

ch_1_4.009.png

Introducción a la importación de datos en Python

Pandas y el DataFrame

ch_1_4.010.png

Introducción a la importación de datos en Python

Pandas y el DataFrame

ch_1_4.012.png

  • DataFrame = análogo en Python del data frame de R
Introducción a la importación de datos en Python

Pandas y el DataFrame

ch_1_4.015.png

Introducción a la importación de datos en Python

Manipular DataFrames de pandas

  • Análisis exploratorio de datos
  • Limpieza de datos
  • Preprocesamiento de datos
  • Creación de modelos
  • Visualización
  • Estándares y buenas prácticas con pandas
Introducción a la importación de datos en Python

Importar con pandas

import pandas as pd

filename = 'winequality-red.csv' data = pd.read_csv(filename)
data.head()
   volatile acidity  citric acid  residual sugar
0              0.70         0.00             1.9
1              0.88         0.00             2.6
2              0.76         0.04             2.3
3              0.28         0.56             1.9
4              0.70         0.00             1.9
data_array = data.to_numpy()
Introducción a la importación de datos en Python

Verás:

  • Importar archivos planos de forma directa
  • Importar archivos planos con comentarios o valores faltantes
Introducción a la importación de datos en Python

¡Vamos a practicar!

Introducción a la importación de datos en Python

Preparing Video For Download...