Importar archivos planos desde la web

Importación intermedia de datos en Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

¡Ya eres genial importando!

  • Archivos planos como .txt y .csv

  • Archivos pickle, hojas de cálculo de Excel y más!

  • Datos de bases de datos relacionales

  • Puedes hacer todo esto localmente

  • ¿Y si tus datos están en línea?

Importación intermedia de datos en Python

¿Puedes importar datos web?

ch_1_1.010.png

  • Puedes: ir a la URL y hacer clic para descargar archivos
  • PERO: no es reproducible, no es escalable
Importación intermedia de datos en Python

Aprenderás a…

  • Importar y guardar datasets de la web localmente

  • Cargar datasets en DataFrames de pandas

  • Hacer solicitudes HTTP (solicitudes GET)

  • Extraer datos web como HTML

  • Analizar HTML en datos útiles (BeautifulSoup)

  • Usar los paquetes urllib y requests

Importación intermedia de datos en Python

El paquete urllib

  • Proporciona interfaz para obtener datos de la web
  • urlopen() - acepta URLs en lugar de nombres de archivo
Importación intermedia de datos en Python

Cómo automatizar la descarga de archivos en Python

from urllib.request import urlretrieve
url = 'http://archive.ics.uci.edu/ml/machine-learning-databases/wine-quality/
winequality-white.csv'
urlretrieve(url, 'winequality-white.csv')
('winequality-white.csv', <http.client.HTTPMessage at 0x103cf1128>)
Importación intermedia de datos en Python

¡Vamos a practicar!

Importación intermedia de datos en Python

Preparing Video For Download...