La importancia de los archivos planos en ciencia de datos

Introducción a la importación de datos en Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Archivos planos

titanic.csv

PassengerId,Survived,Pclass,Name,Gender,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S
2,1,1,"Cumings, Mrs. John Bradley",female,38,1,0,PC 17599,71.2833,C85,C
3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2.3101282,7.925,,S
Introducción a la importación de datos en Python

Archivos planos

titanic.csv

PassengerId,Survived,Pclass,Name,Gender,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked

1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S

2,1,1,"Cumings, Mrs. John Bradley",female,38,1,0,PC 17599,71.2833,C85,C

3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2.3101282,7.925,,S

arrow

                        Name      Sex  Cabin  Survived
     Braund, Mr. Owen Harris     male    NaN         0
  Cumings, Mrs. John Bradley   female    C85         1
      Heikkinen, Miss. Laina   female    NaN         1
Futrelle, Mrs. Jacques Heath   female   C123         1
    Allen, Mr. William Henry     male    NaN         0
Introducción a la importación de datos en Python

Archivos planos

titanic.csv

titanic.csv con una fila resaltada arrow

                        Name      Sex  Cabin  Survived
     Braund, Mr. Owen Harris     male    NaN         0
  Cumings, Mrs. John Bradley   female    C85         1
      Heikkinen, Miss. Laina   female    NaN         1
Introducción a la importación de datos en Python

Archivos planos

titanic.csv

titanic.csv con una columna resaltada arrow

                        Name      Sex  Cabin  Survived
     Braund, Mr. Owen Harris     male    NaN         0
  Cumings, Mrs. John Bradley   female    C85         1
      Heikkinen, Miss. Laina   female    NaN         1
Introducción a la importación de datos en Python

Archivos planos

  • Archivos de texto con registros
  • Es decir, datos en tabla
  • Registro: fila de campos o atributos

 

titanic.csv

PassengerId,Survived,Pclass,Name,Gender,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S
2,1,1,"Cumings, Mrs. John Bradley",female,38,1,0,PC 17599,71.2833,C85,C
3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2.3101282,7.925,,S
Introducción a la importación de datos en Python

Archivos planos

  • Archivos de texto con registros
  • Es decir, datos en tabla
  • Registro: fila de campos o atributos
  • Columna: característica o atributo

titanic.csv

titanic.csv con una fila resaltada arrow

Introducción a la importación de datos en Python

Archivos planos

  • Archivos de texto con registros
  • Es decir, datos en tabla
  • Registro: fila de campos o atributos
  • Columna: característica o atributo

titanic.csv

titanic.csv con una columna resaltada arrow

Introducción a la importación de datos en Python

Encabezado

titanic.csv

________________________________________________________________________
PassengerId,Survived,Pclass,Name,Gender,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
________________________________________________________________________
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S   
2,1,1,"Cumings, Mrs. John Bradley",female,38,1,0,PC 17599,71.2833,C85,C
3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2.3101282,7.925,,S
Introducción a la importación de datos en Python

Encabezado

titanic.csv

________________________________________________________________________
PassengerId,Survived,Pclass,Name,Gender,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
________________________________________________________________________
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S   
2,1,1,"Cumings, Mrs. John Bradley",female,38,1,0,PC 17599,71.2833,C85,C
3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2.3101282,7.925,,S
Introducción a la importación de datos en Python

Extensión de archivo

  • .csv - Valores separados por comas
  • .txt - Archivo de texto
  • comas, tabulaciones - Delimitadores
Introducción a la importación de datos en Python

Archivo con tabuladores

MNIST.txt

pixel149    pixel150    pixel151    pixel152    pixel153
0           0           0           0           0    
86          250         254         254         254    
0           0           0           9           254    
0           0           0           0           0    
103         253         253         253         253    
0           0           0           0           0    
0           0           0           0           0        
0           0           0           0           41        
253         253         253         253         253    
Introducción a la importación de datos en Python

Archivo con tabuladores

MNIST.txt

pixel149    pixel150    pixel151    pixel152    pixel153
0           0           0           0           0    
86          250         254         254         254    
0           0           0           9           254    
0           0           0           0           0    
103         253         253         253         253    
0           0           0           0           0    
0           0           0           0           0        
0           0           0           0           41        
253         253         253         253         253    

                                         Imagen MNIST: mnist.png

Introducción a la importación de datos en Python

¿Cómo importar archivos planos?

  • Dos paquetes principales: NumPy y pandas

ch_1_2.026.png

  • Aquí aprenderás a importar:
    • Archivos planos con datos numéricos (MNIST)
    • Archivos planos con datos numéricos y cadenas (titanic.csv)
Introducción a la importación de datos en Python

¡Vamos a practicar!

Introducción a la importación de datos en Python

Preparing Video For Download...