Die Bedeutung von Flat Files in der Data Science

Einführung in das Importieren von Daten in Python

Hugo Bowne-Anderson

Data Scientist at DataCamp

Flat Files

titanic.csv

PassengerId,Survived,Pclass,Name,Gender,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S
2,1,1,"Cumings, Mrs. John Bradley",female,38,1,0,PC 17599,71.2833,C85,C
3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2.3101282,7.925,,S
Einführung in das Importieren von Daten in Python

Flat Files

titanic.csv

PassengerId,Survived,Pclass,Name,Gender,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked

1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S

2,1,1,"Cumings, Mrs. John Bradley",female,38,1,0,PC 17599,71.2833,C85,C

3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2.3101282,7.925,,S

Pfeil

                        Name      Sex  Cabin  Survived
     Braund, Mr. Owen Harris     male    NaN         0
  Cumings, Mrs. John Bradley   female    C85         1
      Heikkinen, Miss. Laina   female    NaN         1
Futrelle, Mrs. Jacques Heath   female   C123         1
    Allen, Mr. William Henry     male    NaN         0
Einführung in das Importieren von Daten in Python

Flat Files

titanic.csv

titanic.csv mit einer hervorgehobenen Zeile Pfeil

                        Name      Sex  Cabin  Survived
     Braund, Mr. Owen Harris     male    NaN         0
  Cumings, Mrs. John Bradley   female    C85         1
      Heikkinen, Miss. Laina   female    NaN         1
Einführung in das Importieren von Daten in Python

Flat Files

titanic.csv

titanic.csv mit einer markierten Spalte Pfeil

                        Name      Sex  Cabin  Survived
     Braund, Mr. Owen Harris     male    NaN         0
  Cumings, Mrs. John Bradley   female    C85         1
      Heikkinen, Miss. Laina   female    NaN         1
Einführung in das Importieren von Daten in Python

Flat Files

  • Textdateien mit Datensätzen
  • Also, die Tabellendaten
  • Datensatz: Reihe von Feldern oder Attributen

 

titanic.csv

PassengerId,Survived,Pclass,Name,Gender,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S
2,1,1,"Cumings, Mrs. John Bradley",female,38,1,0,PC 17599,71.2833,C85,C
3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2.3101282,7.925,,S
Einführung in das Importieren von Daten in Python

Flat Files

  • Textdateien mit Datensätzen
  • Also, die Tabellendaten
  • Datensatz: Reihe von Feldern oder Attributen
  • Spalte: Merkmal oder Eigenschaft

titanic.csv

titanic.csv mit einer hervorgehobenen Zeile Pfeil

Einführung in das Importieren von Daten in Python

Flat Files

  • Textdateien mit Datensätzen
  • Also, die Tabellendaten
  • Datensatz: Reihe von Feldern oder Attributen
  • Spalte: Merkmal oder Eigenschaft

titanic.csv

titanic.csv mit einer markierten Spalte Pfeil

Einführung in das Importieren von Daten in Python

Kopfzeile

titanic.csv

________________________________________________________________________
PassengerId,Survived,Pclass,Name,Gender,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
________________________________________________________________________
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S   
2,1,1,"Cumings, Mrs. John Bradley",female,38,1,0,PC 17599,71.2833,C85,C
3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2.3101282,7.925,,S
Einführung in das Importieren von Daten in Python

Kopfzeile

titanic.csv

________________________________________________________________________
PassengerId,Survived,Pclass,Name,Gender,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
________________________________________________________________________
1,0,3,"Braund, Mr. Owen Harris",male,22,1,0,A/5 21171,7.25,,S   
2,1,1,"Cumings, Mrs. John Bradley",female,38,1,0,PC 17599,71.2833,C85,C
3,1,3,"Heikkinen, Miss. Laina",female,26,0,0,STON/O2.3101282,7.925,,S
Einführung in das Importieren von Daten in Python

Dateiendung

  • .csv = Comma-Separated Values (dt.: durch Kommas getrennte Werte)
  • .txt – Textdatei
  • Kommas, Tabulatoren – Trennzeichen
Einführung in das Importieren von Daten in Python

Tabulator-getrennte Datei

MNIST.txt

pixel149    pixel150    pixel151    pixel152    pixel153
0           0           0           0           0    
86          250         254         254         254    
0           0           0           9           254    
0           0           0           0           0    
103         253         253         253         253    
0           0           0           0           0    
0           0           0           0           0        
0           0           0           0           41        
253         253         253         253         253    
Einführung in das Importieren von Daten in Python

Tabulator-getrennte Datei

MNIST.txt

pixel149    pixel150    pixel151    pixel152    pixel153
0           0           0           0           0    
86          250         254         254         254    
0           0           0           9           254    
0           0           0           0           0    
103         253         253         253         253    
0           0           0           0           0    
0           0           0           0           0        
0           0           0           0           41        
253         253         253         253         253    

                                         MNIST-Bild: mnist.png

Einführung in das Importieren von Daten in Python

Wie importiert man Flat Files?

  • Zwei Hauptpakete: NumPy, pandas

ch_1_2.026.png

  • Hier erfährst du, wie du Folgendes importierst:
    • Flat Files mit numerischen Daten (MNIST)
    • Flat Files mit numerischen Daten und Zeichenfolgen (titanic.csv)
Einführung in das Importieren von Daten in Python

Lass uns üben!

Einführung in das Importieren von Daten in Python

Preparing Video For Download...