Création de DataFrames

Manipulation de données avec pandas

Maggie Matsui

Senior Content Developer at DataCamp

Dictionnaires

my_dict = {
    "key1": value1,
    "key2": value2,
    "key3": value3
}
my_dict["key1"]
value1
my_dict = {
    "title": "Charlotte's Web",
    "author": "E.B. White",
    "published": 1952
}
my_dict["title"]
Charlotte's Web
Manipulation de données avec pandas

Création de DataFrames

À partir d’une liste de dictionnaires

  • Construit ligne par ligne

 

Plusieurs dictionnaires entre crochets, représentant une liste de dictionnaires.

À partir d’un dictionnaire de listes

  • Construit colonne par colonne

 

Plusieurs paires de crochets à l’intérieur d’un dictionnaire, représentant un dictionnaire de listes.

Manipulation de données avec pandas

Liste de dictionnaires : par ligne

nom race taille (cm) poids (kg) date de naissance
Ginger Teckel 22 10 2019-03-14
Scout Dalmatien 59 25 2019-05-09
list_of_dicts = [

{"name": "Ginger", "breed": "Dachshund", "height_cm": 22, "weight_kg": 10, "date_of_birth": "2019-03-14"},
{"name": "Scout", "breed": "Dalmatian", "height_cm": 59, "weight_kg": 25, "date_of_birth": "2019-05-09"}
]
Manipulation de données avec pandas

Liste de dictionnaires : par ligne

nom race taille (cm) poids (kg) date de naissance
Ginger Teckel 22 10 2019-03-14
Scout Dalmatien 59 25 2019-05-09
new_dogs = pd.DataFrame(list_of_dicts)
print(new_dogs)
     name      breed  height_cm  weight_kg date_of_birth
0  Ginger  Dachshund         22         10    2019-03-14
1   Scout  Dalmatian         59         25    2019-05-09
Manipulation de données avec pandas

Dictionnaire de listes : par colonne

nom race taille poids date de naissance
Ginger Teckel 22 10 2019-03-14
Scout Dalmatien 59 25 2019-05-09

 

  • Clé = nom de la colonne
  • Valeur = liste des valeurs de colonne
dict_of_lists = {

"name": ["Ginger", "Scout"],
"breed": ["Dachshund", "Dalmatian"],
"height_cm": [22, 59],
"weight_kg": [10, 25],
"date_of_birth": ["2019-03-14", "2019-05-09"]
}
new_dogs = pd.DataFrame(dict_of_lists)
Manipulation de données avec pandas

Dictionnaire de listes : par colonne

nom race taille (cm) poids (kg) date de naissance
Ginger Teckel 22 10 2019-03-14
Scout Dalmatien 59 25 2019-05-09
print(new_dogs)
     name      breed  height_cm  weight_kg date_of_birth
0  Ginger  Dachshund         22         10    2019-03-14
1   Scout  Dalmatian         59         25    2019-05-09
Manipulation de données avec pandas

Passons à la pratique !

Manipulation de données avec pandas

Preparing Video For Download...