Transformer du texte dans Power Query

Préparation des données dans Power BI

Maarten Van den Broeck

Content Developer at DataCamp

Qu'appelle-t-on des données textuelles propres ?

"- Sans fautes de frappe

  • Formaté de manière cohérente
  • Les points de données sont représentés de manière cohérente
  • Capitalisation uniforme
  • Aucun espace au début ou à la fin
  • Pas de ponctuation(!) ni de caractères de contrôle (\n, \r, etc.)
  • Idéalement, chaque colonne ne contiendra qu’une seule information
    • Les colonnes sont divisées ou fusionnées pour atteindre cet objectif
    • Uniform capitalization
    • No leading or trailing whitespace
    • No punctuation(!) or control characters (\n, \r, etc.)
  • Ideally, each column will only store one piece of information
    • Columns are split or merged to achieve this {{10}}"

"Yeelow -> Yellow

Une capture d'écran de Power Query montrant une table avec deux colonnes, l'une contenant des données brutes et l'autre des données nettoyées.

Une capture d'écran de Power Query montrant une table avec trois colonnes, l'une contenant plusieurs informations, et deux colonnes dérivées de cette colonne, chacune représentant une information. {{10}}"

Préparation des données dans Power BI

Comment nettoyer des données textuelles ?

"- Accessible depuis le ruban Transform

Une capture d’écran de l’interface Power Query montrant les options de transformation de texte

  • L’option Format permet de modifier la casse et accéder à Trim and Clean

  • Trim & Clean doit être appliqué à toutes les colonnes de texte

  • Trim : supprime les espaces en début et en fin de ligne
  • Clean : supprime les caractères de contrôle (nouvelle ligne, retour chariot, etc.)
  • Trim & Clean should be applied to all text columns
    • Trim - removes trailing and leading whitespace
    • Clean - removes control characters (new line, carriage return, etc.){{6}}"
Préparation des données dans Power BI

Fractionner et combiner des colonnes

"- Chaque colonne de votre jeu de données doit représenter une information distincte {{1}} - Il est parfois nécessaire de fractionner ou de joindre plusieurs colonnes {{2}} - Lorsqu'une colonne contient de nombreuses informations -> Fractionner

  • Adresse -> Bâtiment, Rue, Ville, Pays {{5}} - Lorsque deux colonnes ou plus peuvent être combinées pour représenter une seule information -> Combiner {{6}} - Prénom, Nom de famille -> Nom complet
  • When two or more columns can be combined to represent one piece of information -> Combine {{6}} - First Name, Last Name -> Full Name {{8}}"

"Une capture d'écran de Power Query montrant la transformation Fractionner la colonne et ses options

Une capture d'écran de Power Query montrant la transformation Fusionner les colonnes {{7}}"

Préparation des données dans Power BI

Passons à la pratique !

Préparation des données dans Power BI

Preparing Video For Download...