Manipulation et analyse de données

Importer des données en Java

Anthony Markham

VP Quant Developer

Sélection de colonnes

  • .selectColumns() crée un nouvel objet Table
// Sélectionner des colonnes spécifiques par nom
Table nameAndSalary = employees.selectColumns("Name", "Salary");
// Sélectionner par type de colonne
Table numericColumns = employees.selectColumns(
    column -> column.type().equals(ColumnType.DOUBLE) ||
    column.type().equals(ColumnType.INTEGER));
Importer des données en Java

Filtrage des données

  • Filtrer les lignes avec .where()
  • Retourne un nouvel objet Table
// Filtrer avec une seule condition
Table seniors = employees.where(
    employees.intColumn("Age").isGreaterThanOrEqualTo(65));
// Filtrer avec plusieurs conditions
Table targetGroup = employees.where(
    employees.intColumn("Age").isBetweenInclusive(30, 50)
        .and(employees.doubleColumn("Salary")
            .isGreaterThan(75000)));
Importer des données en Java

Tri des données

  • Organiser les données avec .sortOn()
    • Trie par ordre croissant
  • Retourne une nouvelle table triée
  • .sortDescendingOn() pour l'ordre décroissant
// Trier par une colonne (croissant)
Table sortedBySalary = employees.sortOn("Salary");
// Trier par plusieurs colonnes (direction personnalisée)
Table complexSort = employees
    .sortOn("Department") 
    .sortDescendingOn("Salary");
Importer des données en Java

Agrégation avec summarize

  • Calculer des statistiques avec .summarize()
  • Retourne une nouvelle table
import tech.tablesaw.aggregate.AggregateFunctions.*;
// Résumer le salaire
Table deptSummary = employees.summarize("Salary", mean, count, max).apply();
Moyenne [Salary] Compte [Salary] Max [Salary]
113606.20299999935 1000 199793
  • S'applique par défaut à toutes les colonnes numériques
Importer des données en Java

Agrégation avec summarize

  • Des agrégations plus complexes sont possibles
// Agrégations multiples
Table complexSummary = employees.summarize(
    "Salary", "Age", 
    mean, median, min, max).apply();
Moyenne [Salary] Médiane [Salary] Min [Salary] Max [Salary] Moyenne [Age] Médiane [Age] Min [Age] Max [Age]
113606.2029 112667 30301 199793 45.6699 46 22 70
Importer des données en Java

Méthodes de manipulation principales

  • .select() - Choisir des colonnes spécifiques
    Table selected = employees.select("Name", "Salary");
    
  • .where() - Filtrer les lignes selon des conditions
    Table filtered = employees.where(condition);
    
  • .sortOn() - Trier les données par colonnes
    Table sorted = employees.sortOn("Department", "Salary");
    
  • .summarize() - Calculer des statistiques
    Table summary = employees.summarize("Salary", mean, max).apply();
    
Importer des données en Java

Passons à la pratique !

Importer des données en Java

Preparing Video For Download...