Data manipulatie en analyse

Data importeren in Java

Anthony Markham

VP Quant Developer

Kolomselectie

  • .selectColumns() maakt een nieuw Table object
// Selecteer specifieke kolommen op naam
Table nameAndSalary = employees.selectColumns("Name", "Salary");
// Selecteer op kolomtype
Table numericColumns = employees.selectColumns(
    column -> column.type().equals(ColumnType.DOUBLE) ||
    column.type().equals(ColumnType.INTEGER));
Data importeren in Java

Data filteren

  • Filter rijen met .where()
  • Geeft een nieuw Table object terug
// Filter met een enkele voorwaarde
Table seniors = employees.where(
    employees.intColumn("Age").isGreaterThanOrEqualTo(65));
// Filteren met meerdere voorwaarden
Table targetGroup = employees.where(
    employees.intColumn("Age").isBetweenInclusive(30, 50)
        .and(employees.doubleColumn("Salary")
            .isGreaterThan(75000)));
Data importeren in Java

Data sorteren

  • Organiseer data met .sortOn()
    • Sorteert in oplopende volgorde
  • Geeft een nieuwe gesorteerde tabel terug
  • .sortDescendingOn() voor aflopende volgorde
// Sorteer op een enkele kolom (oplopend)
Table sortedBySalary = employees.sortOn("Salary");
// Sorteer op meerdere kolommen (aangepaste richting)
Table complexSort = employees
    .sortOn("Department") 
    .sortDescendingOn("Salary");
Data importeren in Java

Aggregatie met summarize

  • Bereken samenvattende statistieken met .summarize()
  • Geeft een nieuwe tabel terug
import tech.tablesaw.aggregate.AggregateFunctions.*;
// Samenvatten van salaris
Table deptSummary = employees.summarize("Salary", mean, count, max).apply();
Mean [Salary] Count [Salary] Max [Salary]
113606.20299999935 1000 199793
  • Toegepast op alle numerieke kolommen standaard
Data importeren in Java

Aggregatie met summarize

  • Meer complexe aggregaties zijn mogelijk
// Meerdere aggregaties
Table complexSummary = employees.summarize(
    "Salary", "Age", 
    mean, median, min, max).apply();
Mean [Salary] Median [Salary] Min [Salary] Max [Salary] Mean [Age] Median [Age] Min [Age] Max [Age]
113606.2029 112667 30301 199793 45.6699 46 22 70
Data importeren in Java

Kernmanipulatiemethoden

  • .select() - Kies specifieke kolommen
    Table selected = employees.select("Name", "Salary");
    
  • .where() - Filter rijen op basis van voorwaarden
    Table filtered = employees.where(condition);
    
  • .sortOn() - Sorteer data op kolommen
    Table sorted = employees.sortOn("Department", "Salary");
    
  • .summarize() - Bereken statistieken
    Table summary = employees.summarize("Salary", mean, max).apply();
    
Data importeren in Java

Laten we oefenen!

Data importeren in Java

Preparing Video For Download...