Datenmanipulation und -analyse

Daten in Java importieren

Anthony Markham

VP Quant Developer

Spaltenauswahl

  • .selectColumns() erstellt ein neues Table-Objekt
// Bestimmte Spalten nach Namen auswählen
Table nameAndSalary = employees.selectColumns("Name", "Salary");
// Nach Spaltentyp auswählen
Table numericColumns = employees.selectColumns(
    column -> column.type().equals(ColumnType.DOUBLE) ||
    column.type().equals(ColumnType.INTEGER));
Daten in Java importieren

Daten filtern

  • Zeilen mit .where() filtern
  • Gibt ein neues Table-Objekt zurück
// Mit einer Bedingung filtern
Table seniors = employees.where(
    employees.intColumn("Age").isGreaterThanOrEqualTo(65));
// Mit mehreren Bedingungen filtern
Table targetGroup = employees.where(
    employees.intColumn("Age").isBetweenInclusive(30, 50)
        .and(employees.doubleColumn("Salary")
            .isGreaterThan(75000)));
Daten in Java importieren

Daten sortieren

  • Daten mit .sortOn() organisieren
    • Sortiert aufsteigend
  • Gibt eine neue sortierte Tabelle zurück
  • .sortDescendingOn() für absteigende Sortierung
// Nach einer Spalte (aufsteigend) sortieren
Table sortedBySalary = employees.sortOn("Salary");
// Nach mehreren Spalten (benutzerdefinierte Richtung) sortieren
Table complexSort = employees
    .sortOn("Department") 
    .sortDescendingOn("Salary");
Daten in Java importieren

Aggregation mit summarize

  • Zusammenfassende Statistiken mit .summarize() berechnen
  • Gibt eine neue Tabelle zurück
import tech.tablesaw.aggregate.AggregateFunctions.*;
// Gehalt zusammenfassen
Table deptSummary = employees.summarize("Salary", mean, count, max).apply();
Mittelwert [Salary] Anzahl [Salary] Max [Salary]
113606.20299999935 1000 199793
  • Standardmäßig auf alle numerischen Spalten anwendbar
Daten in Java importieren

Aggregation mit summarize

  • Komplexere Aggregationen sind möglich
// Mehrfache Aggregationen
Table complexSummary = employees.summarize(
    "Salary", "Age", 
    mean, median, min, max).apply();
Mittelwert [Salary] Median [Salary] Min [Salary] Max [Salary] Mittelwert [Age] Median [Age] Min [Age] Max [Age]
113606.2029 112667 30301 199793 45.6699 46 22 70
Daten in Java importieren

Kernmanipulationsmethoden

  • .select() - Bestimmte Spalten auswählen
    Table selected = employees.select("Name", "Salary");
    
  • .where() - Zeilen nach Bedingungen filtern
    Table filtered = employees.where(condition);
    
  • .sortOn() - Daten nach Spalten sortieren
    Table sorted = employees.sortOn("Department", "Salary");
    
  • .summarize() - Statistiken berechnen
    Table summary = employees.summarize("Salary", mean, max).apply();
    
Daten in Java importieren

Lass uns üben!

Daten in Java importieren

Preparing Video For Download...