Manipulación y análisis de datos

Importación de datos en Java

Anthony Markham

VP Quant Developer

Selección de columnas

  • .selectColumns() crea un nuevo objeto Table
// Selecciona columnas específicas por nombre
Table nameAndSalary = employees.selectColumns("Name", "Salary");
// Selecciona por tipo de columna
Table numericColumns = employees.selectColumns(
    column -> column.type().equals(ColumnType.DOUBLE) ||
    column.type().equals(ColumnType.INTEGER));
Importación de datos en Java

Filtrado de datos

  • Filtra filas con .where()
  • Devuelve un nuevo objeto Table
// Filtra con una sola condición
Table seniors = employees.where(
    employees.intColumn("Age").isGreaterThanOrEqualTo(65));
// Filtrado usando múltiples condiciones
Table targetGroup = employees.where(
    employees.intColumn("Age").isBetweenInclusive(30, 50)
        .and(employees.doubleColumn("Salary")
            .isGreaterThan(75000)));
Importación de datos en Java

Ordenación de datos

  • Organiza datos con .sortOn()
    • Ordena de forma ascendente
  • Devuelve una tabla ordenada
  • .sortDescendingOn() para orden descendente
// Ordena por una sola columna (ascendente)
Table sortedBySalary = employees.sortOn("Salary");
// Ordena por múltiples columnas (dirección personalizada)
Table complexSort = employees
    .sortOn("Department") 
    .sortDescendingOn("Salary");
Importación de datos en Java

Agregación con summarize

  • Calcula estadísticas con .summarize()
  • Devuelve una nueva tabla
import tech.tablesaw.aggregate.AggregateFunctions.*;
// Resume salario
Table deptSummary = employees.summarize("Salary", mean, count, max).apply();
Media [Salary] Cuenta [Salary] Máx [Salary]
113606.20299999935 1000 199793
  • Se aplica a todas las columnas numéricas por defecto
Importación de datos en Java

Agregación con summarize

  • Agregaciones más complejas son posibles
// Múltiples agregaciones
Table complexSummary = employees.summarize(
    "Salary", "Age", 
    mean, median, min, max).apply();
Media [Salary] Mediana [Salary] Mín [Salary] Máx [Salary] Media [Age] Mediana [Age] Mín [Age] Máx [Age]
113606.2029 112667 30301 199793 45.6699 46 22 70
Importación de datos en Java

Métodos básicos de manipulación

  • .select() - Elige columnas específicas
    Table selected = employees.select("Name", "Salary");
    
  • .where() - Filtra filas según condiciones
    Table filtered = employees.where(condition);
    
  • .sortOn() - Ordena datos por columnas
    Table sorted = employees.sortOn("Department", "Salary");
    
  • .summarize() - Calcula estadísticas
    Table summary = employees.summarize("Salary", mean, max).apply();
    
Importación de datos en Java

¡Vamos a practicar!

Importación de datos en Java

Preparing Video For Download...