Manipulação e análise de dados

Importando dados em Java

Anthony Markham

VP Quant Developer

Seleção de colunas

  • .selectColumns() cria um novo objeto Table
// Selecione colunas específicas por nome
Table nameAndSalary = employees.selectColumns("Name", "Salary");
// Selecione por tipo de coluna
Table numericColumns = employees.selectColumns(
    column -> column.type().equals(ColumnType.DOUBLE) ||
    column.type().equals(ColumnType.INTEGER));
Importando dados em Java

Filtragem de dados

  • Filtre linhas com .where()
  • Retorna um novo objeto Table
// Filtre com uma única condição
Table seniors = employees.where(
    employees.intColumn("Age").isGreaterThanOrEqualTo(65));
// Filtragem usando múltiplas condições
Table targetGroup = employees.where(
    employees.intColumn("Age").isBetweenInclusive(30, 50)
        .and(employees.doubleColumn("Salary")
            .isGreaterThan(75000)));
Importando dados em Java

Ordenação de dados

  • Organize dados com .sortOn()
    • Ordena em ordem crescente
  • Retorna uma nova tabela ordenada
  • .sortDescendingOn() para ordem decrescente
// Ordene por uma única coluna (crescente)
Table sortedBySalary = employees.sortOn("Salary");
// Ordene por múltiplas colunas (direção personalizada)
Table complexSort = employees
    .sortOn("Department") 
    .sortDescendingOn("Salary");
Importando dados em Java

Agregação com summarize

  • Calcule estatísticas resumidas com .summarize()
  • Retorna uma nova tabela
import tech.tablesaw.aggregate.AggregateFunctions.*;
// Resuma salário
Table deptSummary = employees.summarize("Salary", mean, count, max).apply();
Média [Salary] Contagem [Salary] Máx [Salary]
113606.20299999935 1000 199793
  • Aplica-se a todas as colunas numéricas por padrão
Importando dados em Java

Agregação com summarize

  • Agregações mais complexas são possíveis
// Múltiplas agregações
Table complexSummary = employees.summarize(
    "Salary", "Age", 
    mean, median, min, max).apply();
Média [Salary] Mediana [Salary] Mín [Salary] Máx [Salary] Média [Age] Mediana [Age] Mín [Age] Máx [Age]
113606.2029 112667 30301 199793 45.6699 46 22 70
Importando dados em Java

Métodos principais de manipulação

  • .select() - Escolha colunas específicas
    Table selected = employees.select("Name", "Salary");
    
  • .where() - Filtre linhas com base em condições
    Table filtered = employees.where(condition);
    
  • .sortOn() - Ordene dados por colunas
    Table sorted = employees.sortOn("Department", "Salary");
    
  • .summarize() - Calcule estatísticas
    Table summary = employees.summarize("Salary", mean, max).apply();
    
Importando dados em Java

Vamos praticar!

Importando dados em Java

Preparing Video For Download...