Entendiendo los fundamentos de la importación de datos

Importación de datos en Java

Anthony Markham

VP Quant Developer

¡Conoce a tu instructor!

 

$$

Anthony Markham

  • VP, Desarrollador Cuantitativo/Líder de Análisis
  • Desarrollador C++/Java/Python en banca de inversión
  • Experiencia en enseñanza universitaria

 

Anthony Markham

Importación de datos en Java

Fundamentos de importación de datos

  • Esencial para procesar información externa en aplicaciones Java

  • Formatos comunes incluyen CSV (valores separados por comas), JSON y Excel

Diagrama de flujo mostrando los cinco pasos en el flujo de importación

  • Java ofrece herramientas robustas en los paquetes java.io y java.nio
Importación de datos en Java

Conceptos básicos de manejo de archivos

  • La clase File representa archivos o directorios
  • Métodos como exists(), length(), e isDirectory() nos permiten validar nuestro archivo
import java.io.File;
File dataFile = new File("data.csv");
boolean exists = dataFile.exists();
long size = dataFile.length();
boolean isDirectory = dataFile.isDirectory();
Importación de datos en Java

La interfaz Path y la clase Files

  • La interfaz Path y la clase Files proporcionan operaciones modernas de archivos (java.nio)
  • Beneficios: Más flexibilidad, mejor manejo de excepciones y rendimiento
  • java.io para operaciones simples; java.nio para operaciones de entrada/salida de alto rendimiento
import java.nio.file.Path;
import java.nio.file.Paths;
import java.nio.file.Files;
Path dataPath = Paths.get("data.csv");

boolean exists = Files.exists(dataPath); long size = Files.size(dataPath);
Importación de datos en Java

Leyendo archivos de texto

  • Files.readAllLines(): Lee todo el archivo en List<String> (un elemento por línea)
  • Files.readString(): Lee todo el archivo en una sola cadena
Path file = Paths.get("data.csv");

// Leer todas las líneas de una vez List<String> lines = Files.readAllLines(file); // Leer todo el archivo como una cadena String content = Files.readString(file);

$$

$$

  • Todo el archivo se carga en memoria 🛑
Importación de datos en Java

Validación de datos

  • Asegura la calidad de los datos antes de procesar
  • Verificar calidad y estructura de datos
  • Realizar validaciones comunes
  • Manejar cualquier Exception

Verificaciones de validación de datos

Importación de datos en Java

Validación de datos

  • Verificaciones comunes: verificar que el archivo no esté vacío, confirmar columnas requeridas en el encabezado
  • Manejar Exception con un bloque try-catch ✅
try {
  Path file = Paths.get("data.csv");
  List<String> lines = Files.readAllLines(file);
  if (lines.isEmpty()) { // Validar que el archivo tenga contenido
      System.out.println("Advertencia: El archivo está vacío");}
  String header = lines.get(0);
  if (!header.contains("id") || !header.contains("name")) {    // Verificar encabezado
      System.out.println("Error: Faltan columnas requeridas");
} catch (Exception e) {
    System.out.println("Error al leer el archivo: " + e.getMessage());}
Importación de datos en Java

Resumen

Clase/Interfaz Método Descripción
File new File() Crea una representación abstracta de una ruta de archivo
File exists() Verifica si un archivo existe
File length() Obtiene el tamaño del archivo en bytes
Paths get() Crea un objeto Path a partir de una cadena
Files exists() Verifica si un archivo existe (API moderna)
Files size() Obtiene el tamaño del archivo en bytes (API moderna)
Files readAllLines() Lee todo el archivo en List<String>
Files readString() Lee todo el archivo en una sola String
1 https://docs.oracle.com/javase/8/docs/api/java/nio/file/Files.html
Importación de datos en Java

¡Vamos a practicar!

Importación de datos en Java

Preparing Video For Download...