Grundlagen des Datenimports verstehen

Daten in Java importieren

Anthony Markham

VP Quant Developer

Lerne deinen Dozenten kennen!

 

$$

Anthony Markham

  • VP, Quantitativer Entwickler/Analytics Lead
  • C++/Java/Python-Entwickler im Investmentbanking
  • Universitäre Lehrerfahrung

 

Anthony Markham

Daten in Java importieren

Grundlagen des Datenimports

  • Essenziell für die Verarbeitung externer Informationen in Java-Anwendungen

  • Häufige Formate sind CSV (kommagetrennte Werte), JSON und Excel

Flussdiagramm mit den fünf Schritten im Import-Workflow

  • Java bietet robuste Werkzeuge in den Paketen java.io und java.nio
Daten in Java importieren

Grundlagen der Dateiverarbeitung

  • Die File-Klasse repräsentiert Dateien oder Verzeichnisse
  • Methoden wie exists(), length() und isDirectory() ermöglichen die Validierung unserer Datei
import java.io.File;
File dataFile = new File("data.csv");
boolean exists = dataFile.exists();
long size = dataFile.length();
boolean isDirectory = dataFile.isDirectory();
Daten in Java importieren

Das Path-Interface und die Files-Klasse

  • Path-Interface und Files-Klasse bieten moderne Dateioperationen (java.nio)
  • Vorteile: Mehr Flexibilität, bessere Fehlerbehandlung und Leistung
  • java.io für einfache Dateioperationen; java.nio für leistungsstarke Ein-/Ausgabeoperationen
import java.nio.file.Path;
import java.nio.file.Paths;
import java.nio.file.Files;
Path dataPath = Paths.get("data.csv");

boolean exists = Files.exists(dataPath); long size = Files.size(dataPath);
Daten in Java importieren

Textdateien lesen

  • Files.readAllLines(): Liest die gesamte Datei in List<String> (ein Element pro Zeile)
  • Files.readString(): Liest die gesamte Datei als einen String
Path file = Paths.get("data.csv");

// Alle Zeilen auf einmal lesen List<String> lines = Files.readAllLines(file); // Ganze Datei als String lesen String content = Files.readString(file);

$$

$$

  • Die gesamte Datei wird in den Speicher geladen 🛑
Daten in Java importieren

Datenvalidierung

  • Sicherstellung der Datenqualität vor der Verarbeitung
  • Datenqualität und Struktur prüfen
  • Häufige Validierungen durchführen
  • Exception behandeln

Datenvalidierungsprüfungen

Daten in Java importieren

Datenvalidierung

  • Häufige Prüfungen: Datei nicht leer, erforderliche Spalten im Header
  • Exception mit try-catch-Block behandeln ✅
try {
  Path file = Paths.get("data.csv");
  List<String> lines = Files.readAllLines(file);
  if (lines.isEmpty()) { // Prüfen, ob Datei Inhalt hat
      System.out.println("Warnung: Datei ist leer");}
  String header = lines.get(0);
  if (!header.contains("id") || !header.contains("name")) {    // Header prüfen
      System.out.println("Fehler: Datei fehlt erforderliche Spalten");
} catch (Exception e) {
    System.out.println("Fehler beim Lesen der Datei: " + e.getMessage());}
Daten in Java importieren

Zusammenfassung

Klasse/Interface Methode Beschreibung
File new File() Erstellt eine abstrakte Darstellung eines Dateipfads
File exists() Prüft, ob eine Datei existiert
File length() Gibt die Dateigröße in Bytes an
Paths get() Erstellt ein Path-Objekt aus einem String
Files exists() Prüft, ob eine Datei existiert (moderne API)
Files size() Gibt die Dateigröße in Bytes an (moderne API)
Files readAllLines() Liest die gesamte Datei in List<String>
Files readString() Liest die gesamte Datei in einen String
1 https://docs.oracle.com/javase/8/docs/api/java/nio/file/Files.html
Daten in Java importieren

Lass uns üben!

Daten in Java importieren

Preparing Video For Download...