Auf der Suche nach den richtigen Daten

Strategien für künstliche Intelligenz (KI)

Vidhi Chugh

AI strategist and ethicist

Verfügbarkeit von Daten

  • Mehr Daten -> bessere Modellergebnisse

Model outcome

  • Nicht nur die Datenmenge
  • Kennzeichnung, Qualität und Aktualität
  • Das Modell erfasst und zeigt zugrundeliegende Muster

Underlying patterns

  • Datenzentrierte Wissenschaft
  • Die Daten systematisch aufbereiten
Strategien für künstliche Intelligenz (KI)

Relevanz der Daten

 

  • Vielfalt und Relevanz von Mustern
  • Irrelevante Daten verwirren das Modell -> das macht es weniger genau

 

  • Beispiel: Bewertung der Kreditwürdigkeit
    • Relevante Eigenschaften
    • Transaktionsverlauf
    • Vermögensprofil

 

Assets profile

Strategien für künstliche Intelligenz (KI)

Zeitliche Relevanz

  • Die Dynamik der Lieferkette hat sich nach der Pandemie verändert

Supply chain

Strategien für künstliche Intelligenz (KI)

Datenschutz

 

  • Sensible Nutzerdaten

Sensitive data

  • Datenschutzstandards wie die DSGVO

 

  • Ethische Verfahren

Ethical practices

  • Sorgt für Vertrauen bei den Nutzern
Strategien für künstliche Intelligenz (KI)

Datendokumentation

 

  • Erklärt die Bedeutung der verschiedenen Datenfelder und wofür sie wichtig sind

 

  • Experten verbinden Daten mit Geschäftsentscheidungen

 

  • Redundante Daten bringen keinen Mehrwert für die Modellvorhersagen

 

Data dictionary

Strategien für künstliche Intelligenz (KI)

Datenstichprobe

Time

  • Wenn du mit großen Datenmengen arbeitest
  • Erstelle einen Stichproben-Datensatz
  • Gleiche Ergebnisse bei geringeren Kosten

Budget

Data sampling

Strategien für künstliche Intelligenz (KI)

Ergänzen von Daten

Wait

  • Aber was ist, wenn die Daten nicht ausreichen?
  • Daten ergänzen – neue Datensätze aus vorhandenen Datensätzen erstellen

Lost opportunity

Augmenting new images

Strategien für künstliche Intelligenz (KI)

Datenvielfalt

 

  • Zuverlässige Modelle erstellen

  • Gute Modellgenauigkeit

  • Beispiel: Kreditantrag

    • Verschiedene Altersgruppen und Ethnien einbeziehen

 

Loan application

Strategien für künstliche Intelligenz (KI)

Datenqualität

 

  • Vollständig und umfassend
  • Genaue Daten; Alter und Geburtsdatum

Complete and comprehensive

 

  • Fehlende Daten
  • Korrekte Datenkennzeichnung

Missing data

Strategien für künstliche Intelligenz (KI)

Lass uns üben!

Strategien für künstliche Intelligenz (KI)

Preparing Video For Download...