Selezione delle fonti dati

Gestione responsabile dei dati per l'AI

Maria Prokofieva

Lead ML engineer

Perché selezionare?

  • Assicurare la qualità dei dati
  • Conformità legale
  • Equità

 

Donna perplessa che sceglie tra due pulsanti e preme quello blu

Gestione responsabile dei dati per l'AI

Passo 1. Rilevanza del progetto

  • Rilevanza per gli obiettivi del progetto
  • Verifica l’allineamento con
    • Tema
    • Ambito
    • Risultati attesi

Icona bersaglio

Gestione responsabile dei dati per l'AI

Passo 2. Integrità della fonte dati

  • Valuta integrità e affidabilità
  • Recensioni e testimonianze
  • Trasparenza nella raccolta dati
  • Conformità e licenze
  • Alta qualità: aggiornamenti regolari

Icona stretta di mano e scudo

Gestione responsabile dei dati per l'AI

Passo 3. Conformità legale

  • Liceità dei dati
  • Conformità legale del progetto
  • Consulenza legale:
    • Leggi e restrizioni applicabili
    • Anonimizzazione dei dati
    • Requisiti di sicurezza dei dati
  • Approvato dal team legale

leggi

Gestione responsabile dei dati per l'AI

Passo 4. Qualità tecnica

  • Integrità strutturale e usabilità
  • Completi
  • Coerenti
  • Accurate
  • Tempestivi

Certificato di qualità

Gestione responsabile dei dati per l'AI

Passo 5. Bias e rappresentatività

  • Analisi della rappresentanza demografica
  • Caratteristiche protette
  • Analizza la distribuzione dei gruppi
  • Metriche di equità
  • Data augmentation
Gestione responsabile dei dati per l'AI

Passo 6. Selezione

  • Includi se:
    • Si allinea in modo costante
    • Correggibile con trasformazioni, augmentation o algoritmi
  • Escludi se:
    • Carente in aree chiave
  • Consulta esperti di dominio

Fare una selezione

Gestione responsabile dei dati per l'AI

Progetto: flusso del traffico urbano

Fonti dati:

  1. Dati di conteggio del traffico
  2. Verbali delle riunioni del consiglio
  3. Dati GPS
  4. Menzioni sui social sulle condizioni del traffico
  5. Dati dei sondaggi dei pendolari

Progetto sul flusso del traffico urbano

1 Immagini di Streamline HQ
Gestione responsabile dei dati per l'AI

Progetto: flusso del traffico urbano

Escludi:

  • Dati dei social media
  • Dati dei sondaggi dei pendolari

Modifiche:

  • Verbali delle riunioni del consiglio
  • Dati di conteggio del traffico
    • Dati aggiuntivi dai sensori
  • Dati GPS
    • Dati aggiuntivi dalle telecamere
Gestione responsabile dei dati per l'AI

Ayo berlatih!

Gestione responsabile dei dati per l'AI

Preparing Video For Download...