Applicazioni di IA generativa responsabile

Concetti di IA generativa

Daniel Tedesco

Data Lead, Google

Alla vigilia delle elezioni

Raccolta di titoli di fake news

Concetti di IA generativa

Tipi di uso malevolo

  • Deepfake
  • Campagne di disinformazione
  • Hacking potenziato dall'IA

Immagine AI del papa con piumino

1 Pablo Xavier
Concetti di IA generativa

Rilevamento e prevenzione

Principi d'uso chiave

  • Human-in-the-loop
  • Prevenzione del danno
  • Monitoraggio continuo

 

Punti di rilevamento e prevenzione

Un diagramma di flusso dei punti nell'uso dell'IA: accesso, prompt, risposte, applicazione e comunicazione e feedback.

Concetti di IA generativa

Accesso

L'IA può aiutare involontariamente attività non criminali di gruppi criminali.

  • Evita di supportare gruppi malevoli
  • Know Your Customer (KYC)
    • Verifica l'identità dell'utente

Figura minacciosa che fa cenno di tacere.

Concetti di IA generativa

Prompt e risposte

Moderare i prompt

  • Come la moderazione di siti o chat
  • I prompt di jailbreaking possono aggirare le linee guida

Moderare le risposte

  • Controlla o filtra le risposte prima di mostrarle
Concetti di IA generativa

Applicazioni

Attori malintenzionati possono applicare risposte innocue ad attività illegali o non etiche.

  • Le filigrane invisibili aiutano a identificare la fonte
  • Può richiedere l'intervento delle forze dell'ordine
Concetti di IA generativa

Comunicazione e feedback

  • Linee guida d'uso chiare
  • Cicli di feedback
    • User study e tavoli con stakeholder
    • Partner con organizzazioni della società civile
    • Canali di feedback nel prodotto

Un automobilista che allaccia la cintura

Concetti di IA generativa

Passons à la pratique !

Concetti di IA generativa

Preparing Video For Download...