Verantwoorde generatieve AI-toepassingen

Generatieve AI-concepten

Daniel Tedesco

Data Lead, Google

Aan de vooravond van de verkiezingen

Verzameling nepnieuwskoppen

Generatieve AI-concepten

Typen kwaadwillig gebruik

  • Deepfakes
  • Desinformatiecampagnes
  • AI-ondersteund hacken

Door AI gegenereerde afbeelding van paus met donsjas

1 Pablo Xavier
Generatieve AI-concepten

Detectie en preventie

Belangrijke gebruiksprincipes

  • Mens-in-de-lus
  • Schadepreventie
  • Continue monitoring

 

Punten voor detectie en preventie

Een stroomdiagram met punten in AI-gebruik: toegang, prompts, antwoorden, toepassing en communicatie en feedback.

Generatieve AI-concepten

Toegang

AI kan onbedoeld niet-criminele activiteiten van criminele groepen helpen.

  • Vermijd steun aan kwaadwillende groepen
  • Know Your Customer (KYC)
    • Verifieer gebruikersidentiteit

Een dreigend ogend personage dat om stilte vraagt.

Generatieve AI-concepten

Prompts en antwoorden

Prompts modereren

  • Vergelijkbaar met website- of chatgroepsmoderatie
  • Jailbreak-prompts kunnen richtlijnen omzeilen

Antwoorden modereren

  • Antwoorden screenen of filteren vóór tonen aan gebruiker
Generatieve AI-concepten

Toepassingen

Kwaadwillenden kunnen onschuldige antwoorden toepassen op illegale of onethische acties.

  • Onzichtbare watermarks helpen herkomst bepalen
  • Soms is wetshandhaving nodig
Generatieve AI-concepten

Communicatie en feedback

  • Duidelijke gebruiksrichtlijnen
  • Feedbackloops
    • Gebruikersonderzoek en stakeholdersessies
    • Samenwerken met maatschappelijke organisaties
    • Feedbackmogelijkheden in het product

Een automobilist die een gordel vastklikt

Generatieve AI-concepten

Laten we oefenen!

Generatieve AI-concepten

Preparing Video For Download...