Governance en security

LLMOps-concepten

Max Knobbout, PhD

Applied Scientist, Uber

LLM-levenscyclus: Governance en security

Overzicht van de fasen in de levenscyclus van een LLM-applicatie

LLMOps-concepten

Governance en security

 

Een speelse afbeelding van een agent die naar het rode licht wijst

 

  • Governance omvat beleid, richtlijnen en raamwerken
  • Security omvat maatregelen om te voorkomen:
    • Ongeautoriseerde toegang
    • Datalekken
    • Adversarial attacks
    • Misbruik of manipulatie van modeloutput of -capaciteiten
LLMOps-concepten

Toegangsbeheer

  • Gebruik Role Based Access Control (RBAC)

  • Alle API's moeten aan security-standaarden voldoen

  • Gebruik een zero-trustbeveiligingsmodel

  • Zorg dat de applicatie de juiste rol aanneemt bij externe toegang

 

Een API-flow waarin de LLM-app de rol van de gebruiker aanneemt

LLMOps-concepten

Dreiging: Prompt injection

  • Prompt injection: aanvallers manipuleren invoervelden of prompts in een app om ongeautoriseerde commando's/acties uit te voeren.
  • Mitigaties:
    • Ga ervan uit dat promptinstructies kunnen worden overschreven en inhoud onthuld
    • Behandel de LLM als een niet-vertrouwde gebruiker
    • Identificeer (en blokkeer) bekende adversarial prompts

Demonstratie van een prompt injection

LLMOps-concepten

Dreiging: Outputmanipulatie

  • Output van een LLM kan worden misbruikt in downstream-aanvallen.
  • Kwaadaardige acties uitvoeren namens de gebruiker
  • Mitigaties:
    • Geef de app geen onnodige rechten/toestemmingen
    • Censureer en blokkeer specifieke ongewenste outputs

Demonstratie van outputmanipulatie

LLMOps-concepten

Dreiging: Denial-of-service

  • Gebruikers overspoelen onze LLM-app met requests, wat hoge kosten en problemen met beschikbaarheid en performance veroorzaakt

  • Mitigaties:

    • Beperk requestrates
    • Cap het resourceverbruik per request

 

Afbeelding van een denial-of-service-aanval

LLMOps-concepten

Dreiging: Dataintegriteit en -vergiftiging

  • Datavergiftiging brengt valse, misleidende of kwaadaardige data in onze trainingsset

    • Data kan auteursrechtelijk beschermd en/of persoonlijk zijn
    • Inhoud kan schadelijk zijn
  • Mitigaties:

    • Gebruik betrouwbare bronnen en verifieer legitimiteit
    • Gebruik filters
    • Outputcensuur

Afbeelding van tekstdocumenten, waarvan één document vergiftigd is

LLMOps-concepten

Onszelf beschermen

Speelse afbeelding van een cartoon die wordt geraakt door een vallend object

 

  • Gebruik de nieuwste security-standaarden en voer mitigaties uit
  • Denk altijd vanuit een kwaadwillende gebruiker die ons systeem aanvalt
  • Blijf up-to-date, zie Open Web Application Security Project (OWASP)
1 OWASP for LLMs: https://llmtop10.com/
LLMOps-concepten

Laten we oefenen!

LLMOps-concepten

Preparing Video For Download...