Governance en security

LLMOps-concepten

Max Knobbout, PhD

Applied Scientist, Uber

LLM-levenscyclus: Governance en security

Overzicht van de fasen in de levenscyclus van een LLM-applicatie

Governance en security

Governance omvat beleid, richtlijnen en raamwerken
Security omvat maatregelen om te voorkomen:
- Ongeautoriseerde toegang
- Datalekken
- Adversarial attacks
- Misbruik of manipulatie van modeloutput of -capaciteiten

Toegangsbeheer

Gebruik Role Based Access Control (RBAC)
Alle API's moeten aan security-standaarden voldoen
Gebruik een zero-trustbeveiligingsmodel
Zorg dat de applicatie de juiste rol aanneemt bij externe toegang

Een API-flow waarin de LLM-app de rol van de gebruiker aanneemt

Dreiging: Prompt injection

Prompt injection: aanvallers manipuleren invoervelden of prompts in een app om ongeautoriseerde commando's/acties uit te voeren.
Mitigaties:
- Ga ervan uit dat promptinstructies kunnen worden overschreven en inhoud onthuld
- Behandel de LLM als een niet-vertrouwde gebruiker
- Identificeer (en blokkeer) bekende adversarial prompts

Demonstratie van een prompt injection

Dreiging: Outputmanipulatie

Output van een LLM kan worden misbruikt in downstream-aanvallen.
Kwaadaardige acties uitvoeren namens de gebruiker
Mitigaties:
- Geef de app geen onnodige rechten/toestemmingen
- Censureer en blokkeer specifieke ongewenste outputs

Demonstratie van outputmanipulatie

Dreiging: Denial-of-service

Gebruikers overspoelen onze LLM-app met requests, wat hoge kosten en problemen met beschikbaarheid en performance veroorzaakt
Mitigaties:
- Beperk requestrates
- Cap het resourceverbruik per request

Afbeelding van een denial-of-service-aanval

Dreiging: Dataintegriteit en -vergiftiging

Datavergiftiging brengt valse, misleidende of kwaadaardige data in onze trainingsset
- Data kan auteursrechtelijk beschermd en/of persoonlijk zijn
- Inhoud kan schadelijk zijn
Mitigaties:
- Gebruik betrouwbare bronnen en verifieer legitimiteit
- Gebruik filters
- Outputcensuur

Afbeelding van tekstdocumenten, waarvan één document vergiftigd is

Onszelf beschermen

Gebruik de nieuwste security-standaarden en voer mitigaties uit
Denk altijd vanuit een kwaadwillende gebruiker die ons systeem aanvalt
Blijf up-to-date, zie Open Web Application Security Project (OWASP)

¹ OWASP for LLMs: https://llmtop10.com/

Laten we oefenen!

LLMOps-concepten

Preparing Video For Download...