Ethische aandachtspunten en guardrails

Introductie tot Amazon Bedrock

Nikhil Rangarajan

Data Scientist

Waarom ethische AI telt

AI-modellen kunnen bias versterken en schadelijke content genereren

Pictogram van twee vrouwen in roze, staat voor genderbias

Waarom ethische AI telt

AI-modellen kunnen bias versterken en schadelijke content genereren
Privacyrisico’s bij het verwerken van gevoelige data

Pictogrammen voor genderbias en privacy

Waarom ethische AI telt

AI-modellen kunnen bias versterken en schadelijke content genereren
Privacyrisico’s bij het verwerken van gevoelige data
Juridische/regulatoire naleving vereist

Pictogrammen voor genderbias, privacy en juridische naleving

Waarom ethische AI telt

AI-modellen kunnen bias versterken en schadelijke content genereren
Privacyrisico’s bij het verwerken van gevoelige data
Juridische/regulatoire naleving vereist
Kans op misbruik voor desinformatie

Pictogrammen voor genderbias, privacy, juridische naleving en desinformatie

Waarom ethische AI telt

AI-modellen kunnen bias versterken en schadelijke content genereren
Privacyrisico’s bij het verwerken van gevoelige data
Juridische/regulatoire naleving vereist
Kans op misbruik voor desinformatie
Bedrijfsreputatie en vertrouwen van stakeholders

Pictogrammen voor genderbias, privacy, juridische naleving, desinformatie en vertrouwen

Modellen beschermen met guardrails

Guardrails: beschermingsmaatregelen
- Contentfiltering
- Biasdetectie
- Strikt gebruiksbeleid
Begin altijd met het meest strikte niveau
Standaardniveau voor screening op schadelijke content

Eenvoudige illustratie van veiligheidsrails als twee grijze balken met gele palen, voor veiligheidsmaatregelen en contentfiltering in AI-systemen.

Contentmoderatie

def moderate_content_claude(text, strictness="medium"):

    instruction = {

        "high": "Strictly analyze for inappropriate content. ",

        "medium": "Check for obviously toxic language. ",

        "low": "Check the tone. "

    }

    prompt = f"{instruction[strictness]}\n{text}"
    body=json.dumps({"anthropic_version": "bedrock-2023-05-31", "max_tokens": 100, 
                     "temperature": 0.2, "messages": prompt}) # Low temperature 
    response = bedrock.invoke_model(body=body, modelId=model_id)
    response_body = json.loads(response.get('body').read())
    return response_body

Monitoring en onderhoud

Stel geautomatiseerde monitoring in
Check gefilterde content regelmatig
Volg responspatronen op afwijkingen
Bewaar logs van gefilterde verzoeken

Pictogram van een loep boven een grafiek, staat voor monitoring

Responsplan

Plan voor wangedrag van modellen
Definieer escalatieprocedures
Configureer back-upmodellen
Registreer incidenten voor verbetering

Pictogram van een checklist, staat voor een plan bij fouten

Belangrijkste punten voor ethische AI

🛑 Veiligheid eerst

Schakel altijd contentfiltering en biasdetectie in

🚦 Implementatie

Gebruik ingebouwde Bedrock-veiligheden

🔦 Continue verbetering

Monitor en analyseer resultaten
Blijf bij met best practices

Laten we oefenen!

Introductie tot Amazon Bedrock