Veelvoorkomende problemen oplossen

Azure Compute-oplossingen

Florin Angelescu

Azure Cloud Architect

Waarom troubleshooten belangrijk is

 

Pod Failure

Pod Communication

Node Failure

 

 

  • Pods kunnen niet starten

 

  • Services routeren geen verkeer

 

  • Nodes raken door resources heen
Azure Compute-oplossingen

Waarom troubleshooten belangrijk is

 

Pod Failure

  • Gestructureerde aanpak:
    • Observeer
    • Identificeer
    • Test
    • Los op
  • Voorkomt tijdverlies aan symptomen i.p.v. root causes.
Azure Compute-oplossingen

Pod-failures

 

 

Pod Failure

 

 

  • Pods starten niet.
  • Oorzaken:
    • Foute container-images
    • Ontbrekende secrets
    • Onvoldoende resources
Azure Compute-oplossingen

Pod-failures

kubectl

  • kubectl describe pod - events
  • kubectl logs - output

Policy

  • Controleer image pull policies
  • Controleer registry-credentials

Logs

  • Onderzoek applicatielogs
  • Onderzoek resource-requests

Probe

  • Readiness- en liveness-probes
  • Ongezonde pods detecteren en herstarten
Azure Compute-oplossingen

Netwerkproblemen

 

 

Pod Communication

 

  • Netwerkproblemen:

    • Services bereiken pods niet
    • Of externe clients
  • Verifieer:

    • Services zijn juist gedefinieerd
    • Selectors matchen pod-labels
Azure Compute-oplossingen

Netwerkproblemen

kubectl

  • kubectl get svc
  • kubectl get endpoints

kubectl

  • Ingress-controllers: extra config
  • TLS-certificaten of padregels

kubectl

  • Connectiviteit testen
  • kubectl exec, curl

kubectl

  • Packet-capture tools
  • Azure Network Watcher
Azure Compute-oplossingen

Schaalproblemen

 

Scaling Failure

 

 

 

  • Auto-scaler verkeerd geconfigureerd.
  • Nodes hebben te weinig capaciteit.
Azure Compute-oplossingen

Schaalproblemen

 

Scaling Failure

  • Check Horizontal Pod Autoscaler-metrics:
    • kubectl get hpa
  • Zorg dat Cluster Autoscaler aanstaat.
  • Bekijk resource-requests en -limits:
    • Te strakke waarden blokkeren scheduling
  • Inspecteer nodepool-quota en pas drempels aan.
  • Simuleer load tijdens testen.
  • Monitor scaling-events in Azure Monitor.
Azure Compute-oplossingen

Resourcebeperkingen

 

Node Failure

 

  • Nodes kunnen opraken aan:
    • CPU
    • Geheugen
    • Schijfruimte
  • Waardoor pods geëvict worden.
  • Monitor resourcegebruik:
    • Azure Monitor
    • kubectl top
Azure Compute-oplossingen

Resourcebeperkingen

Resources

  • Overcommitment veroorzaakt instabiliteit
  • Stel realistische requests en limits in

Priority

  • Taints en tolerations -> pod-plaatsing
  • Zorg dat kritieke workloads prioriteit hebben

Audit

  • Audits van resource-toewijzing en quota
  • Voorkom knelpunten

Nodes

  • Meerdere nodepools met verschillende VM-groottes
  • Workloads efficiënt balanceren
Azure Compute-oplossingen

Samenvatting

 

Kubernetes

 

 

  • Troubleshooten in AKS omvat diagnose van:
    • Pod-failures
    • Netwerkproblemen
    • Schaalproblemen
    • Resourcebeperkingen
Azure Compute-oplossingen

Samenvatting

 

Kubernetes

 

 

  • Combineer Kubernetes-tools met Azure-integraties:

    • Zo los je snel problemen op en blijf je betrouwbaar
  • Troubleshooting-playbook voor je team:

    • Consistente respons en snellere oplostijden
Azure Compute-oplossingen

Laten we oefenen!

Azure Compute-oplossingen

Preparing Video For Download...