Risoluzione dei problemi comuni

Soluzioni di calcolo in Azure

Florin Angelescu

Azure Cloud Architect

Perché il troubleshooting è importante

 

Errore pod

Comunicazione pod

Errore nodo

 

 

  • I pod possono non avviarsi

 

  • I servizi potrebbero non instradare il traffico

 

  • I nodi possono esaurire le risorse
Soluzioni di calcolo in Azure

Perché il troubleshooting è importante

 

Errore pod

  • Approccio strutturato:
    • Osserva
    • Identifica
    • Testa
    • Risolvi
  • Evita di perdere tempo sui sintomi invece che sulle cause radice.
Soluzioni di calcolo in Azure

Errori dei pod

 

 

Errore pod

 

 

  • Pod che non si avviano.
  • Cause:
    • Container image errate
    • Secret mancanti
    • Risorse insufficienti
Soluzioni di calcolo in Azure

Errori dei pod

kubectl

  • kubectl describe pod - eventi
  • kubectl logs - output

Policy

  • Controlla le image pull policy
  • Verifica le credenziali del registry

Logs

  • Analizza i log dell'app
  • Analizza le richieste di risorse

Probe

  • Probe di readiness e liveness
  • Rileva pod non sani e riavviali
Soluzioni di calcolo in Azure

Problemi di rete

 

 

Comunicazione pod

 

  • Problemi di rete:

    • Impediscono ai servizi di raggiungere i pod
    • O i client esterni
  • Verifica:

    • Servizi definiti correttamente
    • Selector che combaciano con le etichette dei pod
Soluzioni di calcolo in Azure

Problemi di rete

kubectl

  • kubectl get svc
  • kubectl get endpoints

kubectl

  • Ingress controller - config aggiuntiva
  • Certificati TLS o regole di path

kubectl

  • Test della connettività
  • kubectl exec, curl

kubectl

  • Strumenti di packet capture
  • Azure Network Watcher
Soluzioni di calcolo in Azure

Sfide di scaling

 

Errore di scaling

 

 

 

  • Impostazioni dell'auto-scaler errate.
  • Nodi senza capacità.
Soluzioni di calcolo in Azure

Sfide di scaling

 

Errore di scaling

  • Controlla le metriche dell'Horizontal Pod Autoscaler:
    • kubectl get hpa
  • Assicurati che il Cluster Autoscaler sia attivo.
  • Rivedi richieste e limiti di risorse:
    • Valori troppo restrittivi impediscono lo scheduling dei pod
  • Controlla le quote del node pool e regola le soglie.
  • Simula carico nei test.
  • Monitora gli eventi di scaling in Azure Monitor.
Soluzioni di calcolo in Azure

Vincoli di risorse

 

Errore nodo

 

  • I nodi possono esaurire:
    • CPU
    • Memoria
    • Spazio su disco
  • Con conseguente eviction dei pod.
  • Monitora l'uso delle risorse:
    • Azure Monitor
    • kubectl top
Soluzioni di calcolo in Azure

Vincoli di risorse

Risorse

  • Overcommit delle risorse causa instabilità
  • Definisci richieste e limiti realistici

Priorità

  • Taint e toleration -> placement dei pod
  • Dai priorità ai carichi critici

Audit

  • Audit di allocazione risorse e quote
  • Evita colli di bottiglia

Nodi

  • Più node pool con dimensioni VM diverse
  • Bilancia i carichi in modo efficiente
Soluzioni di calcolo in Azure

Riepilogo

 

Kubernetes

 

 

  • Il troubleshooting in AKS include la diagnosi di:
    • Errori dei pod
    • Problemi di rete
    • Sfide di scaling
    • Vincoli di risorse
Soluzioni di calcolo in Azure

Riepilogo

 

Kubernetes

 

 

  • Combinando gli strumenti Kubernetes con le integrazioni Azure:

    • Risolvi i problemi velocemente e mantieni l'affidabilità
  • Playbook di troubleshooting per il team:

    • Risposte coerenti e tempi di risoluzione più rapidi
Soluzioni di calcolo in Azure

Ayo berlatih!

Soluzioni di calcolo in Azure

Preparing Video For Download...