Advanced Docker Enterprise Troubleshooting
In questo corso incentrato sull’assistenza e sulla SRE, imparerai tecniche ampiamente applicabili per diagnosticare i guasti della piattaforma e delle applicazioni in Docker Enterprise. Tratteremo le strategie di prima risposta per le applicazioni Swarm e Kubernetes, vedremo come identificare ed evitare le più comuni modalità di guasto dei cluster e ci eserciteremo nella risoluzione dei problemi e nelle azioni di disaster recovery per UCP e DTR. Questo corso ha lo scopo di aiutare gli operatori esperti di Docker Enterprise a gestire autonomamente un’ampia gamma di esigenze di assistenza, riducendo i tempi di risoluzione e accelerando i risultati delle richieste di assistenza.
- COD:Â CN310
- CATEGORIE:Â Mirantis CNA
Chi dovrebbe partecipare
- Chi vuole fornire supporto e operazioni di day-2 per cluster Docker Enterprise di livello di produzione che ospitano applicazioni mission-critical.
- SRE, team di supporto o operatori che gestiscono Docker Enterprise
Requisiti del laboratorio
- Laptop con connettività WiFi
- I partecipanti dovranno avere l’ultima versione di Chrome o Firefox installata e un account gratuito su strigo.io.
- Containerized application diagnostic strategies
- Audit e tracciamento degli strumenti di containerizzazione
- Tracciamento del carico di lavoro e risoluzione dei problemi
- Tracciamento della rete
- Valutazione della gravità e identificazione dei problemi reali
- Logging & Monitoring Strategies
- Fonti di dati della piattaforma e dell’applicazione
- Manipolazione e inserimento dei dati di registrazione dei container
- Docker Enterprise Documentation
- Orientarsi nella documentazione
- Trovare la documentazione sull’uso, la risoluzione dei problemi e le migliori pratiche
- UCP Support Dumps
- Generare i dump di supporto automaticamente e manualmente
- Interpretare il contenuto dei dump di supporto
- Troubleshooting Resource Problems
- Rilevare i vincoli di memoria, CPU e I/O
- Mitigare il consumo eccessivo di risorse
- Troubleshooting Networking Problems
- Revisione dell’implementazione della rete Swarm
- Problemi comuni di rete di Swarm e mitigazioni
- Requisiti, guasti e mitigazioni della rete UCP
- Risoluzione dei problemi DNS di Swarm e Kube
- Troubleshooting UCP
- Correlare gli errori UCP con i componenti e i log UCP
- Indagine sugli errori di riconciliazione dello stato con etcd e rethinkdb
- Troubleshooting DTR
- Correlazione degli errori DTR con componenti e registri DTR
Risorse e dimensionamento del DTR per mitigare le scarse - prestazioni
- Audit dei job log e dei monitor di attività del DTR
- Ripristino automatico del DTR
- Correlazione degli errori DTR con componenti e registri DTR
- Disaster Recovery
- Backup di Swarm, UCP e DTR
- Ripristino dai backup
Durata – 2 giorni
Erogazione – in Aula, On Site, Remoto
Requisiti PC e SW:
- Connessione Internet
- Web browser, Google Chrome
- Zoom
Language
Trainer: Italiano
Labs: Inglese
Slides: Inglese