Data Warehousing on AWS
Data Warehousing on AWS introduce i concetti, le strategie e le best practice per la progettazione di una soluzione di data warehousing basata sul cloud utilizzando Amazon Redshift, il data warehouse su scala petabyte di AWS. Questo corso mostra come raccogliere, archiviare e preparare i dati per il data warehouse utilizzando i servizi AWS come Amazon DynamoDB, Amazon EMR, Amazon Kinesis e Amazon S3. Inoltre, il corso mostra come utilizzare Amazon QuickSight per eseguire analisi sui dati.
COD: AW-DWAWS
Categorie: AWS
Chi dovrebbe partecipare
- Architetti di database
- Amministratori di database
- Sviluppatori di database
- Data Analyst
Prerequisiti
- Familiarità con i database relazionali e i concetti di progettazione di database
In questo corso imparerete a:
- Discutere i concetti fondamentali del data warehousing e l’intersezione tra soluzioni di data warehousing e big data.
- Avviare un cluster Amazon Redshift e utilizzare i componenti, le caratteristiche e le funzionalità per implementare un data warehouse nel cloud.
- Utilizzare altri servizi AWS per i dati e l’analisi, come Amazon DynamoDB, Amazon EMR, Amazon Kinesis e Amazon S3, per contribuire alla soluzione di data warehousing.
- Progettare il data warehouse
- Identificare i problemi di prestazioni, ottimizzare le query e mettere a punto il database per ottenere prestazioni migliori.
- Utilizzare Amazon Redshift Spectrum per analizzare i dati direttamente da un bucket Amazon S3.
- Utilizzare Amazon QuickSight per eseguire attività di analisi e visualizzazione dei dati sul data warehouse.
Giorno 1
Modulo 1: Introduzione al Data Warehousing
- Database relazionali
- Concetti di data warehousing
- L’intersezione tra data warehousing e big data
- Panoramica della gestione dei dati in AWS
- Laboratorio pratico 1: Introduzione ad Amazon Redshift
Modulo 2: Introduzione ad Amazon Redshift
- Panoramica concettuale
- Casi d’uso reali
- Laboratorio pratico 2: Avvio di un cluster Amazon Redshift
Modulo 3: Avvio di cluster
- Creazione del cluster
- Connessione al cluster
- Controllo dell’accesso
- Sicurezza del database
- Caricare i dati
- Laboratorio pratico 3: Ottimizzazione degli schemi di database
Giorno 2
Modulo 4: Progettazione dello schema del database
- Schemi e tipi di dati
- Compressione delle colonne
- Stili di distribuzione dei dati
- Metodi di ordinamento dei dati
- Modulo 5: Identificazione delle fonti di dati
- Panoramica sulle fonti di dati
- Amazon S3
- Amazon DynamoDB
- Amazon EMR
- Amazon Kinesis Data Firehose
- Caricatore di database AWS Lambda per Amazon Redshift
- Laboratorio pratico 4: caricamento di dati in tempo reale in un database Amazon Redshift
Modulo 6: Caricamento dei dati
- Preparazione dei dati
- Caricamento dei dati con COPY
- Mantenimento delle tabelle
- Operazioni di scrittura simultanea
- Risoluzione dei problemi di caricamento
- Laboratorio pratico 5: Caricamento dei dati con il comando COPY
Giorno 3
Modulo 7: Scrittura di query e ottimizzazione delle prestazioni
- Amazon Redshift SQL
- Funzioni definite dall’utente (UDF)
- Fattori che influenzano le prestazioni delle query
- Il comando EXPLAIN e i piani di query
- Gestione del carico di lavoro (WLM)
- Laboratorio pratico 6: Configurazione della gestione del carico di lavoro
Modulo 8: Amazon Redshift Spectrum
- Amazon Redshift Spectrum
- Configurazione dei dati per Amazon Redshift Spectrum
- Query di Amazon Redshift Spectrum
- Laboratorio pratico 7: Utilizzo di Amazon Redshift Spectrum
Modulo 9: Manutenzione dei cluster
- Registrazione di audit
- Monitoraggio delle prestazioni
- Eventi e notifiche
Laboratorio 8: Audit e monitoraggio dei cluster
- Ridimensionamento dei cluster
- Backup e ripristino dei cluster
- Etichettatura delle risorse, limiti e vincoli
- Laboratorio pratico 9: Backup, ripristino e ridimensionamento dei cluster
Modulo 10: Analisi e visualizzazione dei dati
- Potere delle visualizzazioni
- Creazione di dashboard
- Edizioni e funzionalità di Amazon QuickSight
Durata –Â 3 giorni
Erogazione – in Aula, On Site, Remoto
Requisiti PC e SW:
- Connessione Internet
- Web browser, Google Chrome
- Zoom
Lingua
- Formatore: Italiano
- Laboratori: Inglese
- Slide: Inglese