Building Data Analytics Solutions Using Amazon Redshift
In questo corso imparerete a costruire un data lake operativo che supporti l’analisi di dati strutturati e non strutturati. Imparerete i componenti e le funzionalità dei servizi coinvolti nella creazione di un data lake. Utilizzerete AWS Lake Formation per creare un data lake, AWS Glue per creare un catalogo di dati e Amazon Athena per analizzare i dati. Le lezioni e i laboratori del corso approfondiscono l’apprendimento con l’esplorazione di diverse architetture di data lake comuni.
COD: AW-BDASAR
Categorie: AWS
Chi dovrebbe partecipare
Questo corso è rivolto a:
- Ingegneri di piattaforme dati
- Architetti di soluzioni
- Professionisti IT
Prerequisiti
Necessari
Familiarità con la combinazione di tecnologie AWS per supportare data lake o altri carichi di lavoro basati sui dati trarranno beneficio da questo corso.
Raccomandati
- Completamento di AWS Technical Essentials o Architecting on AWS
- Completamento di Building Data Lakes on AWS
In questo corso imparerete a:
- Confrontare le caratteristiche e i vantaggi dei data warehouse, dei data lake e delle moderne architetture di dati.
- Progettare e implementare una soluzione analitica di data warehouse
- Identificare e applicare tecniche appropriate, compresa la compressione, per ottimizzare l’archiviazione dei dati.
- Selezionare e implementare le opzioni appropriate per l’acquisizione, la trasformazione e l’archiviazione dei dati.
- Scegliere i tipi di istanza e di nodo, i cluster, l’autoscaling e la topologia di rete appropriati per un particolare caso d’uso aziendale.
- Comprendere come l’archiviazione e l’elaborazione dei dati influenzino i meccanismi di analisi e visualizzazione necessari per ottenere informazioni aziendali attuabili.
- Proteggere i dati a riposo e in transito
- Monitorare i carichi di lavoro analitici per identificare e risolvere i problemi.
- Applicare le migliori pratiche di gestione dei costi
Modulo A: Panoramica sull’analisi dei dati e sulla pipeline dei dati
- Casi d’uso dell’analisi dei dati
- Utilizzo della pipeline di dati per l’analisi
Modulo 1: Utilizzo di Amazon Redshift nella pipeline di analisi dei dati
- Perché Amazon Redshift per il data warehousing?
- Panoramica di Amazon Redshift
Modulo 2: Introduzione ad Amazon Redshift
- Architettura di Amazon Redshift
- Demo interattiva 1: visita alla console di Amazon Redshift
- Caratteristiche di Amazon Redshift
- Laboratorio pratico 1: Impostazione del data warehouse con Amazon Redshift
Modulo 3: Ingestione e archiviazione
- Ingestione
- Demo interattiva 2: Collegare il cluster di Amazon Redshift utilizzando un taccuino Jupyter con
- API dei dati
- Distribuzione e archiviazione dei dati
- Demo interattiva 3: Analisi di dati semi-strutturati utilizzando il tipo di dati SUPER
- Interrogazione dei dati in Amazon Redshift
- Laboratorio pratico 2: Analisi dei dati con Amazon Redshift Spectrum
Modulo 4: Elaborazione e ottimizzazione dei dati
- Trasformazione dei dati
- Interrogazione avanzata
- Laboratorio pratico 3: Trasformazione e interrogazione dei dati in Amazon Redshift
- Gestione delle risorse
- Demo interattiva 4: Applicazione della gestione dei carichi di lavoro misti su Amazon Redshift
- Automazione e ottimizzazione
Modulo 5: Sicurezza e monitoraggio dei cluster Amazon Redshift
- Messa in sicurezza del cluster Amazon Redshift
- Monitoraggio e risoluzione dei problemi dei cluster Amazon Redshift
Modulo 6: Progettazione di soluzioni analitiche di data warehouse
- Analisi dei casi d’uso del data warehouse
- Attività: Progettazione di un flusso di lavoro analitico per data warehouse
Modulo B: Sviluppo di architetture di dati moderne su AWS
- Architetture di dati moderne
Durata – 1 giorno
Erogazione – in Aula, On Site, Remoto
Requisiti PC e SW:
- Connessione Internet
- Web browser, Google Chrome
- Zoom
Lingua
- Formatore: Italiano
- Laboratori: Inglese
- Slide: Inglese