Corso Building Streaming Data Analytics Solutions on AWS

Obiettivi | Certificazione | Contenuti | Tipologia | Prerequisiti | Durata e Frequenza | Docenti | Modalità di Iscrizione | Calendario

AWS Certified Data Engineer Associate

Il Corso Building Streaming Data Analytics Solutions on AWS (DASTRM) è progettato per guidare i Partecipanti attraverso la costruzione di soluzioni di analisi di dati in streaming utilizzando servizi AWS, inclusi Amazon Kinesis e Amazon Managed Streaming per Apache Kafka (Amazon MSK). Durante il corso, i Partecipanti esploreranno come Amazon Kinesis, un servizio di streaming di dati in tempo reale, e Amazon MSK, un servizio Apache Kafka completamente gestito, si integrano con altri servizi AWS come AWS Glue e AWS Lambda. Il corso copre componenti chiave del pipeline di analisi dei dati, tra cui l’ingestione di dati in streaming, l’archiviazione di stream e l’elaborazione di stream, e insegna come applicare le migliori pratiche di sicurezza, prestazioni e gestione dei costi all’operazione di Kinesis e Amazon MSK. Il corso contribuisce alla preparazione dell’esame di Certificazione AWS Certified Data Engineer – Associate.

Contattaci ora per ricevere tutti i dettagli e per richiedere, senza alcun impegno, di parlare direttamente con uno dei nostri Docenti (Clicca qui)
oppure chiamaci subito al nostro Numero Verde (800-177596)

Obiettivi del corso

Di seguito una sintesi degli obiettivi principali del Corso Building Streaming Data Analytics Solutions on AWS (DASTRM):

  • Comprendere le caratteristiche e i vantaggi di un’architettura di dati moderna e come i servizi di streaming AWS si inseriscono in essa.
  • Progettare e implementare una soluzione di analisi di dati in streaming.
  • Identificare e applicare tecniche appropriate, come compressione, sharding e partizionamento, per ottimizzare la memorizzazione dei dati.
  • Selezionare e implementare opzioni appropriate per ingerire, trasformare e memorizzare dati in tempo reale e quasi in tempo reale.
  • Scegliere gli stream, i cluster, gli argomenti, l’approccio di scalabilità e la topologia di rete appropriati per un particolare caso d’uso aziendale.

Certificazione del corso

Esame AWS Certified Data Engineer – Associate;
L’esame AWS Certified Data Engineer – Associate DEA-C01 valuta la capacità di un candidato di implementare pipeline di dati, monitorare, risolvere problemi e ottimizzare costi e prestazioni in conformità con le best practice. Gli esaminati devono dimostrare competenze nell’ingestione e trasformazione dei dati, orchestrazione delle pipeline di dati e applicazione di concetti di programmazione. Inoltre, devono essere in grado di scegliere il data store ottimale, progettare modelli di dati, catalogare schemi di dati e gestire i cicli di vita dei dati. Altre competenze richieste includono l’operazionalizzazione, manutenzione e monitoraggio delle pipeline di dati, analisi dei dati e garanzia della qualità dei dati. Gli esaminati devono anche implementare meccanismi appropriati di autenticazione, autorizzazione, crittografia dei dati, privacy e governance, oltre ad abilitare il logging. Le conoscenze richieste includono le caratteristiche di throughput e latenza per i servizi AWS che ingeriscono dati, schemi di ingestione dei dati, elaborazione dei dati utilizzando Apache Spark, e architetture event-driven. Gli esaminati devono saper integrare vari servizi AWS per creare pipeline ETL, configurare servizi AWS per pipeline di dati basate su schedulazioni o dipendenze, e ottimizzare i costi durante l’elaborazione dei dati. Inoltre, è necessaria la conoscenza dei concetti di programmazione quali CI/CD, query SQL e infrastruttura come codice (IaC). L’esame richiede anche competenze nell’automazione dell’elaborazione dei dati utilizzando i servizi AWS, visualizzazione dei dati, verifica e pulizia dei dati, e monitoraggio delle pipeline di dati. Infine, gli esaminati devono dimostrare la capacità di applicare meccanismi di autenticazione e autorizzazione, garantire la crittografia e mascheramento dei dati, preparare i log per audit, e implementare strategie di privacy e governance dei dati.

Contenuti del corso

Module 0: Overview of Data Analytics and the Data Pipeline

  • Data analytics use cases
  • Using the data pipeline for analytics

Module 1: Using Streaming Services in the Data Analytics Pipeline

  • The importance of streaming data analytics
  • The streaming data analytics pipeline
  • Streaming concepts

Module 2: Introduction to AWS Streaming Services

  • Streaming data services in AWS
  • Amazon Kinesis in analytics solutions
  • Demonstration: Explore Amazon Kinesis Data Streams
  • Practice Lab: Setting up a streaming delivery pipeline with Amazon Kinesis
  • Using Amazon Kinesis Data Analytics
  • Introduction to Amazon MSK
  • Overview of Spark Streaming

Module 3: Using Amazon Kinesis for Real-time Data Analytics

  • Exploring Amazon Kinesis using a clickstream workload
  • Creating Kinesis data and delivery streams
  • Demonstration: Understanding producers and consumers
  • Building stream producers
  • Building stream consumers
  • Building and deploying Flink applications in Kinesis Data Analytics
  • Demonstration: Explore Zeppelin notebooks for Kinesis Data Analytics
  • Practice Lab: Streaming analytics with Amazon Kinesis Data Analytics and Apache Flink

Module 4: Securing, Monitoring, and Optimizing Amazon Kinesis

  • Optimize Amazon Kinesis to gain actionable business insights
  • Security and monitoring best practices

Module 5: Using Amazon MSK in Streaming Data Analytics Solutions

  • Use cases for Amazon MSK
  • Creating MSK clusters
  • Demonstration: Provisioning an MSK Cluster
  • Ingesting data into Amazon MSK
  • Practice Lab: Introduction to access control with Amazon MSK
  • Transforming and processing in Amazon MSK

Module 6: Securing, Monitoring, and Optimizing Amazon MSK

  • Optimizing Amazon MSK
  • Demonstration: Scaling up Amazon MSK storage
  • Practice Lab: Amazon MSK streaming pipeline and application deployment
  • Security and monitoring
  • Demonstration: Monitoring an MSK cluster

Module 7: Designing Streaming Data Analytics Solutions

  • Use case review
  • Class Exercise: Designing a streaming data analytics workflow

Module B: Developing Modern Data Architectures on AWS

  • Modern data architectures

Tipologia

Corso di Formazione con Docente

Docenti

I docenti sono Istruttori accreditati Amazon AWS e certificati in altre tecnologie IT, con anni di esperienza pratica nel settore e nella Formazione.

Infrastruttura laboratoriale

Per tutte le tipologie di erogazione, il Corsista può accedere alle attrezzature e ai sistemi presenti nei Nostri laboratori o direttamente presso i data center del Vendor o dei suoi provider autorizzati in modalità remota h24. Ogni partecipante dispone di un accesso per implementare le varie configurazioni avendo così un riscontro pratico e immediato della teoria affrontata. Ecco di seguito alcuni scenari tratti dalle attività laboratoriali:

Laboratorio Building Batch Data Analytics Solutions on AWS

Dettagli del corso

Prerequisiti

Si consiglia la partecipazione ai seguenti corsi:

Durata del corso

Durata Intensiva 1gg.

Frequenza

Varie tipologie di Frequenza Estensiva ed Intensiva.

Date del corso

  • Building Streaming Data Analytics Solutions on AWS (Formula Intensiva) – Su Richiesta – 09:00/17:00

Modalità di iscrizione

Le iscrizioni sono a numero chiuso per garantire ai tutti i partecipanti un servizio eccellente. L’iscrizione avviene richiedendo di essere contattati dal seguente Link, o contattando la sede al numero verde 800-177596 o inviando una richiesta all’email [email protected].