Compartilhe
Instrutores:
Fernando Cordeiro e Henrique Coelho
O que você aprenderá
- Big Data on AWS é um treinamento prático “mão na massa” voltado ao mundo Big Data oferece uma abordagem exclusiva para ajudá-lo a agir sobre os dados (Data Mining) para obter ganhos reais nos negócios.
- O foco não é o que uma ferramenta pode fazer, mas o que você pode fazer com a saída da ferramenta.
-
Obtenha as habilidades necessárias para armazenar, gerenciar, processar e analisar grandes quantidades de dados, desenvolver modelos utilizando tecnicas de machine learning (Regressão Logística, Redes Neurais, SVM, Random Forest, Gradient Boosting, XGBoost, entre outras). Tudo isso sobre todo Ecossistema Hadoop(HDFS, YARN/MapReduce, Hive, Spark, Pig, Sqoop, entre outras) e serviços disponíveis da AWS (Clusters, Lambda, Machine Learning, entre outras).
Para acessar a ementa completa e valor por curso Clique Aqui.
Formato Live – ao vivo com Instrutor pela Internet
Inclui: Material em pdf do conteúdo do treinamento, laboratórios práticos na plataforma da AWS e certificado de participação.
Estrutura do Curso
Tópicos abordados:
- O que é Big Data?
- Onde é utilizado e por quem?
- Como gerar valor com esta tecnologia?
- Overview de aplicações utilizando Machine Learning (Cenários Reais )
Tópicos abordados:
- Visão geral do Ecossistema Big Data Hadoop
- Teradata + SAS Configuração de Cluster Hadoop
- Ferramentas de monitoramento do Cluster (Ganglia e CloudWatch)
- Configuração/tipo do Cluster otimizado para diferentes aplicações de Big Data
- Otimização de custos utilizando AWS EMR Spot
- Ferramentas para Mineração e Visualização dos dados
- Zeppelin Jupyter
- 2 Laboratórios Práticos
Tópicos abordados:
- Tipos de armazenamento dos dados – Csv – Parquet – Json com Extração
- Transformação e Carga dos Dados (ETL)
- Conversão de CSV para Parquet
- Conversão de tipo de dado (numerico, string, data, timestamp)
- Particionamento
- Armazenamento (S3 | RedShift | RDS | Teradata)
- Laboratório Prático
Tópicos abordados:
- Introdução ao Aprendizado de Máquina (Machine Learning)
- Tipos de Dados
- Visualização dos Dados
- Tratamento dos Dados
- Seleção de Variáveis
- Modelos Supervisionados Naive Bayes
- Regressão Linear
- Regressão Logística
- Árvore de Classificação
- Regressão Random Forest | Gradient Boosting | XGBoost
- Redes Neurais
- Modelos Não Supervisionados (Clusterização)
- K-means Hierarquico Fuzzy DBSCAN
- Avaliação de Desempenho dos Modelos Implantação de Modelos
- Escoragem Online
- Escoragem Batch
- Laboratório Prático
Tópicos abordados:
- Exercício prático das técnicas aprendidas ao longo do treinamento.
Próximas Turmas
À definir
( Noturno )
Aulas Online ao Vivo com respostas às dúvidas dos alunos em tempo real e 100% de interação com o instrutor.
18:30h às 22:30h
18:30h às 22:30h
Entre em contato para mais informações
Big Data on AWS
Este curso inclui
-
20 horas de aula
-
Criação de arquitetura para laboratórios práticos
-
Certificado de conclusão