Style Switcher

Layout options
  • Boxed Layout
  • Full Width Layout
Primary Color

São Paulo

Belo Horizonte

Pague em até 4x no Cartão de Crédito

Aceitamos cartões de crédito através do PayPal para pessoas físicas e depósito bancário ou boleto para pessoas jurídicas.
BotãoCheckout
Objetivo: Curso destinado a profissionais que desejam ingressar na área de Big Data para ingestão de Dados Estruturados. Serão abordados temas básicos como conhecimento do ecossistema, funcionamento do cluster e métodos de ingestão de Dados. Focado em Engenharia de Dados.

Carga Horária: 16 horas

Público-Alvo: Iniciantes na área de Big Data com conhecimento básico em SQL e Banco de Dados.  

Conteúdo programático:
Dia 1 (8 horas)
O que é Big Data ?
- Introdução
- 4 Vs do Big Data
- Utilização
- Cases de Sucesso
- BI x Big Data - Qual o futuro?
- Data Engineer x Data Scientist
- Ecossistema e Arquitetura Hadoop
O que é Hadoop?
- Principais Características
- Arquitetura e Distribuições
- Arquitetura HDFS
- Arquitetura MapReduce
- Infraestrutura  e Componentes
- Apresentação do Flume
- Apresentação do Sqoop
- Apresentação do Zookeeper
- Apresentação do Oozie
- Apresentação do Pig
- Apresentação do Hbase
- VM Cloudera
- Logs
- HDFS
- Principais Comandos
Exercício 1 - Conhecendo o HDFS
Apache Hive
- Apresentação
- Detalhamento da Sintaxe HQL
- Tabelas
- Tabelas Externas
- Tabelas Gerenciadas
- Índices
- Partições
Exercício 2 - Ingestão de Dados com Sqoop
Exercício 3 - Ingestão de Dados Simpsons com Beeline
Exercício 4 - Ingestão de Dados com o HUE
Apache Impala
- Apresentação
- Conceito MPP
- Arquitetura
- Particionamento
- Impala x Hive
Exercício 5 - Ingestão de Dados via Shell Impala
Exercício 6 - Leitura de Dados com Impala Web
Dia 2 (8 horas)
Analise de Dados X Carga de Dados
- Data Engineer – Responsabilidades
- Data Scientist - Responsabilidades
O que é o Spark
- Apresentação
- O que é RDD
- Dataframe e DataSource
Linguagem Scala
- Apresentação
- Conceitos Básicos
- Loop e Condicional
- Foreach
- Tipos de Dados
- Parametrização de Arrays
- Listas
- Tuplas
- Sets
- Maps
- Manipulação de Arquivos
Exercicio 1 - Explorando o Hive com Scala
Exercicio 2 - Data Source com Scala
Exercicio 3 - Data Frame com Scala
O que é python
- Apresentação
- Conceitos Básicos
- Variáveis e Tipos de Dados
- Condicionais
- Repetições
- Listas
- Funções Lambdas
Exercicio 4 - Ingestão de Arquivo CSV com Python
Exercicio 5 - Ingestão de Arquivo JSON com Python
Anaconda
- O que é a distribuição Anaconda
- Quem utiliza
- Jupyter Notebook
- Apresentação do Ambiente
Exercicio 6 - Instalando o Anaconda
Exercicio 7 - Conhecendo o Jupyter Notebook
Exercicio 8 - Uber - Data Scientist
Linguagem R
- Apresentação
- Conceitos Básicos
- R Studio
Exercicio 9 - Conhecendo o R
Exercicio 10 - Gráficos e Analise em R


Instrutora: Juliana Maria Lopes
- Big Data - Senior Data Engineer / Business Intelligence
- Conhecimentos em Big Data: Análise de Dados – Python; HDFS; Apache Hadoop; Apache Spark; Hive / Banco de Dados NoSql – MongoDB; Hbase; Cassandra; Amazon DynamoDB / Ecossistemas FastData – Microsoft Azure; AWS; Google Cloud; Cloudera.
- Atualmente compõe o time de gestão de dados no ambiente Big Data da Telefônica Brasil
- 10 anos de experiência em diversas plataformas de Business Intelligence.
- Formação em MBA em Gestão de TI pela FIAP
- Graduação em Desenvolvimento de Software pela FIAP e Ciência da Computação pela Universidade Anhembi Morumbi

Brasília

Out
24

24/10/18 - 26/10/18

Out
29

29/10/18 - 31/10/18

Nov
5

05/11/18 - 06/11/18

Nov
21

21/11/18 - 23/11/18

Nov
26

26/11/18 - 28/11/18

Nov
26

26/11/18 - 28/11/18

Rio de Janeiro

Newsletters

Assinar

Assine nossa newsletter e receba no sei e-mail o calendário de turmas abertas e novos treinamentos!

Onde estamos

Matriz:
Al dos Guatás, 468 sl.55
Saúde - São Paulo
CEP: 04053-041

Telefones:
(11) 4063-6450
(21) 4063-6250
(61) 4063-6350
(11) 3181-5166

Calendário

loader

Visitantes

0572873
Today
Yesterday
This Week
Last Week
This Month
Last Month
All days
94
276
753
1820
7944
10303
572873

Forecast Today
216

15.96%
18.40%
10.34%
6.62%
0.50%
48.17%
Online (15 minutes ago):17
17 guests
no members

Your IP:54.81.150.27