Style Switcher

Layout options
  • Boxed Layout
  • Full Width Layout
Primary Color

Palestra 13/11/2018 São Paulo

Palestras Gratuitas com os Temas:
A importância da Governança de dados para o BIGDATA: Palestrante - Caetano A. Silva
MDM x Governança de Dados: Palestrante - Samuel Laverde - Multivarejo
Lei de Proteção de Dados ( LGPD e GDPR ): Palestrante - Sérgio Silva - Claro
Mais detalhes sobre os temas...
 
Data: 13/11/2018 - terça-feira
Local: Domore - Av. Paulista, 807 - 18° Andar - São Paulo/SP
Horário: 09:00hrs às 12:30hrs
Vagas limitadas!
Inscrições com: Silvio Castro
silvio@cstreina.com.br
11 4063 6450
11 9 9595 9361

São Paulo

Nov
19

19/11/18 - 21/11/18

Nov
19

19/11/18 - 23/11/18

Dez
3

03/12/18 - 05/12/18

Dez
10

10/12/18 - 11/12/18

Dez
13

13/12/18 - 14/12/18

Belo Horizonte

No eventos found

Pague em até 4x no Cartão de Crédito

Aceitamos cartões de crédito através do PayPal para pessoas físicas e depósito bancário ou boleto para pessoas jurídicas.
BotãoCheckout
Objetivo: Curso destinado a profissionais que desejam ingressar na área de Big Data para ingestão de Dados Estruturados. Serão abordados temas básicos como conhecimento do ecossistema, funcionamento do cluster e métodos de ingestão de Dados. Focado em Engenharia de Dados.

Carga Horária: 16 horas

Público-Alvo: Iniciantes na área de Big Data com conhecimento básico em SQL e Banco de Dados.  

Conteúdo programático:
Dia 1 (8 horas)
O que é Big Data ?
- Introdução
- 4 Vs do Big Data
- Utilização
- Cases de Sucesso
- BI x Big Data - Qual o futuro?
- Data Engineer x Data Scientist
- Ecossistema e Arquitetura Hadoop
O que é Hadoop?
- Principais Características
- Arquitetura e Distribuições
- Arquitetura HDFS
- Arquitetura MapReduce
- Infraestrutura  e Componentes
- Apresentação do Flume
- Apresentação do Sqoop
- Apresentação do Zookeeper
- Apresentação do Oozie
- Apresentação do Pig
- Apresentação do Hbase
- VM Cloudera
- Logs
- HDFS
- Principais Comandos
Exercício 1 - Conhecendo o HDFS
Apache Hive
- Apresentação
- Detalhamento da Sintaxe HQL
- Tabelas
- Tabelas Externas
- Tabelas Gerenciadas
- Índices
- Partições
Exercício 2 - Ingestão de Dados com Sqoop
Exercício 3 - Ingestão de Dados Simpsons com Beeline
Exercício 4 - Ingestão de Dados com o HUE
Apache Impala
- Apresentação
- Conceito MPP
- Arquitetura
- Particionamento
- Impala x Hive
Exercício 5 - Ingestão de Dados via Shell Impala
Exercício 6 - Leitura de Dados com Impala Web
Dia 2 (8 horas)
Analise de Dados X Carga de Dados
- Data Engineer – Responsabilidades
- Data Scientist - Responsabilidades
O que é o Spark
- Apresentação
- O que é RDD
- Dataframe e DataSource
Linguagem Scala
- Apresentação
- Conceitos Básicos
- Loop e Condicional
- Foreach
- Tipos de Dados
- Parametrização de Arrays
- Listas
- Tuplas
- Sets
- Maps
- Manipulação de Arquivos
Exercicio 1 - Explorando o Hive com Scala
Exercicio 2 - Data Source com Scala
Exercicio 3 - Data Frame com Scala
O que é python
- Apresentação
- Conceitos Básicos
- Variáveis e Tipos de Dados
- Condicionais
- Repetições
- Listas
- Funções Lambdas
Exercicio 4 - Ingestão de Arquivo CSV com Python
Exercicio 5 - Ingestão de Arquivo JSON com Python
Anaconda
- O que é a distribuição Anaconda
- Quem utiliza
- Jupyter Notebook
- Apresentação do Ambiente
Exercicio 6 - Instalando o Anaconda
Exercicio 7 - Conhecendo o Jupyter Notebook
Exercicio 8 - Uber - Data Scientist
Linguagem R
- Apresentação
- Conceitos Básicos
- R Studio
Exercicio 9 - Conhecendo o R
Exercicio 10 - Gráficos e Analise em R


Instrutora: Juliana Maria Lopes
- Big Data - Senior Data Engineer / Business Intelligence
- Conhecimentos em Big Data: Análise de Dados – Python; HDFS; Apache Hadoop; Apache Spark; Hive / Banco de Dados NoSql – MongoDB; Hbase; Cassandra; Amazon DynamoDB / Ecossistemas FastData – Microsoft Azure; AWS; Google Cloud; Cloudera.
- Atualmente compõe o time de gestão de dados no ambiente Big Data da Telefônica Brasil
- 10 anos de experiência em diversas plataformas de Business Intelligence.
- Formação em MBA em Gestão de TI pela FIAP
- Graduação em Desenvolvimento de Software pela FIAP e Ciência da Computação pela Universidade Anhembi Morumbi

Brasília

Nov
19

19/11/18 - 23/11/18

Nov
21

21/11/18 - 23/11/18

Nov
26

26/11/18 - 28/11/18

Rio de Janeiro

Newsletters

Assinar

Assine nossa newsletter e receba no sei e-mail o calendário de turmas abertas e novos treinamentos!

Onde estamos

Matriz:
Al dos Guatás, 468 sl.55
Saúde - São Paulo
CEP: 04053-041

Telefones:
(11) 4063-6450
(21) 4063-6250
(61) 4063-6350
(11) 3181-5166

Calendário

loader

Visitantes

0586714
Today
Yesterday
This Week
Last Week
This Month
Last Month
All days
83
192
1247
2095
3883
8692
586714

Forecast Today
216

15.68%
18.72%
10.24%
6.65%
0.57%
48.15%
Online (15 minutes ago):14
14 guests
no members

Your IP:54.82.93.116