Style Switcher

Layout options
  • Boxed Layout
  • Full Width Layout
Primary Color

Palestra 23/02/18 São Paulo

Tema: Evolução da maturidade da Governança de Dados nas Corporações
As empresas e organizações identificaram a necessidade de fazer uma melhor gestão dos seus dados e informações através do processo de Governança de dados, mas logo no início percebem que este tema é extenso e complexo, com muitas frentes para agir, e temas variados, tais como, Qualidade de Dados, Arquitetura de Dados, MDM, BI e DW, Big Data, Segurança da Informação.
Por onde começar? Como estabelecer um planejamento de longo prazo para seguir com uma implantação da Governança? Quais as prioridades da minha empresa em relação a Governança?
Estas dúvidas e muitas outras surgem nas equipes de Governança e os modelos de maturidade, como o SEI-DMM Model, podem ajudar a construir um Roadmap para a melhoria da Gestão de Dados e sua Governança.
Palestra importante para os profissionais de Gestão de Dados, Governança de dados, Qualidade de Dados, BI, Sistemas, TI, MDM e Negócios.
 
Data: 23/02/2018 - sexta-feira
Local: Domore - Av. Paulista, 807 - 12° Andar - São Paulo/SP
Horário: 9:00hrs às 12:00hrs
Vagas limitadas, ATENÇÃO somente pessoas pré-cadastradas poderão acessar o local.
Reservas: silvio@cstreina.com.br

São Paulo

Fev
26

26/02/18 - 28/02/18

Mar
12

12/03/18 - 14/03/18

Mar
15

15/03/18 - 16/03/18

Mar
19

19/03/18 - 21/03/18

Belo Horizonte

Porto Alegre

No eventos found

Pague em até 4x no Cartão de Crédito

Aceitamos cartões de crédito através do PayPal para pessoas físicas e depósito bancário ou boleto para pessoas jurídicas.
BotãoCheckout
Objetivo: Curso destinado a profissionais que desejam ingressar na área de Big Data para ingestão de Dados Estruturados. Serão abordados temas básicos como conhecimento do ecossistema, funcionamento do cluster e métodos de ingestão de Dados. Focado em Engenharia de Dados.

Carga Horária: 16 horas

Público-Alvo: Iniciantes na área de Big Data com conhecimento básico em SQL e Banco de Dados.  

Conteúdo programático:
Dia 1 (8 horas)
O que é Big Data ?
- Introdução
- 4 Vs do Big Data
- Utilização
- Cases de Sucesso
- BI x Big Data - Qual o futuro?
- Data Engineer x Data Scientist
- Ecossistema e Arquitetura Hadoop
O que é Hadoop?
- Principais Características
- Arquitetura e Distribuições
- Arquitetura HDFS
- Arquitetura MapReduce
- Infraestrutura  e Componentes
- Apresentação do Flume
- Apresentação do Sqoop
- Apresentação do Zookeeper
- Apresentação do Oozie
- Apresentação do Pig
- Apresentação do Hbase
- VM Cloudera
- Logs
- HDFS
- Principais Comandos
Exercício 1 - Conhecendo o HDFS
Apache Hive
- Apresentação
- Detalhamento da Sintaxe HQL
- Tabelas
- Tabelas Externas
- Tabelas Gerenciadas
- Índices
- Partições
Exercício 2 - Ingestão de Dados com Sqoop
Exercício 3 - Ingestão de Dados Simpsons com Beeline
Exercício 4 - Ingestão de Dados com o HUE
Apache Impala
- Apresentação
- Conceito MPP
- Arquitetura
- Particionamento
- Impala x Hive
Exercício 5 - Ingestão de Dados via Shell Impala
Exercício 6 - Leitura de Dados com Impala Web
Dia 2 (8 horas)
Analise de Dados X Carga de Dados
- Data Engineer – Responsabilidades
- Data Scientist - Responsabilidades
O que é o Spark
- Apresentação
- O que é RDD
- Dataframe e DataSource
Linguagem Scala
- Apresentação
- Conceitos Básicos
- Loop e Condicional
- Foreach
- Tipos de Dados
- Parametrização de Arrays
- Listas
- Tuplas
- Sets
- Maps
- Manipulação de Arquivos
Exercicio 1 - Explorando o Hive com Scala
Exercicio 2 - Data Source com Scala
Exercicio 3 - Data Frame com Scala
O que é python
- Apresentação
- Conceitos Básicos
- Variáveis e Tipos de Dados
- Condicionais
- Repetições
- Listas
- Funções Lambdas
Exercicio 4 - Ingestão de Arquivo CSV com Python
Exercicio 5 - Ingestão de Arquivo JSON com Python
Anaconda
- O que é a distribuição Anaconda
- Quem utiliza
- Jupyter Notebook
- Apresentação do Ambiente
Exercicio 6 - Instalando o Anaconda
Exercicio 7 - Conhecendo o Jupyter Notebook
Exercicio 8 - Uber - Data Scientist
Linguagem R
- Apresentação
- Conceitos Básicos
- R Studio
Exercicio 9 - Conhecendo o R
Exercicio 10 - Gráficos e Analise em R


Instrutora: Juliana Maria Lopes
- Big Data - Senior Data Engineer / Business Intelligence
- Conhecimentos em Big Data: Análise de Dados – Python; HDFS; Apache Hadoop; Apache Spark; Hive / Banco de Dados NoSql – MongoDB; Hbase; Cassandra; Amazon DynamoDB / Ecossistemas FastData – Microsoft Azure; AWS; Google Cloud; Cloudera.
- Atualmente compõe o time de gestão de dados no ambiente Big Data da Telefônica Brasil
- 10 anos de experiência em diversas plataformas de Business Intelligence.
- Formação em MBA em Gestão de TI pela FIAP
- Graduação em Desenvolvimento de Software pela FIAP e Ciência da Computação pela Universidade Anhembi Morumbi

Curitiba

No eventos found

Newsletters

Assinar

Assine nossa newsletter e receba no sei e-mail o calendário de turmas abertas e novos treinamentos!

Onde estamos

Matriz:
Al dos Guatás, 468 sl.55
Saúde - São Paulo
CEP: 04053-041

Telefones:
(11) 4063-6450
(21) 4063-6250
(61) 4063-6350
(11) 3181-5166

Calendário

loader

Visitantes

0498658
Today
Yesterday
This Week
Last Week
This Month
Last Month
All days
557
451
3344
3529
11058
13689
498658

17.54%
18.22%
10.08%
6.50%
0.18%
47.48%
Online (15 minutes ago):10
10 guests
no members

Your IP:54.167.29.208