Style Switcher

Layout options
  • Boxed Layout
  • Full Width Layout
Primary Color

São Paulo

Pague em até 4x no Cartão de Crédito

Aceitamos cartões de crédito através do PayPal para pessoas físicas e depósito bancário ou boleto para pessoas jurídicas.
BotãoCheckout

Treinamentos

Objetivo: Curso destinado a profissionais que desejam ingressar na área de Big Data para ingestão de Dados Estruturados. Serão abordados temas básicos como conhecimento do ecossistema, funcionamento do cluster e métodos de ingestão de Dados. Focado em Engenharia de Dados.

Carga Horária: 16 horas

Público-Alvo: Iniciantes na área de Big Data com conhecimento básico em SQL e Banco de Dados.  

Conteúdo programático:
Dia 1 (8 horas)
O que é Big Data ?
- Introdução
- 4 Vs do Big Data
- Utilização
- Cases de Sucesso
- BI x Big Data - Qual o futuro?
- Data Engineer x Data Scientist
- Ecossistema e Arquitetura Hadoop
O que é Hadoop?
- Principais Características
- Arquitetura e Distribuições
- Arquitetura HDFS
- Arquitetura MapReduce
- Infraestrutura  e Componentes
- Apresentação do Flume
- Apresentação do Sqoop
- Apresentação do Zookeeper
- Apresentação do Oozie
- Apresentação do Pig
- Apresentação do Hbase
- VM Cloudera
- Logs
- HDFS
- Principais Comandos
Exercício 1 - Conhecendo o HDFS
Apache Hive
- Apresentação
- Detalhamento da Sintaxe HQL
- Tabelas
- Tabelas Externas
- Tabelas Gerenciadas
- Índices
- Partições
Exercício 2 - Ingestão de Dados com Sqoop
Exercício 3 - Ingestão de Dados Simpsons com Beeline
Exercício 4 - Ingestão de Dados com o HUE
Apache Impala
- Apresentação
- Conceito MPP
- Arquitetura
- Particionamento
- Impala x Hive
Exercício 5 - Ingestão de Dados via Shell Impala
Exercício 6 - Leitura de Dados com Impala Web
Dia 2 (8 horas)
Analise de Dados X Carga de Dados
- Data Engineer – Responsabilidades
- Data Scientist - Responsabilidades
O que é o Spark
- Apresentação
- O que é RDD
- Dataframe e DataSource
Linguagem Scala
- Apresentação
- Conceitos Básicos
- Loop e Condicional
- Foreach
- Tipos de Dados
- Parametrização de Arrays
- Listas
- Tuplas
- Sets
- Maps
- Manipulação de Arquivos
Exercicio 1 - Explorando o Hive com Scala
Exercicio 2 - Data Source com Scala
Exercicio 3 - Data Frame com Scala
O que é python
- Apresentação
- Conceitos Básicos
- Variáveis e Tipos de Dados
- Condicionais
- Repetições
- Listas
- Funções Lambdas
Exercicio 4 - Ingestão de Arquivo CSV com Python
Exercicio 5 - Ingestão de Arquivo JSON com Python
Anaconda
- O que é a distribuição Anaconda
- Quem utiliza
- Jupyter Notebook
- Apresentação do Ambiente
Exercicio 6 - Instalando o Anaconda
Exercicio 7 - Conhecendo o Jupyter Notebook
Exercicio 8 - Uber - Data Scientist
Linguagem R
- Apresentação
- Conceitos Básicos
- R Studio
Exercicio 9 - Conhecendo o R
Exercicio 10 - Gráficos e Analise em R


Instrutora: Juliana Maria Lopes
- Big Data - Senior Data Engineer / Business Intelligence
- Conhecimentos em Big Data: Análise de Dados – Python; HDFS; Apache Hadoop; Apache Spark; Hive / Banco de Dados NoSql – MongoDB; Hbase; Cassandra; Amazon DynamoDB / Ecossistemas FastData – Microsoft Azure; AWS; Google Cloud; Cloudera.
- Atualmente compõe o time de gestão de dados no ambiente Big Data da Telefônica Brasil
- 10 anos de experiência em diversas plataformas de Business Intelligence.
- Formação em MBA em Gestão de TI pela FIAP
- Graduação em Desenvolvimento de Software pela FIAP e Ciência da Computação pela Universidade Anhembi Morumbi

Objetivo: Capacitar os alunos para entender todo o ciclo de vida de sistemas de apoio a tomada de decisão, desde a escolha da arquitetura adequada para cada ambiente, passando pela implementação dos bancos de dados, rotinas de ETL e finalizando com a entrega e manutenção do ambiente de Data Warehouse e BI. O conteúdo deste curso foi desenvolvido com base na experiência prática de projetos reais e na literatura de Ralph Kimball. Durante o treinamento desenvolveremos modelos Dimensionais aplicando técnicas básicas e avançadas. Através de dinâmicas de grupo totalmente práticas simulamos situações reais do desenvolvimento de bancos de dados para Data Warehouse e Business Intelligence. Para isso usaremos o MS Power BI que oferece um ambiente completo para criar e compartilhar relatórios e painéis de BI, com baixo custo, alta qualidade, compartilhamento na nuvem e visualização em dispositivos móveis.
Carga Horária: 40 horas
Público-Alvo: Iniciantes na área de BI e DW com conhecimento básico em desenvolvimento de sistemas e banco de dados.  
Pré-requisitos: Conhecimentos de Análise e Desenvolvimento de Sistemas, Modelagem de banco de dados relacional (MER). 

Metodologia de ensino: Exposição teórica seguida de aplicação de exercícios práticos. 

Conteúdo programático:

- Introdução ao Ambiente DW e BI
- Conceitos básicos
Dado, Informação e Inteligência do Negócio
Conceitos de qualidade de dados e informação
Modelos de Dados Relacional e Dimensional
OLTP X OLAP
Contexto do Business Intelligence e Data Warehouse
Conceitos BI, DW, Data Mart, ODS, ETL
Projetos de Data Warehouse

- Alinhamento dos conceitos Modelo Entidade Relacionamento (MER) e Normalizaçã
Dinâmica de grupo: Modelagem Tradicional MER

- Gerenciamento de Projetos e Requisitos
Ciclo de vida Dimensional do Negócio
Planejamento e Gerenciamento do Projeto
Coletando Requisitos
Dinâmica de grupo: coleta de requisitos para Data Mart

 - Teoria e prática da Modelagem Multidimensional

Definição e histórico da Modelagem Multidimensional
Fatos, métricas e dimensões
Métricas Aditivas, Semi-aditivas e Não-aditivas, Atributos e Hierarquias
Star Schema e SnowFlake
Processo de modelagem dimensional
Melhores práticas de mercado
Dinâmica de grupo - Modelagem Multidimensional básica
Dinâmica de grupo - Modelagem Multidimensional intermediária
- Conceitos avançados
Análise de Requisitos para sistemas de BI
Tipos de Tabelas Fato, Transaction, Snapshot, Accumulating e Fato sem Fato
Tipos de Dimensões, Slowly Changing, Rapdly Changing, Degenerate
Tabela Ponte
Agregadas
- Arquitetura e ferramentas (ETL, Banco de dados, Front-end)
Dinâmica de Grupo – Projeto completo usando SQLServer e PowerBI.
Dinâmica de grupo – Ciclo de vida Modelagem Dimensional
- Arquitetura
Introdução à Arquitetura Data Warehouse
Arquitetura técnica (Back-end)
Arquitetura das aplicações (Front-end)
Infraestrutura e Metadados
Segurança da Informação
Planejando e mantendo a arquitetura do DW
Dinâmica de grupo: preparação do ambiente de BI

- Modelagem de dados para Power BI
Modelo relacional
Modelo Dimensional
Modelo Tabular
Recursos do Power BI para modelagem de dados
Recursos do Power BI para importação e tratamento dos dados
Exercício prático

- Workshop prático – Análise de mercado de ações
Buscando e importando dados NYSE e NASDAQ
Criando o modelo de dados do mercado de ações no Power BI
Criando métricas e cálculos
Criando hierarquias nas dimensões
Criando relatórios interativos
Relatórios usando dados geográficos

- Compartilhando Dados, Relatórios e Análises
Site do Power BI
Publicando do Power BI Desktop para o site Power BI
Compartilhamento de dados, relatórios e dashboards
Power BI para mobile

- Implementação
Desenvolvimento do ETL
Melhorando a modelagem física
Data Staging
Construindo as aplicações para usuário final
Dinâmica de grupo: construindo o sistema de BI

 - Operação e crescimento do DW
Planejando a implantação
Mantendo o DW
Crescimento do DW
Dinâmica de grupo: atualizando o sistema de BI

Obs.: Para as dinâmicas deste treinamento usaremos equipamentos com ferramentas, tais como, SAP Power Designer, Microsoft SQLServer 2012 ou Oracle 11g, MS Power BI.

Objetivo: Oferecer aos profissionais uma boa introdução do uso e aplicação de métodos analíticos em problemas do mundo real e desenvolver o raciocínio dos participantes em torno do entendimento do problema de negócio e de como os dados podem ser modelados para endereçar a resolução do problema.

Carga Horária: 24 horas

Público-Alvo: Indicado para os profissionais de Analytics, CRM, Gestão de dados, Banco de Dados, BI/DW, Gestão de Dados Mestres, Governança de Dados, Qualidade de Dados, Analistas de Negócios e TI.

Conteúdo programático:
• Conceitos básicos de importação e exportação de arquivos e saídas.
• Criação de variáveis, filtragem de dados, amostragem de dados, agrupamento, cruzamento e empilhamento de dados. A filosofia Tidyverse.
• Análise exploratória de dados, medidas de posição e dispersão, gráficos exploratórios, análise bivariada, peso da evidência e valor da informação.
• Categorização de dados, padronização de dados, análise de correlação.
• Aprendizagem Não Supervisionada e Segmentação Estatística (K-means, Kohonen, Dendogramas, Análise RFV)
• Aprendizagem Não Supervisionada, Análise de Associação e Cestas de Mercado
• Aprendizagem Supervisionada e Métricas de Avaliação de Modelos (K-S, Gini,AUC, Matriz de Confusão, R2, Mape, Lift, Curva de Ganhos)
• Aprendizagem Supervisionada e Modelos de Regressão Linear Múltipla, Regressão Logística e Árvores de Decisão
• Aprendizagem Supervisionada e Redes Neurais Artificiais
• Aprendizagem Supervisionada, Random Forests e Support Vector Machines
• Aprendizagem Supervisionada e Introdução às Séries Temporais
• Introdução à Mistura de Modelos (Ensemble Learning)
• Introdução à Mineração de Textos e Análise de Dados Não Estruturados
• Mini-competição de Ciência de Dados (Mini Hackathon)

Utilizaremos máquinas para os alunos praticarem os exercícios.
Aplicaremos Exercícios em sala e listas para resolução em casa, inclusive com um mini hackathon no final do curso.

Objetivo: Capacitar os participantes no desenvolvimento de Modelos Lógicos, Físicos e Multi Dimensionais aderentes ao negócio e usando todos os recursos da ferramenta ER/Studio Data Architect. Através da exposição da teoria, demonstrações e dinâmicas de grupos práticas.

O aluno irá conhecer o ambiente do ER/Studio Enterprise, instalar ER/Studio Data Architect, criar e gerenciar modelos lógicos, gerar e gerenciar modelos físicos, criar scripts de definição do banco de dados (DDL) com todos os detalhes, como triggers, procedures e views. E ainda, fazer engenharia reversa, comparar e unir modelos, sincronizar modelos e banco de dados, gerenciar grandes modelos no repositório e criar relatórios.

E ainda as funções avançadas do ER/Studio para Gestão de Dados Corporativos, padrões de nomenclatura, repositório de metadados, análise de impacto, gestão de dados mestres, portal de metadados e modelos.

Carga Horária:16 horas

Pré-requisitos: Conhecimentos de Análise e Desenvolvimento de Sistemas e banco de dados relacional.

Metodologia de ensino: Exposição teórica seguida de aplicação de exercícios práticos usando a ferramenta em laboratório. 

Conteúdo programático:

  • Embarcadero ER/Studio Enterprise

o    Identificando Componentes do Ambiente ER/Studio Enterprise
o    Instalação e configuração inicial
o    Licenciamento
o    Novidades da última versão ER/Studio

  • Modelos de dados lógicos
o    Usando Propriedades e opções de modelos
o    Criando Entidades, Atributos e Domínios
o    Criando Relacionamentos
o    Criando Links entre modelos
o    Validando um modelo

  • Modelos de dados físicos
o    Gerando um modelo físico a partir de outro modelo
o    Implementado integridade de dados
o    Criando Views, Stored Procedures e Triggers
o    Criando Índices e chaves alternativas
o    Desnormalizando o modelo físico
o    Gerando um banco de dados
o    Engenharia Reversa do banco de dados

  • Modelos Multi Dimensionais
o    Objetos dos diagramas multi dimensionais
o    Identificando fatos e dimensões
o    Fatos, Dimensões, Associações
o    Mapeamentos de dados ETL (Data Lineage)

  • Sincronização de Modelos
o    Comparando modelos
o    Unindo modelos
o    Sincronizando modelos

  • Organização dos modelos e Repositório
o    Configurações e Segurança
o    Check-in e Check-out
o    Criando e modificando Dicionário de Dados
o    Criando um Diagrama, sub-modelos, visões de modelos
o    Usando Mapeamentos Universais
o    Visualizando as dependências entre objetos

  • Conhecendo ER/Studio Portal
  • Conhecendo ER/Studio Business Architect
  • Relatórios e Macros
o    Gerando um relatório RTF ou HTML
o    Criando um novo Relatório RTF ou HTML
o    Usando Macros ER/Studio

  • Migrando de outras ferramentas para o ER/Studio
o    Importando arquivos individuais de outras ferramentas
o    Importando vários arquivos de outros repositórios
o    Atividades pós-importação
o    Diferenças de terminologias entre ER/Studio e outras ferramentas

Rio de Janeiro

Newsletters

Assinar

Assine nossa newsletter e receba no sei e-mail o calendário de turmas abertas e novos treinamentos!

Onde estamos

Matriz:
Al dos Guatás, 468 sl.55
Saúde - São Paulo
CEP: 04053-041

Telefones:
(11) 4063-6450
(21) 4063-6250
(61) 4063-6350
(11) 3181-5166

Calendário

loader

Visitantes

0685144
Today
Yesterday
This Week
Last Week
This Month
Last Month
All days
172
167
485
1776
2258
7418
685144

14.08%
21.08%
9.51%
6.51%
0.80%
48.03%
Online (15 minutes ago):2
2 guests
no members

Your IP:3.214.184.124