Curso de Hadoop

Muito têm sido falado sobre big data. Mas o que é, de fato, e o que pode trazer de benefício para sua empresa? Mais que isso, como podemos extrair valor dos dados armazenados na empresa? Essa é a proposta do big data, que veremos neste curso de Hadoop.

Curso de Hadoop

Este é um curso prático sobre Apache Hadoop, a implementação mais conhecida para soluções de Big Data e chegaremos a um nível intermediário no uso das ferramentas, suficiente para programar e configurar um ambiente de produção. Para tanto, temos roteiros de implantação do cluster e os passos necessários para criar soluções para as principais demandas de big data.

Hadoop
Apache Hadoop

O início do treinamento indica o caminho para começar a usar as ferramentas e tem um nível básico de dificuldade. Depois de vencida a barreira inicial, os alunos terão contato com Linux e Java em nível intermediário, chegando ao final do curso com conhecimento suficiente para fazer o planejamento da infraestrutura do cluster.

As aulas mostram quais os problemas que podemos resolver com Hadoop, como as análises de grandes volumes de dados, sempre utilizando dados públicos. Também veremos quais problemas o Hadoop não resolve e qual a ferramenta adequada nesse caso. No final teremos um projeto completo, onde iremos juntar todas as partes e criar uma solução big data integrada com bancos de dados relacionais.

Quando decidimos por adotar uma solução de big data, alguns critérios devem ser observados:

  • Estratégia para implementação – como a empresa deve ser preparada para a adoção do big data?
  • Métricas para comparação – como vamos comparar e decidir se a infraestrutura de big data trouxe resultados?
  • Análise de dados – que tipo de informação pode ser extraída do conjunto de dados?
  • Relatórios – como apresentar os resultados analisados?

O curso está disponível na Escola Linux, que disponibiliza vários outros cursos. O nosso curso de Hadoop está neste link.

Ementa

  • Big Data
  • Apache Hadoop 2.x
  • MapReduce
  • Instalação/administração do cluster
  • HDFS
  • YARN

Aulas

    As aulas estão divididas assim:

  • Aula 00: conceitos sobre big data e Hadoop
  • Aula 01: configuração do ambiente de desenvolvimento
  • Aula 02: Apache Hadoop MapReduce
  • Aula 03: instalação e configuração do cluster
  • Aula 04: O sistema de arquivos HDFS
  • Aula 05: YARN
  • Aula 06: Sqoop / Projeto final

O aluno

O público alvo esperado é composto por programadores, analistas de BI/ETL/DW, profissionais de infra-estrutura, gerentes de projeto, DBAs e Administradores de dados.

É interessante, mas não necessário, ter conhecimentos básicos sobre Linux e programação Java, pois os exemplos usam essa linguagem.

Depois do curso, o aluno estará apto a instalar um cluster Hadoop, administrar o sistema de arquivos, criar programas MapReduce e integrar sua aplicação com um banco de dados relacional.

Link para o curso

O curso está disponível aqui.

Leave a Reply

Your email address will not be published. Required fields are marked *