Analítica de dados com Hadoop

Analítica de dados com Hadoop Benjamin Bengfort
Jenny Kim


Compartilhe


Analítica de dados com Hadoop


Uma introdução para cientistas de dados




Pronto para usar técnicas estatísticas e de aprendizado de máquina (machine learning) em grandes conjuntos de dados? Este guia prático mostra por que o ecossistema do Hadoop é perfeito para essa tarefa. Em vez de ter como foco a implantação, as operações ou o desenvolvimento de softwares geralmente associados à computação distribuída, você se concentrará nas análises particulares que poderá fazer, nas técnicas de armazém de dados (data warehousing) oferecidas pelo Hadoop e em fluxos de trabalho de alta ordem que esse framework é capaz de gerar.

Os cientistas e os analistas de dados aprenderão a usar diversas técnicas que variam da escrita de aplicações MapReduce e Spark com Python ao uso de modelagem avançada e gerenciamento de dados com Spark MLlib, Hive e HBase. Você também conhecerá os processos analíticos e os sistemas de dados disponíveis para desenvolver e conferir eficácia aos produtos de dados capazes de lidar com – e que, na verdade, exigem – quantidades enormes de dados.

Entenda os conceitos principais do Hadoop e do processamento em cluster.
Utilize padrões de projeto e algoritmos analíticos paralelos para criar jobs de análise de dados distribuídos.
Adquira conhecimentos sobre gerenciamento de dados, mineração e armazém de dados em um contexto distribuído usando Apache Hive e HBase.
Utilize Sqoop e Apache Flume para entrada de dados a partir de bancos de dados relacionais.
Programe aplicações Hadoop e Spark complexas com Apache Pig e Spark DataFrames.
Utilize técnicas de aprendizado de máquina, como classificação, clustering e filtragem colaborativa, com a MLib do Spark.

Informática e Tecnologia

Edições (1)

ver mais
Analítica de dados com Hadoop

Similares

(15) ver mais
AWS para desenvolvedores
Amazon Web Services em ação
SQL e Teoria Relacional
Projeto de Banco de Dados e Teoria Relacional

Estatísticas

Desejam3
Trocam
Informações não disponíveis
Avaliações 5.0 / 1
5
ranking 100
100%
4
ranking 0
0%
3
ranking 0
0%
2
ranking 0
0%
1
ranking 0
0%

53%

47%

novatec
cadastrou em:
12/09/2016 14:21:13