Entrar
    Book cover
    Compartilhar
    Editar
    • Sinopse
    • Edições1
    • Vídeos0
    • Grupos0
    • Resenhas1
    • Leitores134
    • Similares5
    Skoob logo

    Saiba mais

    Quem somosTermos de usoFale conoscoCentral de ajudaPrivacidade

    Fique por dentro

    Livros em destaque

    Explore

    LivrosAutoresEditorasLeitoresCortesias

    Siga nas redes sociais

    Baixe o app

    Google PlayApp Store

    Analítica de dados com Hadoop - Uma introdução para cientistas de dados

    Benjamin Bengfort, Jenny Kim

    Novatec Editora
    2016
    352 páginas
    11h 44m
    ISBN-13: 9788575225219
    Português Brasileiro
    4.8
    2 avaliações
    Leram9Lendo13Querem112Relendo0Abandonos0Resenhas1
    Favoritos2Desejados112Avaliaram2

    Pronto para usar técnicas estatísticas e de aprendizado de máquina (machine learning) em grandes conjuntos de dados? Este guia prático mostra por que o ecossistema do Hadoop é perfeito para essa tarefa. Em vez de ter como foco a implantação, as operações ou o desenvolvimento de softwares geralmente associados à computação distribuída, você se concentrará nas análises particulares que poderá fazer, nas técnicas de armazém de dados (data warehousing) oferecidas pelo Hadoop e em fluxos de trabalho de alta ordem que esse framework é capaz de gerar. Os cientistas e os analistas de dados aprenderão a usar diversas técnicas que variam da escrita de aplicações MapReduce e Spark com Python ao uso de modelagem avançada e gerenciamento de dados com Spark MLlib, Hive e HBase. Você também conhecerá os processos analíticos e os sistemas de dados disponíveis para desenvolver e conferir eficácia aos produtos de dados capazes de lidar com – e que, na verdade, exigem – quantidades enormes de dados. Entenda os conceitos principais do Hadoop e do processamento em cluster. Utilize padrões de projeto e algoritmos analíticos paralelos para criar jobs de análise de dados distribuídos. Adquira conhecimentos sobre gerenciamento de dados, mineração e armazém de dados em um contexto distribuído usando Apache Hive e HBase. Utilize Sqoop e Apache Flume para entrada de dados a partir de bancos de dados relacionais. Programe aplicações Hadoop e Spark complexas com Apache Pig e Spark DataFrames. Utilize técnicas de aprendizado de máquina, como classificação, clustering e filtragem colaborativa, com a MLib do Spark.

    Edições (1)

    Ver mais
    • book cover

    Similares (5)

    Ver mais
    • book cover
    • book cover
    • book cover
    • book cover
    • book cover
    Resenhas (1)Ver mais
    Sidiclei Aleixo Caixeta  picture
    Sidiclei Aleixo Caixeta 19/11/2024Resenhou um livro
    0

    Analítica de Dados com Hadoop

    "Análise de Dados com Hadoop" é um guia completo para quem deseja explorar o mundo da análise de dados em grande escala. O livro aborda os conceitos fundamentais do Hadoop, desde o armazenamento distribuído até o processamento de dados em paralelo. Através de exemplos práticos e explicações claras, você aprenderá a aplicar técnicas de data warehousing e a criar fluxos de trabalho robustos para extrair insights valiosos de seus dados. Ideal para cientistas de dados, analistas e profissionais que buscam dominar as ferramentas e técnicas essenciais para trabalhar com big data.

    curtir

    Estatísticas

    Avaliações

    4.8 / 2
    • 5 estrelas100%
    • 4 estrelas0%
    • 3 estrelas0%
    • 2 estrelas0%
    • 1 estrelas0%
    Benjamin Bengfort profile picture

    Benjamin Bengfort

    Benjamin Bengfort é cientista de dados e trabalha para terminar seu doutorado na Universidade de Maryland, onde estuda aprendizado de máquina e computação distribuída. Programador profissional por ofício, escreve sobre uma grande variedade de assuntos, de Processamento de Linguagem Natural e ciência de dados com Python a analítica (analytics) com Hadoop e Spark.

    1 Livro
    1 Seguidor

    Benjamin Bengfort