点击选择搜索分类

毛毛书库 -Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著精美图片

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著电子书下载地址

》Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著电子书籍版权问题请点击这里查看《

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著书籍详细信息

ISBN：9787564170011
作者：暂无作者
出版社：暂无出版社
出版时间：2017-02
页数：暂无页数
价格：56.90
纸张：轻型纸
装帧：平装-胶订
开本：16开
语言：未知
丛书：暂无丛书
TAG：暂无
豆瓣评分：暂无豆瓣评分
豆瓣短评：点击查看
豆瓣讨论：点击查看
豆瓣目录：点击查看
读书笔记：点击查看
原文摘录：点击查看

寄语：

新华书店正版，关注店铺成为会员可享店铺专属优惠，团购客户请咨询在线客服！

内容简介：

在使用ApacheHadoop设计端到端数据管理解决方案时，获得专家级指导。当其它很多渠道还停留在解释Hadoop生态系统中该如何使用各种纷纭复杂的组件时，这本专注实践的书已带领您从架构的整体角度思考，这样的角度对于您的特别应用场景而言，是必不可少的。它将所有组件紧密结合在一起，形成完整有针对性的应用程序。为了增强学习效果，本书第二部分提供了各种详细的架构案例，涵盖部分很常见的Hadoop应用场景。无论您在设计一个新的Hadoop应用，或者正计划将Hadoop整合到现有的数据基础架构中，本书都将在整个过程中提供技巧性的导引。

书籍目录：

Foreword

Preface

Part Ⅰ.Architectural Considerations for Hadoop Applications

1. Data Modeling in Hadoop

Data Storage Options

Standard File Formats

Hadoop File Types

Serialization Formats

Columnar Formats

Compression

HDFS Schema Design

Location of HDFS Files

Advanced HDFS Schema Design

HDFS Schema Design Summary

HBase Schema Design

Row Key

Timestamp

Hops

Tables and Regions

Using Columns

Using Column Families

Time-to-Live

Managing Metadata

What Is Metadata?

Why Care About Metadata?

Where to Store Metadata?

Examples of Managing Metadata

Limitations of the Hive Metastore and HCatalog

Other Ways of Storing Metadata

Conclusion

2. Data Movement

Data Ingestion Considerations

Timeliness of Data Ingestion

Incremental Updates

Access Patterns

Original Source System and Data Structure

Transformations

Network Bottlenecks

Network Security

Push or Pull

Failure Handling

Level of Complexity

Data Ingestion Options

File Transfers

Considerations for File Transfers versus Other Ingest Methods

Sqoop: Batch Transfer Between Hadoop and Relational Databases

Flume: Event-Based Data Collection and Processing

Kafka

Data Extraction

Conclusion

3. Processing Data in Hadoop

MapReduce

MapReduce Overview

Example for MapReduce

When to Use MapReduce

Spark

Spark Overview

Overview of Spark Components

Basic Spark Concepts

Benefits of Using Spark

Spark Example

When to Use Spark

Abstractions

Pig

Pig Example

When to Use Pig

Crunch

Crunch Example

When to Use Crunch

Cascading

Cascading Example

When to Use Cascading

Hive

Hive Overview

Example of Hive Code

When to Use Hive

Impala

Impala Overview

Speed-Oriented Design

Impala Example

When to Use Impala

Conclusion

4. Common Hadoop Processing Patterns

Pattern: Removing Duplicate Records by Primary Key

Data Generation for Deduplication Example

Code Example: Spark Deduplication in Scala

Code Example: Deduplication in SQL

Pattern: Windowing Analysis

Data Generation for Windowing Analysis Example

Code Example: Peaks and Valleys in Spark

Code Example: Peaks and Valleys in SQL

Pattern: Time Series Modifications

Use HBase and Versioning

Use HBase with a RowKey of RecordKey and StartTime

Use HDFS and Rewrite the Whole Table

Use Partitions on HDFS for Current and Historical Records

Data Generation for Time Series Example

Code Example: Time Series in Spark

Code Example: Time Series in SQL

Conclusion

5. Graph Processing on Hadoop

What Is a Graph?

What Is Graph Processing?

How Do You Process a Graph in a Distributed System?

The Bulk Synchronous Parallel Model

BSP by Example

Giraph

Read and Partition the Data

Batch Process the Graph with BSP

Write the Graph Back to Disk

Putting It All Together

When Should You Use Giraph?

GraphX

Just Another RDD

GraphX Pregel Interface

vprog0

sendMessage0

mergeMessage0

Which Tool to Use?

Conclusion

6. Orchestration

Why We Need Workflow Orchestration

The Limits of Scripting

The Enterprise Job Scheduler and Hadoop

Orchestration Frameworks in the Hadoop Ecosystem

Oozie Terminology

Oozie Overview

Oozie Workflow

Workflow Patterns

Point-to-Point Workflow

Fan- Out Workflow

Capture-and-Decide Workflow

Parameterizing Workflows

Classpath Definition

Scheduling Patterns

Frequency Scheduling

Time and Data Triggers

Executing Workflows

Conclusion

7. Near-Real-Time Processing with Hadoop

Stream Processing

Apache Storm

Storm High-Level Architecture

Storm Topologies

Tuples and Streams

Spouts and Bolts

Stream Groupings

Reliability of Storm Applications

Exactly-Once Processing

Fault Tolerance

Integrating Storm with HDFS

Integrating Storm with HBase

Storm Example: Simple Moving Average

Evaluating Storm

Trident

Trident Example: Simple Moving Average

Evaluating Trident

Spark Streaming

Overview of Spark Streaming

Spark Streaming Example: Simple Count

Spark Streaming Example: Multiple Inputs

Spark Streaming Example: Maintaining State

Spark Streaming Example: Windowing

Spark Streaming Example: Streaming versus ETL Code

Evaluating Spark Streaming

Flume Interceptors

Which Tool to Use?

Low-Latency Enrichment, Validation, Alerting, and Ingestion

NRT Counting, Rolling Averages, and Iterative Processing

Complex Data Pipelines

Conclusion

Part Ⅱ. Case Studies

8. Clickstream Analysis

Defining the Use Case

Using Hadoop for Clickstream Analysis

Design Overview

Storage

Ingestion

The Client Tier

The Collector Tier

Processing

Data Deduplication

Sessionization

Analyzing

Orchestration

Conclusion

9. Fraud Detection

Continuous Improvement

Taking Action

Architectural Requirements of Fraud Detection Systems

Introducing Our Use Case

High-Level Design

Client Architecture

Profile Storage and Retrieval

Caching

HBase Data Definition

Delivering Transaction Status: Approved or Denied?

Ingest

Path Between the Client and Flume

Near-Real-Time and Exploratory Analytics

Near-Real-Time Processing

Exploratory Analytics

What About Other Architectures?

Flume Interceptors

Kafka to Storm or Spark Streaming

External Business Rules Engine

Conclusion

10. Data Warehouse

Using Hadoop for Data Warehousing

Defining the Use Case

OLTP Schema

Data Warehouse: Introduction and Terminology

Data Warehousing with Hadoop

High-Level Design

Data Modeling and Storage

Ingestion

Data Processing and Access

Aggregations

Data Export

Orchestration

Conclusion

A. Joins in Impala

Index

作者介绍：

Mark Grover，是Apache Bigtop的代码贡献者以及ApacheSentry的项目管理委员会成员和代码贡献者。Ted Malaska，是Cloude ra的不错应用架构师，帮助客户使用Hadoop及其生态系统。

Jonathan Seidman，是Cloudera的应用架构师，帮助合作伙伴把他们的解决方案集成到Cloudera的软件栈中。

Gwen Shapira，是Cloudera的应用架构师，在为客户设计可扩展的数据架构方面有15年的经验。

出版社信息：

暂无出版社相关信息，正在全力查找中！

书籍摘录：

暂无相关书籍摘录，正在全力查找中！

在线阅读/听书/购买/PDF下载地址：

在线阅读地址：Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著在线阅读

在线听书地址：Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著在线收听

在线购买地址：Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著在线购买

原文赏析：

暂无原文赏析，正在全力查找中！

其它内容：

暂无其它内容！

书籍真实打分

故事情节：5分
人物塑造：3分
主题深度：7分
文字风格：8分
语言运用：3分
文笔流畅：3分
思想传递：3分
知识深度：4分
知识广度：3分
实用性：3分
章节划分：9分
结构布局：9分
新颖与独特：3分
情感共鸣：5分
引人入胜：9分
现实相关：4分
沉浸感：7分
事实准确性：4分
文化贡献：6分

网站评分

书籍多样性：5分
书籍信息完全性：8分
网站更新速度：3分
使用便利性：5分
书籍清晰度：9分
书籍格式兼容性：9分
是否包含广告：7分
加载速度：7分
安全性：4分
稳定性：6分
搜索功能：4分
下载便捷性：8分

下载点评

无广告(266+)
已买(168+)
经典(161+)
体验满分(558+)
不亏(670+)
中评多(233+)
二星好评(185+)
实惠(435+)

下载评价

网友居***南：
请问，能在线转换格式吗？
网友詹***萍：
好评的，这是自己一直选择的下载书的网站
网友堵***格：
OK，还可以
网友后***之：
强烈推荐！无论下载速度还是书籍内容都没话说真的很良心！
网友养***秋：
我是新来的考古学家
网友国***舒：
中评，付点钱这里能找到就找到了，找不到别的地方也不一定能找到
网友訾***晴：
挺好的，书籍丰富
网友温***欣：
可以可以可以
网友辛***玮：
页面不错整体风格喜欢

喜欢"Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著"的人也看了

全格式电子版 - 免费下载

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著

【点击查看】直接下载文件

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著分类索引数据信息

ISBN：9787564170011
出版社：暂无出版社
出版日期：2017-02
作者：暂无作者
TAGS：暂无

随机推荐

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著电子书下载地址

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著书籍详细信息

寄语：

内容简介：

书籍目录：

作者介绍：

出版社信息：

书籍摘录：

在线阅读/听书/购买/PDF下载地址：

原文赏析：

其它内容：

书籍真实打分

网站评分

下载点评

下载评价

喜欢"Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著"的人也看了

英汉双向生物化学词典 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

晋唐二王书系字典 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

高职物流管理专业服务区域经济发展的研究与实践合肥工业大学出版社 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

围棋文献集成(18玉局藏机外三种)(精)/围棋全书/棋文化全书 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

主题酒店创意设计实录 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

冠状动脉慢性完全闭塞病变介入治疗 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

Premiere Pro基础与实战教程 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

浪客日月抄之四凶刃 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

Oxford Bookworms Library: Level 1: The Butler Did It MP3 Pack mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

电脑音乐制作与编配解读 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等 著 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等 著电子书下载地址

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等 著书籍详细信息

寄语：

内容简介：

书籍目录：

作者介绍：

出版社信息：

书籍摘录：

在线阅读/听书/购买/PDF下载地址：

原文赏析：

其它内容：

书籍真实打分

网站评分

下载点评

下载评价

喜欢"Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等 著"的人也看了

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著 mobi pdf azw3 夸克云 pdb 115盘 lrf 下载

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著电子书下载地址

Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著书籍详细信息

喜欢"Hadoop应用架构 (美)马克·格罗弗(Mark Grover) 等著"的人也看了