Hadoop权威指南

作者: Tom White
页数: 716
定价: 99.00
出版社: 清华大学出版社
出版时间: 2015-01
购买地址: 京东  

0

笔记

12

粉丝

推荐语:准备好释放数据的强大潜能了吗?借助于这本本书,你将学习如何使用ApacheHadoop构建和维护稳定性高、伸缩性强的分布式系统。本书是为程序员写的,可帮助他们分析任何大小的数据集。本书同时也是为管理员写的,帮助他们了解如何设置和运行Hadoop集群。   本书通过丰富的案例学习来解释Hadoop的幕后机理,阐述了Hadoop如何解决现实生活中的具体问题。第3版覆盖Hadoop的新动态,包括新增的MapReduceAPI,以及MapReduce2及其灵活性更强的执行模型(YARN)。

撰写笔记

您对本书籍还没有撰写任何笔记哦~

目录

第1章 初识Hadoop
1.1 数据!数据!
1.2 数据的存储与分析
1.3 相较于其他系统的优势
1.4 Hadoop发展简史
1.5 Apache Hadoop和Hadoop生态系统
1.6 Hadoop的发行版本
第2章 关于MapReduce
2.1 气象数据集
2.2 使用Unix工具来分析数据
2.3 使用Hadoop来分析数据
2.4 横向扩展
2.5 Hadoop Streaming
2.6 Hadoop Pipes
第3章 Hadoop分布式文件系统
3.1 HDFS的设计
3.2 HDFS的概念
3.3 命令行接口
3.4 Hadoop文件系统
3.5 Java接口
3.6 数据流
3.7 通过Flume和Sqoop导入数据
3.8 通过distcp并行复制
3.9 Hadoop存档
第4章 Hadoop的I/O操作
4.1 数据完整性
4.2 压缩
4.3 序列化
4.4 Avro
4.5 基于文件的数据结构
第5章 MapReduce应用开发
5.1 用于配置的API
5.2 配置开发环境
5.3 用MRUnit来写单元测试
5.4 本地运行测试数据
5.5 在集群上运行
5.6 作业调优
5.7 MapReduce的工作流
第6章 MapReduce的工作机制
6.1 剖析MapReduce作业运行机制
6.2 失败
6.3 作业的调度
6.4 shuffle和排序
6.5 任务的执行
第7章 MapReduce的类型与格式
7.1 MapReduce的类型
7.2 输入格式
7.3 输出格式
第8章 MapReduce的特性
8.1 计数器
8.2 排序
8.3 连接
8.4 边数据分布
8.5 MapReduce库类
第9章 构建Hadoop集群
9.1 集群规范
9.2 集群的构建和安装
9.3 SSH配置
9.4 Hadoop配置
9.5 YARN配置
9.6 安全性
9.7 利用基准评测程序测试Hadoop集群
9.8 云端的Hadoop
第10章 管理Hadoop
10.1 HDFS
10.2 监控
10.3 维护
第11章 关于Pig
11.1 安装与运行Pig
11.2 示例
11.3 与数据库进行比较
11.4 Pig Latin
11.5 用户自定义函数
11.6 数据处理操作
11.7 Pig实战
第12章 关于Hive
12.1 安装Hive
12.2 示例
12.3 运行Hive
12.4 Hive与传统数据库相比
12.5 HiveQL
12.6 表
12.7 查询数据
12.8 用户定义函数
第13章 关于HBase
13.1 HBase基础
13.2 概念
13.3 安装
13.4 客户端
13.5 示例

改版

反馈