写给大忙人的Hadoop2

企业采购书卡请拔打028-83157469,团购书目请拨打19113427458(法定工作日9:00-17:00)

定  价 :
¥ 69.00
文 轩 价 :
¥57.30 (8.3折)
库  存 :
库存紧张
作  者 :
(美)Douglas Eadline(道格拉斯·伊德理恩) 著 卢涛
所属分类 :
图书 > 行业职业 > 计算机 > 数据库
促销活动 :
❤图书音像单笔满100减30!(特价图书、电子书除外)
购买数量 :
- +
立即购买
服  务 :
由"文轩网"直接销售和发货,并提供售后服务
正品低价| 闪电发货|货到付款| 高效退换货
¥57.30 (8.3折)
  • 作 者: (美)Douglas Eadline(道格拉斯·伊德理恩) 著 卢涛
  • 出版社: 电子工业出版社
  • 出版时间:2016-05-01
  • 开 本:其他
  • 页 数:288
  • 印刷时间:2016-05-01
  • 字 数:344千字
  • 装 帧:简装
  • 语  种:中文
  • 版 次:1
  • 印 次:1
  • I S B N:9787121288050

目录

1背景和概念 1 定义Apache Hadoop 1 Apache Hadoop的发展简史 3 大数据的定义 4 Hadoop作为数据湖 5 使用Hadoop:管理员、用户或两种身份兼具 7 原始的MapReduce 7 Apache Hadoop的设计原则 8 Apache Hadoop MapReduce示例 8 MapReduce的优势 10 Apache Hadoop V1 MapReduce操作 11 使用Hadoop V2 超越MapReduce 13 Hadoop V2 YARN操作设计 14 Apache Hadoop项目生态系统 16 总结和补充资料 18 2安装攻略 21 核心Hadoop服务 21 Hadoop配置文件 22 规划你的资源 23 硬件的选择 23 软件选择 24 在台式机或笔记本电脑上安装 25 安装Hortonworks HDP 2.2沙箱 25 用Apache源代码安装Hadoop 32 配置单节点YARN服务器的步骤 33 运行简单的MapReduce示例 42 安装 Apache Pig(可选) 42 安装Apache Hive(可选) 43 使用Ambari安装Hadoop 44 执行Ambari安装 45 撤消Ambari安装 59 使用Apache Whirr在云中安装Hadoop 59 总结和补充资料 65 3HDFS基础知识 67 HDFS设计的特点 67 HDFS组件 68 HDFS块复制 71 HDFS安全模式 72 机架的识别 73 NameNode高可用性 73 HDFS NameNode联邦 75 HDFS检查点和备份 76 HDFS快照 76 HDFS NFS网关 76 HDFS用户命令 77 简要HDFS命令参考 77 一般HDFS命令 78 列出HDFS中的文件 79 在HDFS中创建一个目录 80 将文件复制到HDFS 80 从HDFS复制文件 81 在HDFS中复制文件 81 删除在HDFS中的文件 81 删除在HDFS中的目录 81 获取HDFS状态报告 81 HDFS的Web图形用户界面 82 在程序中使用HDFS 82 HDFS Java应用程序示例 82 HDFS C应用程序示例 86 总结和补充资料 88 4运行示例程序和基准测试程序 91 列出可用的示例 92 运行Pi示例 93 使用Web界面监控示例 95 运行基本Hadoop基准测试程序 101 运行Terasort测试 101 运行TestDFSIO基准 102 管理Hadoop MapReduce作业 103 总结和补充资料 104 5Hadoop MapReduce框架 107 MapReduce模型 107 MapReduce并行数据流 110 容错和推测执行 114 推测执行 114 Hadoop MapReduce硬件 115 总结和补充资料 115 6MapReduce 117 编译和运行Hadoop WordCount的示例 117 使用流式接口 122 使用管道接口 125 编译和运行Hadoop Grep链示例 127 调试MapReduce 131 作业的列举、清除和状态查询 131 Hadoop日志管理 131 启用YARN日志聚合 132 Web界面日志查看 133 命令行日志查看 133 总结和附加资源 135 7基本的Hadoop工具 137 使用Apache Pig 137 Pig示例演练 138 使用Apache Hive 140 Hive示例演练 140 更高级的Hive示例 142 使用Apache Sqoop获取关系型数据 145 Apache Sqoop导入和导出方法 145 Apache Sqoop版本更改 147 Sqoop示例演练 148 使用Apache Flume获取数据流 155 Flume的示例演练 157 使用Apache Oozie管理 Hadoop工作流 160 Oozie示例演练 162 使用Apache HBase 170 HBase数据模型概述 170 HBase示例演练 171 总结和补充资料 176 8Hadoop YARN应用程序 179 YARN分布式shell 179 使用YARN分布式shell 180 一个简单的示例 181 使用更多的容器 182 带有shell参数的分布式 shell 示例 183 YARN应用程序的结构 185 YARN应用程序框架 187 Hadoop MapReduce 188 Apache Tez 188 Apache Giraph 189 Hoya: HBase on YARN 189 Dryad on YARN 189 Apache Spark 189 Apache Storm 190 Apache REEF:可持续计算执行框架 190 Hamster:Hadoop和MPI在同一集群 190 Apache Flink:可扩展的批处理和流式数据处理 191 Apache Slider:动态应用程序管理 191 总结和补充资料 192 9用Apache Ambari管理Hadoop 193 快速浏览 Apache Ambari 194 仪表板视图 194 服务视图 197 主机视图 199 管理视图 201 查看视图 201 Admin下拉菜单 202 更改Hadoop属性 206 总结和补充资料 212 10基本的Hadoop管理程序 213 基本的Hadoop YARN管理 214 停用YARN节点 214 YARN WebProxy 214 使用 JobHistoryServer 215 管理YARN作业 215 设置容器内存 215 设置容器核心 216 设置MapReduce属性 216 基本的HDFS管理 217 NameNode用户界面 217 将用户添加到HDFS 219 在HDFS上执行FSCK 220 平衡HDFS 221 HDFS安全模式 222 停用HDFS节点 222 SecondaryNameNode 223 HDFS快照 223 配置到HDFS的NFSv3网关 225 容量调度程序背景知识 229 Hadoop 2的MapReduce兼容性 231 启用应用主控程序的重新启动功能 231 计算一个节点的承载容量 232 运行Hadoop 1的应用程序 233 总结和补充资料 235 附录A本书的网页和代码下载 237 附录B入门流程图和故障排除指南 239 入门流程图 239 常见的Hadoop故障排除指南 239 规则1:不要惊慌 239 规则2:安装并使用Ambari 244 规则3:检查日志 244 规则4:简化情况 245 规则5:在互联网上提问 245 其他有用的提示 246 附录C按主题列出的Apache Hadoop资源汇总 253 常规的Hadoop 信息 253 Hadoop安装攻略 253 HDFS 254 示例 255 MapReduce 255 MapReduce 编程 255 基本工具 256 YARN应用程序框架 257 Ambari管理 257 基本的Hadoop 管理 257 附录D安装Hue Hadoop GUI 259 Hue安装 259 安装和配置Hue 262 启动Hue 263 Hue用户界面 263 附录E安装Apache Spark 267 在集群上安装Spark 267 在整个集群中启动Spark 268 在伪分布式的单节点安装版本中安装和启动Spark 270 运行Spark示例 271

作者简介

卢涛,专业社区ITPUBOracle开发版版主。1995年参加工作,2001年转到IT部门从事C/C++软件开发,2004年开始做系统分析和Oracle数据库方面工作。参加过多个全国性普查数据处理项目的开发和运维,目前主要从事统计报表联网填报系统的后台支持和优化。曾参与编写《剑破冰山-Oracle开发的艺术》一书,并翻译了数本Oracle管理、开发和性能优化;C/C++开发、Web开发等方面的书籍。
伊德理恩,博士,作为一个Linux集群HPC革命的践行者和记录者开始他的职业生涯,而现在他在记录大数据分析。从开始靠前份操作文档以来,道格写了数百篇文章、白皮书,以及说明文档,涵盖高性能计算(HPC)的几乎所有方面。在2005年启动和编辑颇受欢迎的ClusterMonkey.net网站之前,他担任ClusterWorld杂志的主编,并曾是Linux杂志的HPC资历编辑。他具有多方面的HPC实际操作经验,包括硬件和软件设计、基准测试、存储、GPU、云计算和并行计算。

内容简介

本书首先介绍了Hadoop的背景知识,包括Hadoop 2和YARN的工作原理和对Hadoop 1的改进,然后将数据湖与传统存储比较。第2章到第8章,分别介绍了Hadoop 2和核心服务的安装方法、Hadoop分布式文件系统、MapReduce和YARN编程,以及利用Apache Pig等Hadoop工具简化编程。很后两章讲述了利用Apache Ambari等工具管理Hadoop和基本的管理程序。附录包括Hadoop 2故障诊断和排除的基础知识、Apache Hue和Apache Spark安装等。本书通俗易懂,具有大量操作实例,易于上手,适合Hadoop用户、管理员、开发和运维人员、程序员、架构师、分析师和数据科学工作者阅读。

价格说明

定价:为出版社全国统一定价;

文轩价:为商品的销售价,是您最终决定是否购买商品的依据;受系统缓存影响,最终价格以商品放入购物车后显示的价格为准;

关于新广告法声明

新广告法规定所有页面信息中不得出现绝对化用词和功能性用词。

本店非常支持新广告法,但为了不影响消费者正常购买,页面明显区域本店已在排查修改,对于不明显区域也将会逐步排查并修改,我们此郑重声明:本店所有页面上的绝对化用词与功能性用词在此声明全部失效,不作为赔付理由。涉及“教育部声明”中的商品,均不代表教育部指定、推荐的具体版本,仅代表该商品的内容为指定、推荐书目。因极限用词引起的任何形式的商品赔付,本店不接收且不妥协。希望消费者理解并欢迎联系客服帮助完善,也请职业打假人士高抬贵手。