首页>参考读物>计算机科学与技术>软件与程序设计

HBase应用实战与性能调优
作者 : 张文亮 编著
出版日期 : 2022-07-01
ISBN : 978-7-111-70735-6
定价 : 69.00元
扩展资源下载
扩展信息
语种 : 简体中文
页数 : 224
开本 : 16
原书名 :
原出版社:
属性分类: 店面
包含CD : 无CD
绝版 : 未绝版
图书简介

HBase是一个高可靠、高性能、面向列、可伸缩的分布式存储系统。利用HBase技术可以在廉价的PC服务器上搭建大规模的存储化集群,可以对数十亿级别的大数据进行实时性的高性能读写,在满足高性能的同时还保证了数据存取的原子性。
本书由浅入深地讲解HBase的概念、安装、配置、部署、高级用法、性能调优,内容既兼顾了初学者,也适用于想要深入学习HBase的读者。
本书适用于以前没有接触过HBase,或者对HBase有所了解并希望深入学习的读者,同时适用于HBase应用开发人员和系统管理人员。不管你是HBase新手还是HBase专家,相信都能从本书中有所收获。

图书特色

近80个案例,助你快速上手

循序渐进,实例导向,学习参考皆宜
从零基础开始入门,全面剖析HBase生产环境
调优进阶,轻松掌握HBase实战知识

图书前言

  Hadoop生态系统的HDFS和MapReduce分别为大数据提供存储和分析处理能力,但是对在线实时的数据存取则爱莫能助,而HBase弥补了Hadoop的这一缺陷,满足了在线实时系统低延时的需求。本书以精练的语言介绍HBase的基础知识,让初学者能够快速上手使用HBase。如果你的系统里没有合适的环境,如果你想快速了解HBase能干什么,如果你是想知道怎么搭建HBase的运维人员,如果你想快速地使用Java调用HBase,那么这本书都能帮到你。 
  这本书可能不是很全面,但是包含了业务中的大部分应用场景。对于没有深入研究过HBase的读者来说,通过本书不仅能快速、高效地解决业务问题,还能站在运维的角度来优化自己的HBase数据库。此外,本书还提供了与HBase内部工作原理相关的基本信息和必要解释。读者越是了解HBase的工作原理,就越能对工程中所涉及的权衡做出合理的决定。 
  本书的资源文件可以登录机械工业出版社华章分社的网站(www.hzbook.com)下载,方法是:搜索到本书,然后在页面上的“下载资源”模块下载即可。如果下载有问题,请发送电子邮件至booksaga@126.com,邮件主题为“HBase应用实战与性能调优”。如果读者有兴趣,也可以加入QQ技术交流群(850809124)参与讨论。 
  最后,感谢各位读者选择本书,希望本书能对读者的学习有所助益。虽然我们对书中所述内容都尽量核实并多次进行文字校对,但因时间紧张,加之水平有限,书中难免有疏漏和错误之处,敬请广大读者批评指正。我会努力地采纳大家的意见,争取不断地完善此书,以此来回报大家对本书的支持。

编 者
2022年3月

上架指导

计算机\程序设计

封底文字

易学易用,一本能“操作”的图书,
教你快速成为HBase高手。

从事HBase应用培训长达10年的资深讲师,全面剖析HBase应用的高级用法与性能调优。

本书特点

系统介绍HBase基本原理与运行机制,融入作者多年的开发经验与实践技巧,旨在让HBase应用开发人员和系统管理人员能更好地理解大数据应用程序的部署。

由浅入深地讲解HBase的概念、安装、配置、部署,让读者先对HBase有一个感性认识,再从应用角度出发介绍高级用法和性能调优。

内容既兼顾了初学者,也适用于想要深入学习HBase的读者。

图书目录

前言
第1章 大数据时代的必然产物—HBase 1
  1.1 HBase的发展历程 1
  1.2 HBase的特征 2
  1.3 HBase的优缺点 2
1.3.1 HBase的优点 2
1.3.2 HBase的缺点 3
  1.4 HBase与关系数据库的区别 3
  1.5 使用HBase的时机 4
  1.6 HBase的应用场景 4
  1.7 HBase的数据模型 7
  1.8 HBase的逻辑视图 10
第2章 HBase基本架构与快速入门 11
  2.1 HBase基本架构 11
  2.2 HBase分布式环境搭建 14
2.2.1 设置服务器名称 14
2.2.2 Hadoop单机安装 15
2.2.3 Hadoop集群安装 20
2.2.4 ZooKeeper集群安装 28
2.2.5 HBase集群安装 31
  2.3 HBase容器化技术搭建 34
2.3.1 CentOS环境下安装Docker 34
2.3.2 Windows 10环境下安装Docker 35
2.3.3 利用Docker安装HBase 37
  2.4 HBase快速入门 39
2.4.1 使用HBase Shell 39
2.4.2 使用create命令 40
2.4.3 使用alter命令 40
2.4.4 使用list命令 40
2.4.5 使用describe命令 41
2.4.6 使用put命令 42
2.4.7 使用get命令 42
2.4.8 使用scan命令 43
2.4.9 使用deleteall命令 43
第3章 HBase基本操作 44
  3.1 help命令 44
  3.2 常规命令 47
3.2.1 查询集群状态信息(status命令) 47
3.2.2 查看如何操作表(table_help命令) 48
3.2.3 查询HBase版本信息(version命令) 49
3.2.4 查看当前用户(whoami命令) 50
3.2.5 查看进程列表(processlist命令) 50
  3.3 DDL命令 50
3.3.1 创建表(create命令) 51
3.3.2 修改表信息(alter命令) 52
3.3.3 异步修改表信息(alter_async命令) 55
3.3.4 获取表的详细信息(describe命令) 56
3.3.5 获取HBase中所有的表(list命令) 57
3.3.6 判断表是否存在(exists命令) 57
3.3.7 以对象的方式操作表(get_table命令) 58
3.3.8 启用表(enable命令) 58
3.3.9 启用所有满足正则表达式的表(enable_all命令) 59
3.3.10 判断表是否被启用(is_enabled命令) 60
3.3.11 禁用表(disable命令) 60
3.3.12 禁用所有满足正则表达式的表(disable_all命令) 60
3.3.13 判断表是否被禁用(is_disabled命令) 61
3.3.14 删除表(drop命令) 62
3.3.15 删除所有满足正则表达式的表(drop_all命令) 62
3.3.16 获取RowKey所在的区域(locate_region命令) 63
3.3.17 显示HBase支持的过滤器(show_filters命令) 64
  3.4 命名空间 65
3.4.1 创建命名空间(create_namespace命令) 65
3.4.2 修改命名空间(alter_namespace命令) 65
3.4.3 获取命名空间详情(describe_namespace命令) 66
3.4.4 获取命名空间下所有表的名称(list_namespace_tables命令) 66
3.4.5 获取所有的命名空间(list_namespace命令) 66
3.4.6 删除命名空间(drop_namespace命令) 67
  3.5 DML命令 67
3.5.1 新增或者修改数据(put命令) 68
3.5.2 全表扫描数据(scan命令) 68
3.5.3 获取表中数据的总行数(count命令) 72
3.5.4 获取表中的数据(get命令) 73
3.5.5 删除列族中的某个列(delete命令) 75
3.5.6 删除整行数据(delete命令) 76
3.5.7 列值自增(incr命令) 77
3.5.8 获取自增后的列值(get_counter命令) 78
3.5.9 获取表所对应的Region数量(get_splits命令) 79
3.5.10 清空整个表数据,不保留分区(truncat命令) 79
3.5.11 清空整个表数据,保留分区(truncat_ preserve命令) 80
第4章 Java对接HBase 81
  4.1 从“HelloWorld”开始 81
  4.2 创建表 86
  4.3 添加数据 91
  4.4 批量添加数据 96
  4.5 内容追加 101
  4.6 修改数据 102
  4.7 删除数据 103
  4.8 批量删除 106
  4.9 原子性操作 107
  4.10 批量操作 109
  4.11 自增 111
  4.12 判断数据是否存在 112
  4.13 代码封装 112
第5章 客户端API进阶 127
  5.1 数据查询 127
  5.2 数据扫描 133
  5.3 过滤器快速实战 139
  5.4 RowKey过滤器 141
  5.5 RowKey前缀过滤器 143
  5.6 RowKey模糊过滤器 145
  5.7 列族过滤器 146
  5.8 列过滤器 147
  5.9 多列前缀过滤器 149
  5.10 首次列键过滤器 150
  5.11 列键过滤器 150
  5.12 列值过滤器 152
  5.13 单列值过滤器 153
  5.14 列值排除过滤器 157
  5.15 随机行过滤器 159
  5.16 分页过滤器 160
  5.17 多个过滤器综合查询 162
第6章 HBase批量加载 164
  6.1 HBase批量加载简介 164
  6.2 海量交易记录数据存储案例 165
6.2.1 案例开发准备工作 165
6.2.2 编写实体类 166
6.2.3 创建读取数据的Mapper类 169
6.2.4 编写驱动类 171
6.2.5 上传数据到HDFS 172
6.2.6 将导入的HDFS数据与HBase进行关联 172
第7章 协处理器 173
  7.1 协处理器简介 173
  7.2 协处理器分类 174
  7.3 Coprocessor接口 174
  7.4 协处理器的加载 176
7.4.1 使用配置文件加载 176
7.4.2 从表描述器中加载 177
  7.5 RegionObserver类 178
7.5.1 Region状态 186
7.5.2 处理客户端API事件 187
  7.6 自定义Observer案例 188
第8章 Phoenix在HBase中的整合应用 190
  8.1 Phoenix简介 190
  8.2 安装Phoenix 191
8.2.1 下载 191
8.2.2 安装 191
  8.3 连接Phoenix 192
  8.4 Phoenix快速入门 194
8.4.1 创建表 194
8.4.2 删除表 196
8.4.3 插入数据 196
8.4.4 分页查询 196
第9章 HBase架构原理解析 197
  9.1 HBase架构原理 197
9.1.1 RegionServer流程解析 198
9.1.2 StoreFile和HFile结构 199
9.1.3 MemStore和StoreFile 199
  9.2 HBase写流程 200
  9.3 HBase读流程 201
  9.4 HBase如何进行增删改查 202
  9.5 数据刷写 202
9.5.1 刷写操作的触发时机 202
9.5.2 刷写流程 203
  9.6 数据合并 204
  9.7 数据拆分 205
第10章 HBase性能优化 207
  10.1 表设计优化 207
10.1.1 预分区 207
10.1.2 RowKey设计优化 209
10.1.3 列族数量优化 210
10.1.4 版本优化 210
  10.2 HBase提升写效率 211
  10.3 MemStore调优 211
  10.4 合并调优 212
  10.5 WAL调优 213
  10.6 HBase读取优化 214

教学资源推荐
作者: (美)Steven S.Muchnick
作者: [美] 凯·霍斯特曼(Cay Horstmann) 兰斯·尼塞斯(Rance Necaise) 著
作者: Behrouz A. Forouzan;Richard F. Gilberg
作者: [美]沙伦·比奥卡·扎卡沃(Sharon Biocca Zakhour) 索娅·坎南(Sowmya Kannan) 雷蒙德·盖拉多(Raymond Gallardo) 著