实时检索之HBase

时间:2021-02-19 13:36:07   收藏:0   阅读:0

1、概念

HBase是一个分布式的NoSQL数据库,其特点高可靠、高性能、面向列、可伸缩。

2、特点

HBase适合具有如下需求的应用:

ACID原则是数据库事务正常执行的四个特性,分别指原子性、一致性、独立性及持久性。

3、各组件

技术图片

 

 

ZooKeeper为HBase集群中各进程提供分布式协作服务。各RegionServer将自己的信息注册到Zookeeper中,主用Master据此感知各个RegionServer的健康状态。

Client使用HBase的RPC机制与Master、RegionServer进行通信。Client与Master进行管理类通信,与RegionServer进行数据操作类通信。

RegionServer负责提供表数据读写等服务,是HBase的数据处理和计算单元。RegionServer一般与HDFS集群的DataNode部署在一起,实现数据的存储功能。

HMaster,在HA模式下,包含主用Master和备用Master。

HDFS为HBase提供高可靠的文件存储服务,HBase的数据全部存储在HDFS中。

Store:一个Region由一个或多个Store组成,每个Store对应图中的一个Column Family。

MemStore:一个Store包含一个MemStore,MemStore缓存客户端向Region插入的数据。

StoreFile:MemStore的数据flush到HDFS后成为StoreFile。

Hfile:HFile定义了StoreFile在文件系统中的存储格式,它是当前HBase系统中StoreFile的具体实现。

Hlog:HLog日志保证了当RegionServer故障的情况下用户写入的数据不丢失,RegionServer的多个Region共享一个相同的Hlog。

评论(0
© 2014 mamicode.com 版权所有 京ICP备13008772号-2  联系我们:gaon5@hotmail.com
迷上了代码!