HBase一个分布式的、面向列的开源数据库

HBase一个分布式的、面向列的开源数据库

1、官网。http://hbase.apache.org/

2、文档。http://hbase.apache.org/book.html

3、介绍。

HBase是一种“NoSQL”数据库。“NoSQL”是一个通用术语,意思是数据库不是支持SQL作为其主要访问语言的RDBMS,但是有许多类型的NoSQL数据库:BerkeleyDB是本地NoSQL数据库的一个例子,而HBase是一个分布式数据库。从技术上讲,HBase实际上更像是一个“数据存储”而不是“数据库”,因为它缺少在RDBMS中找到的许多功能,例如键入列,二级索引,触发器和高级查询语言等。

但是,HBase具有很多支持线性和模块化缩放的功能。通过添加商品类服务器上托管的RegionServers来扩展HBase集群。例如,如果一个集群从10个扩展到20个RegionServers,则它在存储和处理能力方面都会翻倍。RDBMS可以很好地扩展,但只能达到某一点 – 具体而言就是单个数据库服务器的大小 – 并且为了获得最佳性能,需要专门的硬件和存储设备。HBase的特点是:

  • 一致的读/写:HBase不是“最终一致的”DataStore。这使它非常适合诸如高速计数器聚合之类的任务。
  • 自动分片:HBase表通过区域分布在集群上,随着数据增长,区域会自动分割和重新分配。
  • 自动RegionServer故障切换
  • Hadoop/HDFS集成:HBase支持HDFS作为其分布式文件系统。
  • MapReduce:HBase支持通过MapReduce进行大规模并行处理,以便将HBase用作源和接收器。
  • Java客户端API:HBase支持易于使用的Java API进行编程式访问。
  • Thrift/REST API:HBase还支持非Java前端的Thrift和REST。
  • 块缓存和Bloom过滤器:HBase支持块缓存和Bloom过滤器,以实现高容量查询优化。
  • 操作管理:HBase提供内置的网页以提供运营洞察力以及JMX指标。

发表回复

您的电子邮箱地址不会被公开。