本文共 518 字,大约阅读时间需要 1 分钟。
前言
本文隶属于专栏《1000个问题搞定大数据技术体系》,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢!
本专栏目录结构和参考文献请见
正文
HBase 是什么?
HBase 基于 Google 的 BigTable 论文的开源实现,是建立的 HDFS 之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的分布式数据库系统。
在需要实时读写随机访问超大规模数据集时,可以使用 HBase。
hbase的特点
- 海量存储——可以存储大批量的数据
- 列(簇)式存储——hbase表的数据是基于列族进行存储的,列族是在列的方向上的划分。
- 极易扩展——底层依赖HDFS,当磁盘空间不足的时候,只需要动态增加 datanode节点服务(机器)就可以了;可以通过增加服务器来提高集群的存储能力。
- 高并发——支持高并发的读写请求
- 稀疏——稀疏主要是针对Hbase列的灵活性,在列族中,你可以指定任意多的列,在列数据为空的情况下,是不会占用存储空间的。
- 数据的多版本——hbase表中的数据可以有多个版本值,默认情况下是根据版本号去区分,版本号就是插入数据的时间戳
- 数据类型单一——所有的数据在hbase中是以字节数组进行存储
转载地址:http://gzgji.baihongyu.com/