HBase中的基本概念是什么

这篇文章给大家分享的是有关HBase中的基本概念是什么的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。

五河网站建设公司成都创新互联,五河网站设计制作,有大型网站制作公司丰富经验。已为五河1000+提供企业网站建设服务。企业网站搭建\外贸营销网站建设要多少钱,请找那个售后服务好的五河做网站的公司定做!

HBase是Google Bigtable的开源实现。HBase是一个开源的、分布式的、多版本的、面向列的存储模型。HBase利用HDFS作为其文件系统(或本地),还可以通过MapReduce计算模型来并行处理大数据。

HBase中的基本概念:

Row Key

1) Row key是检索记录的主键。

2) Row key行键 (Row key)可以是任意字符串(长度是 64KB,实际应用中长度一般为 10-100bytes),在hbase内部,row key保存为字节数组。

3) 数据按照Row key的字典序(byte order)排序存储。设计key时,要充分排序存储这个特性,将经常一起读取的行存储放到一起。(位置相关性)

4) 行的读写是原子操作。

Column family (列族)

1) HBase表中的每个列都属于某个列族,列族必须作为表模式(schema)定义的一部分预先给出,必须在使用表之前定义。列名都是以列族作为前缀,中间以冒号(:)隔开,如:courses:math。

2) 访问控制、磁盘和内存的使用统计都是在列族层面进行的。实际应用中,列族上的控制权限能帮助我们管理不同类型的应用:我们允许一些应用可以添加新的基本数据、一些应用可以读取基本数据并创建继承的列族、一些应用则只允许浏览数据(甚至可能因为隐私的原因不能浏览所有数据)。

Cell (存储单元)

由{row key, column(=<family> + <label>), version}唯一确定的单元。cell中的数据是没有类型的,全部是字节码形式存贮。

Timestamp(时间戳)

1) 每个cell都保存着同一个数据的多个版本,版本通过时间戳来索引。

2) 时间戳为64位整型。

3) 可以自动赋值(当前系统时间),也可以用户自己指定。

4) 不同版本数据按照时间戳倒序排。

5) HBase提供了两种数据版本回收机制:a. 保存数据最后n个版本;b. 保存最近一段时间内的版本。用户可以针对每个列族去设置。

感谢各位的阅读!关于“HBase中的基本概念是什么”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!

新闻名称:HBase中的基本概念是什么
URL地址:https://www.cdcxhl.com/article0/cpcjoo.html

成都网站建设公司_创新互联,为您提供网站营销商城网站自适应网站小程序开发建站公司网站策划

广告

声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联

网站建设网站维护公司