hbase中行锁与多版本并发控制的示例分析
这篇文章将为大家详细讲解有关hbase中行锁与多版本并发控制的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
企业建站必须是能够以充分展现企业形象为主要目的,是企业文化与产品对外扩展宣传的重要窗口,一个合格的网站不仅仅能为公司带来巨大的互联网上的收集和信息发布平台,创新互联面向各种领域:成都混凝土泵车等成都网站设计、全网整合营销推广解决方案、网站设计等建站排名服务。
MVCC (Multiversion Concurrency Control),即多版本并发控制技术,它使得大部分支持行锁的事务引擎,不再单纯的使用行锁来进行数据库的并发控制,取而代之的是,把数据库的行锁与行的多个版本结合起来,只需要很小的开销,就可以实现非锁定读,从而大大提高数据库系统的并发性能。
HBase正是通过行锁+MVCC保证了高效的并发读写。
为什么需要并发控制
HBase系统本身只能保证单行的ACID特性。ACID的含义是:
原子性(Atomicity)
一致性(Consistency)
隔离性(Isolation)
持久性(Durability)
传统的关系型数据库一般都提供了跨越所有数据的ACID特性;为了性能考虑,HBase只提供了基于单行的ACID。
下面是一个hbase并发写的例子。
原始数据如下
从Apache HBase Write Path一文可以知道hbase写数据是分为两步:
1. 写Write-Ahead-Log(WAL)文件
2. 写MemStore:将每个cell[(row,column)对]的数据写到内存中的memstore
写写同步
假定对写没有采取并发控制,并考虑以下的顺序:
这样就得到了不一致的结果。显然我们需要对并发写操作进行同步。
最简单的方式是提供一个基于行的独占锁来保证对同一行写的独立性。所以写的顺序是:
(0) 获取行锁
(1) 写WAL文件
(2) 更新MemStore:将每个cell写入到memstore
(3) 释放行锁
读写同步
尽管对并发写加了锁,但是对于读呢?见下面的例子:
可见需要对读和写也进行并发控制,不然会得到不一致的数据。最简单的方案就是读和写公用一把锁。这样虽然保证了ACID特性,但是读写操作同时抢占锁会互相影响各自的性能。
MVCC算法
HBase采用了MVCC算法来避免读操作去获取行锁。
对于写操作:
(w1) 获取行锁后,每个写操作都立即分配一个写序号
(w2) 写操作在保存每个数据cell时都要带上写序号
(w3) 写操作需要申明以这个写序号来完成本次写操作
对于读操作:
(r1) 每个读操作开始都分配一个读序号,也称为读取点
(r2) 读取点的值是所有的写操作完成序号中的最大整数(所有的写操作完成序号<=读取点)
(r3) 对某个(row,column)的读取操作r来说,结果是满足写序号为“写序号<=读取点这个范围内”的最大整数的所有cell值的组合
在采用MVCC后的数据执行图:
这样就实现了以无锁的方式读取到一致的数据了。
重新总结下MVCC算法下写操作的执行流程:
(0) 获取行锁
(0a) 获取写序号
(1) 写WAL文件
(2) 更新MemStore:将每个cell写入到memstore
(2a) 以写序号完成操作
(3) 释放行锁
关于“hbase中行锁与多版本并发控制的示例分析”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,使各位可以学到更多知识,如果觉得文章不错,请把它分享出去让更多的人看到。
分享文章:hbase中行锁与多版本并发控制的示例分析
文章出自:http://pwwzsj.com/article/jpoogp.html