数据库是一个共享资源,可以供多个用户使用。在同一时刻并发运行的事务可达成千上万个。
我们这里讨论的是以单机处理系统为基础的。
并发控制概述
事务是并发控制的基本单位,保证事务的ACID特性是事务处理的重要任务,而事务的ACID特性可能遭到破坏的原因之一是多个事务对数据库的并发操作造成的。为保证事物的隔离性和一致性,DBMS需要对并发操作进行正确调度。
并发操作带来的数据不一致性包括:
- 丢失修改:两个事务T1和T2读入同一数据并修改,T2的提交结果破坏了T1提交的结果 ,导致T1的修改被丢失。
- 不可重复读:不可重复读是指事务T1读取数据后,事务T2执行更新操作,使T1无法再现前一次读取结果。
- 读“脏”数据:事务T1修改某一数据,并将其写回磁盘,事务T2读取同一数据后,T1由于某种原因被撤销,这时T1已修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致,T2读到的数据就为“脏 ”数据,即不正确的数据。
产生上述三类数据不一致的主要原因是并发操作破坏了事务的隔离性。并发控制就是要用正确的方式调度并发操作 ,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性。
并发控制的主要技术有:封锁(Locking)、时间戳(Timestamp)、乐观控制法、多版本并发控制(MVCC)。
封锁
封锁是实现并发控制的一个非常重要技术。封锁就是事务T在对某个数据对象(例如表、记录等)操作之前,先向系统发出请求,对其加锁。加锁后事务T就对该数据对象有了一定的控制,在事务T释放它的锁之前,其它的事务不能更新此数据对象。
一个事务对某个数据对象加锁后究竟拥有什么样的控制由封锁的类型决定。基本封锁类型有排它锁(Exclusive Locks ,简记为X锁)和共享锁(Share Locks,简记为S锁)。
排它锁又称为写锁。若事务T对数据对象A加上X锁,则只允许T读取和修改A,其它任何事务都不能再对A加任何类型的锁,直到T释放A上的锁。保证其他事务在T释放A上的锁之前不能再读取和修改A。
共享锁又称为读锁。若事务T对数据对象A加上S锁,则事务T可以读A但不能修改A,其它事务只能再对A加S锁,而不能加X锁,直到T释放A上的S锁。保证其他事务可以读A,但在T释放A上的S锁之前不能对A做任何修改。
封锁协议
在运用X锁和S锁对数据对象加锁时,需要约定一些规则,例如何时申请X锁或S锁、持锁时间、何时释放等。这些规则称为封锁协议(Locking Protocol )。对封锁方式规定不同的规则,就形成了各种不同的封锁协议,在不同的程度上保证并发操作的正确调度。
一级封锁协议
事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放(结束包括COMMIT和ROLLBACK)。
一级封锁协议可防止丢失修改,并保证事务T是可恢复的。
在一级封锁协议中,如果仅仅是读数据不对其进行修改,是不需要加锁的,所以它不能保证可重复读和不读“脏”数据。
二级封锁协议
在一级封锁协议基础上增加事务T在读取数据R之前必须先对其加S锁,读完后即可释放S锁。
二级封锁协议可以防止丢失修改和读“脏”数据。
在二级封锁协议中,由于读完数据后即可释放S锁,所以它不能保证可重复读。
三级封锁协议
在一级封锁协议基础上增加事务T在读取数据R之前必须先对其加S锁,直到事务结束才释放。
三级封锁协议可防止丢失修改、读脏数据和不可重复读。
三级协议的主要区别
什么操作需要申请封锁以及何时释放锁(即持锁时间)。
不同的封锁协议使事务达到的一致性级别不同,封锁协议级别越高,一致性程度越高。
活锁和死锁
封锁的方法可能引起活锁和死锁等问题。
活锁
如果事务T1封锁了数据R,事务T2又请求封锁R,于是T2等待;T3也请求封锁R,当T1释放了R上的封锁之后,系统首先批准了T3的请求,T2仍然等待;然后T4又请求封锁R,当T3释放了R上的封锁之后系统又批准了T4的请求······T2有可能永远等待,这就是活锁的情形。
避免活锁的简单方法是采用先来先服务的策略,当多个事务请求封锁同一数据对象时,按请求封锁的先后次序对这些事务排队,该数据对象上的锁一旦释放,首先批准申请队列中第一个事务获得锁。
死锁
如果事务T1封锁了数据R1,T2封锁了数据R2,然后T1又请求封锁R2,因T2已经封锁了R2,于是T1等待T2释放R2上的锁;接着T2请求封锁R1,因T1已经封锁了R1,T2也只能等待T1释放R1上的锁。这就出现了死锁。
目前在数据库中解决死锁问题主要有两类方法,一类是预防死锁发生,另一类是允许发生死锁,采用一定的手段定期诊断系统中有无死锁,若有则解除。
死锁的预防
产生死锁的原因是两个或多个事务都已封锁了一些数据对象,然后又都请求对已为其他事务封锁的数据对象加锁,从而出现死等待。预防死锁的发生就是要破坏产生死锁的条件。预防死锁通常有以下两种方法:
(1)一次封锁法
要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行。
存在的问题:
- 过早加锁,降低系统并发度
- 难于事先精确确定封锁对象,将事务在执行过程中可能要封锁的数据对象全部加锁,这就进一步降低了并发度
(2)顺序封锁法
顺序封锁法是预先对数据对象规定一个封锁顺序,所有事务都按这个顺序实行封锁。
存在的问题:
- 数据库系统中封锁的数据对象极多,并且随数据的插入、删除等操作而不断地变化,要维护这样的资源的封锁顺序非常困难, 成本很高
- 事务的封锁请求可以随着事务的执行而动态地决定,很难事先确定每一个事务要封锁哪些对象,因此也就很难按规定的顺序去施加封锁
结论:
- 预防死锁的策略并不太适合数据库的特点
- 数据库管理系统在解决死锁的问题上更普遍采用的是诊断并解除死锁的方法
死锁的诊断与解除
(1)超时法
如果一个事务的等待时间超过了规定的时限,就认为发生了死锁。优点是实现简单;缺点是有可能误判死锁,时限若设置得太长,死锁发生后不能及时发现。
(2)等待图法
事务等待图是一个有向图G=(T ,U),T为结点的集合,每个结点表示正运行的事务,U为边的集合,每条边表示事务等待的情况,若T1等待T2,则在T1 、T2之间划一条有向边,从T1指向T2。
并发控制子系统周期性地(比如每隔数秒)生成事务等待图,检测事务。如果发现图中存在回路,则表示系统中出现了死锁。
通常解除死锁采用的方法是选择一个处理死锁代价最小的事务,将其撤消,释放此事务持有的所有的锁,使其它事务能继续运行下去。
并发调度的可串行性
数据库管理系统对并发事务不同的调度可能会产生不同的结果,串行调度是正确的。执行结果等价于串行调度的调度也是正确的,称为可串行化调度。
可串行化调度
定义:多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行地执行这些事务时的结果相同,称这种调度策略为可串行化调度。
可串行性是并发事务正确调度的准则。一个给定的并发调度,当且仅当它是可串行化的,才认为是正确调度。
冲突可串行化调度
冲突操作是指不同的事务对同一数据的读写操作和写写操作:
Ri(x)与Wj(x) /* 事务Ti读x,Tj写x,其中i≠j*/
Wi(x)与Wj(x) /* 事务Ti写x ,Tj写x,其中i≠j*/
/* 涉及同一个数据库元素,并且至少有一个是写作*/
其他操作是不冲突操作。
不同事务的冲突操作和同一事务的两个操作是不能交换的。对于Ri(x)与Wj(x),若改变二者的次序,则事务Ti看到的数据库状态就发生了改变,自然会影响到事务Ti后面的行为。对于Wi(x)与Wj(x),改变二者的次序也会影响数据库的状态,x的值由等于Tj的结果变成等于Ti的结果。
一个调度Sc在保证冲突操作的次序不变的情况下,通过交换两个事务不冲突操作的次序得到另一个调度Sc ’,如果Sc ’是串行的,称调度Sc是冲突可串行化度的调度。若一个调度是冲突可串行化,则一定是可串行化的调度。
冲突可串行化调度是可串行化调度的充分条件,不是必要条件。还有不满足冲突可串行化条件的可串行化调度。
两段锁协议
为了保证并发调度的正确性,DBMS的并发控制机制必须提供一定的手段来保证调度是可串行化的。目前DBMS普遍采用两段锁(TwoPhase Locking,简称2PL)协议的方法实现并发调度的可串行性,从而保证调度的正确性。
两段锁协议:指所有事务必须分两个阶段对数据项加锁和解锁。
- 在对任何数据进行读、写操作之前,事务首先要获得对该数据的封锁
- 在释放一个封锁之后,事务不再申请和获得任何其他封锁
“ 两段”锁的含义:事务分为两个阶段,第一阶段是获得封锁,也称为扩展阶段,在这个阶段,事务可以申请获得任何数据项上的任何类型的锁,但是不能释放任何锁;第二阶段是释放封锁,也称为收缩阶段,在这个阶段,事务可以释放任何数据项上的任何类型的锁,但是不能再申请任何锁。
若并发事务都遵守两段锁协议,则对这些事务的任何并发调度策略都是可串行化的。
事务遵守两段锁协议是可串行化调度的充分条件,而不是必要条件。
两段锁协议与防止死锁的一次封锁法:
- 一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行,因此一次封锁法遵守两段锁协议
- 但是两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁,因此遵守两段锁协议的事务可能发生死锁
封锁的粒度
封锁对象的大小称为封锁粒度。封锁的对象可以是逻辑单元(属性值、属性值的集合、元组、关系、索引项、整个索引、整个数据库等),也可以是物理单元(页(数据页或索引页)、物理记录等)。
封锁粒度与系统的并发度和并发控制的开销密切相关。封锁的粒度越大,数据库所能够封锁的数据单元就越少,并发度就越小,系统开销也越小;封锁的粒度越小,并发度较高,但系统开销也就越大。
在一个系统中同时支持多种封锁粒度供不同的事务选择是比较理想的,这种封锁方法称为多粒度封锁。
多粒度封锁
多粒度树:
- 以树形结构来表示多级封锁粒度
- 根结点是整个数据库,表示最大的数据粒度
- 叶结点表示最小的数据粒度
如下图,一个三级粒度树。根结点为数据库,数据库的子结点为关系,关系的子结点为元组。
多粒度封锁协议:
- 允许多粒度树中的每个结点被独立地加锁
- 对一个结点加锁意味着这个结点的所有后裔结点也被加以同样类型的锁
- 在多粒度封锁中一个数据对象可能以两种方式封锁:显式封锁和隐式封锁
显式封锁和隐式封锁:
- 显式封锁:直接加到数据对象上的封锁
- 隐式封锁:该数据对象没有独立加锁,是由于其上级结点加锁而使该数据对象加上了锁
- 显式封锁和隐式封锁的效果是一样的,系统检查封锁冲突时,要检查显式封锁,还要检查隐式封锁
对某个数据对象加锁,系统要检查:
- 该数据对象,有无显式封锁与之冲突
- 所有上级结点,检查本事务的显式封锁是否与该数据对象上的隐式封锁冲突(由上级结点已加的封锁造成的)
- 所有下级结点,看上面的显式封锁是否与本事务的隐式封锁(将加到下级结点的封锁)冲突
因为检查方法效率很低,所以引进了意向锁。
意向锁
含义:如果对一个结点加意向锁,则说明该结点的下层结点正在被加锁。
对任一结点加基本锁时,必须先对它的上层结点加意向锁。
三种常用的意向锁:IS锁、IX锁、SIX锁。
IS锁(意向共享锁,Intent Share Lock)
如果对一个数据对象加IS锁,表示它的后裔结点拟( 意向 )加S锁。
例如,事务T1要对R1中某个元组加S锁,则要首先对关系R1和数据库加IS锁。
IX锁(意向排他锁,Intent Exclusive Lock)
如果对一个数据对象加IX锁,表示它的后裔结点拟(意向)加X锁。
例如,事务T1要对R1中某个元组加X锁,则要首先对关系R1和数据库加IX锁。
SIX锁(共享意向排他锁,Share Intent Exclusive Lock)
如果对一个数据对象加SIX锁,表示对它加S锁,再加IX锁,即SIX= S + IX。
例如,事务T1想要读R1并更新R1中的第一个元组,因此它需要对R1加S锁,对R1中的第一个元组加X锁,加锁过程是,系统首先对数据库加IS,IX锁,表示这个事务要读它的后代结点,并更新它的后代结点;然后对关系R1加SIX锁,表示要读R1并更新它的后代结点,最后在对R1的第一个元组加X锁,以便能够更新它。
数据锁的相容矩阵
以第四行(T1-IX,假设事务T1持有对象A的IX锁,这就表明T1对A的某个或某些后代加了X锁)部分举例说明:
- (T2-S)事务T2想申请A的S锁,如果加锁成功,则T2也对A的所有后代结点加隐式S锁,在T1已经加了X锁的那些后代结点上,这个封锁请求是冲突的,所以T2的封锁请求会被拒绝,也就是说IX锁和S锁是不相容的。
- (T2-IS)事务T2想申请A的IS锁,也就是说T2将要对A的某个或某些后代结点加S锁,由于T1和T2的封锁可能加在A的不同后代结点上,所以还是有可能不冲突的,因此T2的封锁请求可以满足,也就是说IX锁和IS锁是相容的。如果接下来T2给A的后代结点加S锁时,与T1的X锁冲突,系统会在T2给A的后代加锁时拒绝它的请求。
锁的强度与偏序关系
从数据锁的相容矩阵,可以发现5种锁的强度如下图所示的偏序关系。
锁的强度是指它对其他锁的排斥程度。在这个偏序关系中X锁最强,其次是SIX锁,S锁和IX锁的强度相近,IS锁最弱。
一个事务在申请封锁时以强锁代替弱锁是安全的,反之则不然。
在具有意向锁的多粒度封锁方法中,任意事务T要对一个数据对象加锁,必须先对它的上层加点加意向锁。申请封锁时应该按照自上而下的次序进行,释放封锁时则应该按自下而上的次序进行。
例如,事务T1要对关系R1加S锁,则首先要对数据库加IS锁。检查数据库和R1是否已加了不相容的锁(X或IX)。不需要在搜索和检查R1中的元组是否已加了不相容的锁(X锁)。
具有意向锁的多粒度封锁方法提高了系统的并发度,减少了加锁和解锁的开销,在实际的数据库管理系统产品中得到广泛应用。
其他并发控制机制
并发控制的方法除了封锁技术外还有时间戳方法、乐观控制法和多版本并发控制等。
参考文献:
数据库系统概论-第5版[王珊,萨师煊]