当前位置:网站首页>CAS无锁队列的实现
CAS无锁队列的实现
2022-08-04 05:30:00 【KuoGavin】
1. 基本原理
源于1994年10月发表在国际并行与分布式会议上的论文【无锁队列的实现.pdf】。CAS(Compare And Swap,CAS维基百科)指令。CAS的实现可参考下面的代码:
bool CAS(int* pAddr, int nExpected, int nNew) atomically {
if(*pAddr == nExpected) {
*pAddr = nNew;
return true;
} else return false;
}
//CAS返回bool告知原子性交换是否成功
CAS 根据字面意思即可理解,就是对数据进行交换的一种原子操作。对应到 CPU 指令的话就是cmpchg
。
无锁队列的内部实现实际上也是原子操作,可以避免多线程调用出现的不可预知的情况,也即进行线程的并发同步。主要的核心就是函数__sync_bool_compare_and_swap
,返回类型是 bool 型,原子交换成功返回 true,失败返回 false。
2. 代码实现
2.1 使用链表实现无锁队列
入队操作:
Enqueue(EleType x) {
Node* q = new Node();
q->x = x;
q->next = nullptr;
do {
Node* p = tail;
} while(!CAS(p->next, nullptr, q));
CAS(tail, p, q);
}
这样实现的话会导致若是某个线程在执行入队操作时,在CAS(tail, p, q)
执行之前,也即将尾节点替换为新加入的入队节点前挂掉了,那么将导致其它的线程在执行入队操作CAS(p->next, nullptr, q)
时一直返回 false,即无限循环于此,因为 p->next 已经更改为 q,但是tail并没有更新为 q 仍然是 p 。
基于此,可以对以上的入队操作进行改进,在do while();当中找到无锁队列的实际尾节点,即p->next==nullptr
,再进行 tail 节点的替换,实现代码如下:
Enqueue(EleType x) {
Node* q= new Node();
q->x = x;
q->next = nullptr;
Node* p = tail;
Node* oldP = tail;
do {
while(p->next != nullptr)
p = p->next;
} while(!CAS(p->next, nullptr, q));
CAS(tail, oldP, q);
}
这样的话即使出现上文中讲述的更新 tail 前线程挂掉的情况,在进入到 do while(); 循环时,p 将会指定为无锁队列的实际尾部节点,从而CAS(p->next, nullptr, q)
返回 true,结束循环,更新 tail 节点值。
出队操作:
Dequeue() {
do {
Node* p = head->next;
if(p == nullptr)
return EMPTY;
} while(CAS(head->next, p, p->next));
return p->val;
}
//这里的head是一个哑头节点
模板无锁队列类的实现:
有了如上的思想,那么就可以实现一个模板无锁队列类,代码如下:
// 定义一个链表实现队列
template <typename ElemType>
struct qnode // 链表节点
{
struct qnode *_next;
ElemType _data;
};
template <typename ElemType>
class Queue
{
private:
struct qnode<ElemType> *volatile _head = NULL; // 随着pop后指向的位置是不一样的, head不是固定的
struct qnode<ElemType> *volatile _tail = NULL;
public:
Queue() {
_head = _tail = new qnode<ElemType>;
_head->_next = NULL;
_tail->_next = NULL;
printf("Queue _head:%p\n", _head);
}
void push_list(const ElemType& e) {
struct qnode<ElemType>* p = new qnode<ElemType>;
if (!p) return ; //p生成失败
p->next = NULL;
p->data = e;
struct qnode<ElemType>* t = _tail;
struct qnode<ElemType>* old_t = _tail;
do {
// 当非NULL的时候说明不是尾部,因此需要指向下一个节点
while (t->next != NULL) {
t = t->next;
}
// 如果t->next为则null换为p
} while (!__sync_bool_compare_and_swap(&t->next, NULL, p));
// 如果尾部和原来的尾部相等,则换为p。
__sync_bool_compare_and_swap(&_tail, old_t, p);
}
bool pop_list(ElemType& e) {
//e作为传出参数,记录对头的元素值
struct qnode<ElemType>* p = NULL;
do {
p = _head;
if (p->next == NULL) return false;
// 如果头部等于p,那么就指向p的下一个
} while (!__sync_bool_compare_and_swap(&_head, p, p->next));
e = p->data; //p为最初的head值,返回旧队头值
delete p;
p = NULL;
return true;
}
};
该模板类的实现,也即是记录队头和队尾节点,链表的头节点没有存放数据(同样是哑节点?):
- push 到队尾的时候,先判断当前指针是否是队列的实际尾部,即使用CAS进行判断是不是,如果是,则
p->next == nullptr
,将 p->next 替换为 q, 同时更新 tail 尾节点的值;如果不是,则在 do while(); 当中进行寻找实际队尾节点; - pop 出队头的时候,同样也是在 do while(); 循环当中判断队列是否非空,非空则将之前的节点值返回,并将其删除,更新 head 头节点的值;
2.2 使用数组实现环形无锁队列
此外,还可以使用数组实现,因为环形数组一经内存申请后,不会再涉及内存请求和释放:
- 队列实现的形式是环形数组的形式;
- 队列的元素的值,初始的时候是三种可能的值。HEAD、TAIL、EMPTY;
- 数组一开始所有的元素都初始化为 EMPTY。有两个相邻的元素初始化为 HEAD 与 TAIL,代表着空队列;
- 入队操作。假设数据 x 要入队列,定位 TAIL 的位置,使用 double-CAS 方法把 (TAIL, EMPTY) 更新成 (x, TAIL)。需要注意,如果找不到 (TAIL, EMPTY),则说明队列满了。
- 出队操作。定位 HEAD 的位置,把 (HEAD, x) 更新成 (EMPTY, HEAD),并把 x 返回。同样需要注意,如果 x 是 TAIL,则说明队列为空。
3. ABA 问题及解决
简单的说就是线程A将当前值修改为10,此时线程B将值改为11,然后又有一个线程C把值又改为10,这样的话对于线程A来说取到的内存值和当前值是没变的,所以可以更新,但实际上是经过变化的,所以不符合实际逻辑的。
注意到CAS比较的是指针取内容得到的值,那么,假定某个线程准备出队操作,首先声明一个指向p指针head结点,接着要进行CAS操作,CAS(head,p,p->next)。假定在执行CAS操作之前,有个线程进行了入队操作,此时,head!=p,正常情形CAS(head,p,p->next)应该返回为false。但是,在CAS(head,p,p->next)之前,又有线程进行了入队操作,而入队的这个结点占用的内存恰恰是最开始的时候p所指向的内存,再恰恰经过一系列出队操作,使得当前头指针刚好指向刚刚入队操作的那块结点,最后,才开始,进行CAS操作。我们会发现原本应该返回为false的CAS操作,返回了true!(CAS比较的是内存地址所存放的值,==)。
解决ABA问题,可加入版本号这一控制信息,Java中有AtomicStampedReference类可以添加版本在比对内存值的时候加以区分。
4. 参考资料
边栏推荐
猜你喜欢
MAE 论文《Masked Autoencoders Are Scalable Vision Learners》
【论文阅读】Further Non-local and Channel Attention Networks for Vehicle Re-identification
Copy Siege Lion 5-minute online experience MindIR format model generation
tensorRT5.15 使用中的注意点
YOLOV4流程图(方便理解)
深度学习理论 —— 初始化、参数调节
Halcon缺陷检测
动手学深度学习_softmax回归
MNIST handwritten digit recognition, sorted by from two to ten
【论文阅读】Anchor-Free Person Search
随机推荐
(Navigation page) OpenStack-M version - manual construction of two nodes - with video from station B
tensorRT5.15 使用中的注意点
Copy攻城狮5分钟在线体验 MindIR 格式模型生成
【论文阅读】Further Non-local and Channel Attention Networks for Vehicle Re-identification
YOLOV4流程图(方便理解)
图像形变(插值方法)
投稿相关
双向LSTM
第二章 STA相关概念
DeblurGAN-v2: Deblurring (Orders-of-Magnitude) Faster and Better 图像去模糊
Code to celebrate the Dragon Boat Festival - Zongzi, your heart
【论文阅读】Multi-View Spectral Clustering with Optimal Neighborhood Laplacian Matrix
How to get started with MOOSE platform - an example of how to run the official tutorial
tensorRT教程——tensor RT OP理解(实现自定义层,搭建网络)
Unity ML-agents 参数设置解明
(导航页)OpenStack-M版-双节点手工搭建-附B站视频
MFC读取点云,只能正常显示第一个,显示后面时报错
[CV-Learning] Linear Classifier (SVM Basics)
【论文阅读】Anchor-Free Person Search
fuser 使用—— YOLOV5内存溢出——kill nvidai-smi 无pid 的 GPU 进程