当前位置:网站首页>缓存--伪共享问题
缓存--伪共享问题
2022-08-03 11:10:00 【zpv2jdfc】
接上一篇 CPU缓存一致性问题
什么是伪共享
伪共享问题指两个线程A和B,他们俩写入同一个cache block的不同变量时,会导致另一个cpu核心的缓存失效的问题。我们来详细看一下伪共享问题到底是怎么产生的:
假设A线程要访问变量A,B线程要访问变量B,并且变量A和B会被分配到同一个cache line中:
接下来,A线程要读取变量A。此时A、B所在的cache line被加载到核心1的cache中,并且状态被标记为独占:
此时,B线程要访问变量B,那么这个cache line被加载到核心2的cache中。并且两个核心的cache line都标记为共享:
接下来,问题来了。假设A线程修改了变量A,为了保证数据一致性,就需要把核心2的cache line标记为失效:
这样一来,如果B要读取变量B的值,就需要A先将cache line写回内存,然后B再从内存中读取。也就是说,明明B变量自始至终都没有改变过,但是在访问时却需要重新从内存读取。如果A、B两个线程轮流修改变量A、B的话,伪共享问题会严重影响性能。
解决伪共享的办法
1.字节填充
对上面这种情况,如果A、B不被分配在同一个cache line中自然就不存在伪共享问题了。
如何让A、B分配在不同cache line中呢?我们可以通过这个命令查看cache line的大小
more /sys/devices/system/cpu/cpu1/cache/index0/coherency_line_size

可以看到cache line大小为64字节。接下来,我们来对比一下使用字节填充后程序性能会提高多少。
不使用字节填充:
public class Main {
public static void main(String[] args) throws InterruptedException {
Pair pair=new Pair();
Thread t1 = new Thread(() -> {
for (int i = 0; i < 0x7fff_ffff; i++) {
pair.x++;
}
});
Thread t2 = new Thread(() -> {
for (int i = 0; i < 0x7fff_ffff; i++) {
pair.y++;
}
});
long start = System.currentTimeMillis();
t1.start();
t2.start();
t1.join();
t2.join();
System.out.println(System.currentTimeMillis() - start);
}
}
class Pair{
// long x1,x2,x3,x4,x5,x6,x7;
volatile long x=0;
// long y1,y2,y3,y4,y5,y6,y7;
volatile long y=0;
}
63615
使用字节填充:
public class Main {
public static void main(String[] args) throws InterruptedException {
Pair pair=new Pair();
Thread t1 = new Thread(() -> {
for (int i = 0; i < 0x7fff_ffff; i++) {
pair.x++;
}
});
Thread t2 = new Thread(() -> {
for (int i = 0; i < 0x7fff_ffff; i++) {
pair.y++;
}
});
long start = System.currentTimeMillis();
t1.start();
t2.start();
t1.join();
t2.join();
System.out.println(System.currentTimeMillis() - start);
}
}
class Pair{
long x1,x2,x3,x4,x5,x6,x7;
volatile long x=0;
long y1,y2,y3,y4,y5,y6,y7;
volatile long y=0;
}
10781
注意这里要用volatile关键字防止编译器优化指令。
2.使用@Contented 注解
@Contented注解原理也是字节填充,注解既可以加在字段,也可以加在类上。加在字段上表示这个字段单独占一个缓存行,加在类上表示类中所有字段都独占一个缓存行。
使用@Contented注解需要配置jvm参数 -XX:-RestrictContended,通过 -XX:ContendedPaddingWidth 可以修改填充的字节大小,有效值范围0 - 8192,默认是128字节。
边栏推荐
- This article takes you to understand the principle of CDN technology
- 「全球数字经济大会」登陆 N 世界,融云提供通信云服务支持
- 【MySQL功法】第2话 · 数据库与数据表的基本操作
- VRRP协议的作用及VRRP+OSPF配置方法
- 【Star项目】小帽飞机大战(九)
- 再谈“雷克萨斯”安全装置失效!安全手册疑点重重,网友:细思极恐
- Machine Learning (Chapter 1) - Feature Engineering
- What is a smart contract?
- BPMN和DMN基本概念和使用案例
- 第四周学习 HybridSN,MobileNet V1,V2,V3,SENet
猜你喜欢

Skills required to be a good architect: How to draw a system architecture that everyone will love?What's the secret?Come and open this article to see it!...

3分钟实现内网穿透(基于ngrok实现)

MySQL之json数据操作

再谈“雷克萨斯”安全装置失效!安全手册疑点重重,网友:细思极恐

Summary of redis basics - data types (strings, lists, sets, hashes, sets)

【MySQL功法】第2话 · 数据库与数据表的基本操作

嵌入式软件组件经典架构与存储器分类

VRRP协议的作用及VRRP+OSPF配置方法

云原生 Dev0ps 实践

The effects of the background and the Activiti
随机推荐
Web Server 设置缓存响应字段的一些推荐方案
记住用户名案例(js)
【AppCube】数字孪生万物可视 | 联接现实世界与数字空间
成为优秀架构师必备技能:怎样才能画出让所有人赞不绝口的系统架构图?秘诀是什么?快来打开这篇文章看看吧!...
html+css+php+mysql实现注册+登录+修改密码(附完整代码)
直播弱网优化
Dry goods!A highly structured and sparse linear transformation called Deformable Butterfly (DeBut)
实至名归!九章云极DataCanvas公司荣获智能制造领域多项殊荣
LeetCode——622.设计循环队列
How to make self-introduction
嵌入式软件组件经典架构与存储器分类
html网页如何获取后台数据库的数据(html + ajax + php + mysql)
MySQL database combat (1)
redis基础知识总结——数据类型(字符串,列表,集合,哈希,集合)
"Global Digital Economy Conference" landed in N World, Rongyun provides communication cloud service support
LeetCode第三题(Longest Substring Without Repeating Characters)三部曲之二
【多线程的相关内容】
跨链桥协议 Nomad 遭遇黑客攻击,损失超 1.5 亿美元
[Star Project] Little Hat Plane Battle (9)
多态详细讲解(简单实现买票系统模拟,覆盖/重定义,多态原理,虚表)