当前位置:网站首页>go——内存分配机制
go——内存分配机制
2022-08-02 20:08:00 【Meme_xp】
Go语言内置运行时(就是runtime),抛弃了传统的内存分配方式,改为自主管理。这样可以自主地实现更好的内存使用模式,比如内存池、预分配等等。这样,不会每次内存分配都需要进行系统调用。
设计思想
1.内存分配算法采用Google的 TGMalloc算法:每个线程都会自行维护一个独立的内存池,进行内存分配时优先从该内存池中分配,当内存池不足时才会向加锁向全局内存池申请,减少系统调用并且避免不同线程对全局内存池的锁竞争
2.把内存切分的非常的细小,分为多级管理,以降低锁的粒度
3.回收对象内存时,并没有将其真正释放掉,只是放回预先分配的大块内存中,以便复用。只有内存闲置过多的时候,才会尝试归还部分内存给操作系统,降低整体开销
Go的内存管理组件主要有:mspan 、mcache .mcentral和mheap

mspan其实就是一个内存管理的基础单元
mcache是线程的一个缓存,比如说每个g,每个线程,每个goroutine它会有一个mcache,mcache实际上就是有多个mspan
mcentral是一个中心缓存,不属于任何一个线程,是一个中心缓存,全局的。里面包含不同规格的span,每个规格的span分为两类:一类是空闲的一类是非空闲的
mheap也是全局的页堆,它和中心缓存全部都是有一把琐的,里面也有mspan和mcentral,
中心缓存就是在mheap上面进行管理。最后是一个堆,就是分配内存的地方
分配对象:
1.微对象(0,16B)︰先使用线程缓存上的微型分配器,再依次尝试线程缓存、中心缓存、堆分配内存;
2.小对象[16B,32KB]依次尝试线程缓存、中心缓存、堆分配内存;
3.大对象(32KB,+oo):直接尝试堆分配内存;
分配流程
1.首先通过计算使用的大小规格
2.然后使用mcache中对应大小规格的块分配。
3.如果mcentral 中没有可用的块,则向mheap申请,并根据算法找到最合适的mspan 。
4.如果申请到的mspan超出申请大小,将会根据需求进行切分,以返回用户所需的页数。剩余的页构成一个新的mspan放回mheap 的空闲列表。
5.如果mheap中没有可用span,则向操作系统申请一系列新的页(最小1MB)

内存逃逸机制
概念
在一段程序中,每一个函数都会有自己的内存区域存放自己的局部变量、返回地址等,这些内存会由编译器在栈中进行分配,每一个函数都会分配一个栈桢,在函数运行结束后进行销毁,但是有些变量我们想在函数运行结束后仍然使用它,那么就需要把这个变量在堆上分配,这种从"栈"上逃逸到"堆""上的现象就成为内存逃逸。
在栈上分配的地址,一般由系统申请和释放,不会有额外性能的开销,比如函数的入参、局部变量、返回值等。在堆上分配的内存,如果要回收掉,需要进行GC,那么GC一定会带来额外的性能开销。编程语言不断优化GC算法,主要目的都是为了减少GC带来的额外性能开销,变量一旦逃逸会导致性能开销变大。
逃逸机制
编译器会根据变量是否被外部引用来决定是否逃逸:
1.如果函数外部没有引用,则优先放到栈中;
2.如果函数外部存在引用,则必定放到堆中;
3.如果栈上放不下,则必定放到堆上;
总结
1.栈上分配内存比在堆中分配内存效率更高
2.栈上分配的内存不需要GC处理,而堆需要
3.逃逸分析目的是决定内分配地址是栈还是堆
4.逃逸分析在编译阶段完成因为无论变量的大小,只要是指针变量都会在堆上分配,所以对于小变量我们还是使用传值效率(而不是传指针)更高一点
内存对齐机制
什么是内存对齐
为了能让CPU可以更快的存取到各个字段,Go编译器会帮你把struct结构体做数据的对齐。所谓的数据对齐,是指内存地址是所存储数据大小(按字节为单位)的整数倍,以便CPU可以一次将该数据从内存中读取出来。编译器通过在结构体的各个字段之间填充一些空白已达到对齐的目的。
对齐系数
不同硬件平台占用的大小和对齐值都可能是不一样的,每个特定平台上的编译器都有自己的默认"“对齐系数”,32位系统对齐系数是4,64位系统对齐系数是8
不同类型的对齐系数也可能不一样,使用Go语言中的unsafe.Alignof 函数可以返回相应类型的对齐系数,对齐系数都符合2^n这个规律,最大也不会超过8
优点
1.提高可移植性,有些CPU可以访问任意地址上的任意数据,而有些CPU只能在特定地址访问数据,因此不同硬件平台具有差异性,这样的代码就不具有移植性,如果在编译时,将分配的内存进行对齐,这就具有平台可以移植性了
⒉.提高内存的访问效率,32位CPU下一次可以从内存中读取32位〈4个字节)的数据,64位CPU下一次可以从内存中读取64位(8个字节)的数据,这个长度也称为CPU的字长。CPU一次可以读取1个字长的数据到内存中,如果所需要读取的数据正好跨了1个字长,那就得花两个CPU周期的时间去读取了。因此在内存中存放数据时进行对齐,可以提高内存访问效率。
缺点
1.存在内存空间的浪费,实际上是空间换时间
结构体对齐
1.结构体变量中成员的偏移量必须是成员大小的整数倍
2.整个结构体的地址必须是最大字节的整数倍(结构体的内存占用是1/4/8/16byte…)
边栏推荐
- SQL Server安装教程
- Day35 LeetCode
- 即时通讯开发移动端网络短连接的优化手段
- .NET如何快速比较两个byte数组是否相等
- LeetCode:622. 设计循环队列【模拟循环队列】
- 网络协议介绍
- "A daily practice, happy water problem" 1374. Generate a string with an odd number of each character
- 供电系统电气图
- 【手撕AHB-APB Bridge】~ AMBA总线 之 APB
- 有效解决MySQL报错:ERROR 1045 (28000): Access denied for user ‘root‘@‘localhost‘ (using password: NO/YES)
猜你喜欢

Tencent YunMeng every jie: I experienced by cloud native authors efficiency best practices case

GNN教程:图神经网络基础知识!

遇上Mysql亿级优化,怎么办

Parse the commonly used methods in the List interface that are overridden by subclasses
![[AnXun cup 2019] easy_web](/img/26/c04bc8b9c65ac75ddd2696b48e1661.png)
[AnXun cup 2019] easy_web

Helm基础知识

成为黑客不得不学的语言,看完觉得你们还可吗?
![LeetCode 622 设计循环队列[数组 队列] HERODING的LeetCode之路](/img/dc/ba5a0c3f6a58283d79c5916376e49e.png)
LeetCode 622 设计循环队列[数组 队列] HERODING的LeetCode之路

AI Scientist: Automatically discover hidden state variables of physical systems

框架设计:PC 端单页多页框架如何设计与落地
随机推荐
如何使用windbg查看C#某个线程的栈大小 ?
PLC工作原理动画
OP-5,输入/输出信号范围-一信号处理能力
笑话:如果你在河边等待得足够久,你会看到你的敌人的尸体漂过,是怎么翻译出来的?
Common tools and test methods for interface testing (Introduction)
J9 digital theory: the Internet across chain bridge has what effect?
Five data structures of Redis and their corresponding usage scenarios
PyTorch分布式backends
C# Monitor类
顺序查找和折半查找,看这篇就够了
SQL Server安装教程
V - memo new instructions
LeetCode - 105. 从前序与中序遍历序列构造二叉树;023.合并K个升序链表
Axure9的元件用法
【LeetCode】1374. 生成每种字符都是奇数个的字符串
J9 Digital Currency Theory: Identifying Web3's New Scarcity: Open Source Developers
"A daily practice, happy water problem" 1374. Generate a string with an odd number of each character
网上那么多教人赚钱的方法,但是你实际上是靠什么赚钱的呢?
特拉维夫大学 | Efficient Long-Text Understanding with Short-Text Models(使用短文本模型进行高效的长文本理解)
五大维度解读软件测试分类