c/c++中的内存精讲之内存分配

一.虚拟地址空间

64位的CPU一次处理64Bit(8字节)数据。

32位编译模式

在32位模式下,一个指针或地址占用4个字节的内存,共有32位,理论上能够访问的虚拟内存空间大小为 2^32 = 0X100000000 Bytes,即4GB,有效虚拟地址范围是 0 ~ 0XFFFFFFFF。

程序能够使用的最大内存为 4GB,跟物理内存没有关系。

如果程序需要的内存大于物理内存,或者内存中剩余的空间不足以容纳当前程序,那么操作系统会将内存中暂时用不到的一部分数据写入到磁盘,等需要的时候再读取回来,而我们的程序只管使用 4GB 的内存,不用关心硬件资源够不够。

如果物理内存大于 4GB,例如目前很多PC机都配备了8GB的内存,那么程序也无能为力,它只能够使用其中的 4GB。

64位编译模式

在64位编译模式:能够访问的虚拟内存空间大小为 2^64。这是一个很大的值,几乎是无限的,就目前的技术来讲,不但物理内存不可能达到这么大,CPU的寻址能力也没有这么大,实现64位长的虚拟地址只会增加系统的复杂度和地址转换的成本,带不来任何好处,所以 Windows 和 Linux 都对虚拟地址进行了限制,仅使用虚拟地址的低48位(6个字节),总的虚拟地址空间大小为 2^48 = 256TB。

需要注意的是:

32位的操作系统只能运行32位的程序(也即以32位模式编译的程序),64位操作系统可以同时运行32位的程序(为了向前兼容,保留已有的大量的32位应用程序)和64位的程序(也即以64位模式编译的程序)。

64位的CPU运行64位的程序才能发挥它的最大性能,运行32位的程序会白白浪费一部分资源。

二,内存分配

Windows:在默认情况下会将高地址的 2GB 空间分配给内核(也可以配置为1GB)。

Linux: 默认情况下会将高地址的 1GB 空间分配给内核。

内核空间

分配给内核的这段空间成为内核空间。

为了安全,只能借助系统API来访问你自己,这个API函数俗称为 System Call

用户空间

应用程序只能使用剩下的 2GB 或 3GB 的地址空间,称为用户空间(User Space)。

注意:为神马内核空间和用户空间要放到一个地址空间中,单独给内核空间一段地址空间不行么?。

内核用有自己独立的地址空间让内核处于一个独立的进程中,

这样每次进行系统调用都需要切换进程。切换进程的消耗是巨大的,不仅需要寄存器进栈出栈,还会使CPU中的数据缓存失效、MMU中的页表缓存失效,这将导致内存的访问在一段时间内相当低效。

而让内核和用户程序共享地址空间,发生系统调用时进行的是模式切换,模式切换仅仅需要寄存器进栈出栈,不会导致缓存失效;现代CPU也都提供了快速进出内核模式的指令,与进程切换比起来,效率大大提高了。

MMU:内存管理单元,负责虚拟地址映射为物理地址。
虚拟地址:现代操作系统都使用分页机制来管理内存,这使得每个程序都拥有自己的地址空间。每当程序使用虚拟地址进行读写时,都必须转换为实际的物理地址,才能真正在内存条上定位数据。

1,内存分配的类型:

C/C++中内存分为5个区,分别为栈区、堆区、全局/静态存储区、常量存储区、代码区

静态内存分配:编译时分配。包括:全局、静态全局、静态局部三种变量。

动态内存分配:运行时分配。包括:栈(stack): 局部变量。堆(heap): c语言中用到的变量被动态的分配在内存中。(malloc或calloc、realloc、free函数)

            这是linux32位环境下的内存分布情况

c/c++中的内存精讲之内存分配

2.变量的内存分配:

栈区(stack):指那些由编译器在需要的时候分配,不需要时自动清除的变量所在的储存区,如函数执行时,函数的形参以及函数内的局部变量分配在栈区,函数运行结束后,形参和局部变量去栈(自动释放)。栈内存分配运算内置与处理器的指令集中,效率高但是分配的内存空间有限。

堆区(heap):指哪些由程序员手动分配释放的储存区,如果程序员不释放这块内存,内存将一直被占用,直到程序运行结束由系统自动收回,c语言中使用malloc,free申请和释放空间。

全局数据区(global data):全局变量和静态变量的储存是放在一块的,其中初始化的全局变量和静态变量在一个区域,这块空间当程序运行结束后由系统释放。

常量储存区(const):常量字符串就是储存在这里的,如“ABC”字符串就储存在常量区,储存在常量区的只读不可写。const修饰的全局变量也储存在常量区,const修饰的局部变量依然在栈上

程序代码区:存放源程序的二进制代码。

三.堆与栈

栈:

先进后出原则

一段连续的内存,需要同时记录栈顶和栈底,才能对当前的栈定位。

内存有限,一般是1M-8M,超过这个值就会**栈溢出**。

栈通常也叫堆栈, 但是这里面的堆依然是堆,堆栈这个词并不包含谁。

c/c++中的内存精讲之内存分配

堆和栈区别->c语言的角度分析:

1、存储方式:

栈:在函数调用时,栈中存放的是函数中各个参数(局部变量)。栈底下是函数调用后的下一条指令。

堆:一般是在堆的头部用一个字节存放堆的大小。堆中的具体内容有程序员安排。

具体请看例子:

 void function()
    {
        int *p = (int *)malloc(10*sizeof(int));
    }

c/c++中的内存精讲之内存分配

2、管理方式:

栈:由系统自动分配空间,同时系统自动释放空间。例如,声明在函数中一个局部变量“int b“。系统自动在栈中为b开辟空间,当对应的生存周期结束后栈空间自动释放。

堆:需要程序员手动申请并且手动释放,并指明大小。在C语言中malloc函数申请,释放free函数,在C++中new和delete实现。

3、空间大小不同:

栈:一般情况下是1-8M大小的内存,超过就会栈溢出。

堆:获得空间根据系统的有效虚拟内存有关,比较灵活,比较大。

3.回收内存是否产生碎片问题:

栈:空间连续的,所以不会产生碎片。

堆:链式存储,会产生碎片。

5、数据扩展方式:

栈:向低地址扩展的数据结构,是一块连续的内存的区域。

堆:向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。

简单补一下高低地址的问题:

如int a=16777220,化为十六进制是0x01 00 00 04则04属于低字节,01属于高字节(共四个字节),进栈就是压栈,所以是往低地址扩展的数据结构。

c/c++中的内存精讲之内存分配

6、分配方式:

栈:有2种分配方式——静态分配和动态分配。静态由编译器完成,例如局部变量;动态由alloca函数实现,并且编译器会进行释放。

堆:都是动态分配的,没有静态分配的堆。

7、分配效率不同:

栈:由系统自动分配,速度较快。但程序员是无法控制的。

堆:由new分配的内存,一般速度比较慢,而且容易产生内存碎片,不过用起来方便。

四,动态内存分配

1.malloc函数;

函数原型: void * malloc (size_ t size) ;

功能:

1.开辟一块size大小的连续堆内存。

2.size表示堆 上所开辟内存的大小(字节数)。

3.函数返回值是一个指针,指向刚刚开辟的内存的首地址。

4.如果开辟内存失败, 返回一个空指针,即返回值为NULL。

5.当内存不再 使用时,应使用free ()函数将内存块释放

6.使用时 必须包含头文件<stdlib.h>或<malloc.h>

2.calloc函数;

函数原型: void * calloc(size_ t n, size t size);

功能:

1.在内存的动态存储区中分配n个长度为si ze的连续空间,

2.函数返回一个指向分配起始地址的指针;

3.如果分配不成功,返回NULL。

4.当内存不再 使用时,应使用free ()函数将内存块释放。

5.使用时 必须包含头文件<stdlib.h>或<malloc.h>

3.realloc函数;

函数原型:

void * realloc(void * mem_ address, size_ t newsize) ;

功能:

1.为已有内存的变量重新分配新的内存大小(可大、可小) ;

2.先判断当前的指针是否有足够的连续空间,如果有,扩大mem_address指向的地址,并且将mem_ address返回;

3.如果空间不够,先按照newsize指定的大小分配空间,将原有数据从头到尾拷贝到新分配的内存区域,而后释放原来mem_address 所指内存区域(注意:原来指针是自动释放,不需要使用free),同时返回新分配的内存区域的首地址。即重新分配存储器块的地址。

4.如果重新分配成功则返回指向被分配内存的指针;

5.如果分配不成功,返回NULL。

6.当内存不再使用时,应使用free ()函数将内存块释放

7.使用时必须包含头文件<stdlib.h>或<malloc.h>

4.free函数。

函数原型: void free (void *ptr) ; //ptr为要释放的内存指针。

free():释放指针变量在堆区上的内存空间,不能释放栈上的内存空间,free要与malloc(calloc、realloc)成对使用。

注意:

如果malloc(calloc、realloc) 比 free 多, 会造成内存泄漏;

如果malloc(calloc、realloc) 比 free 少,会造成二次删除, 破坏内存,导致程序崩溃。

参考:https://zhuanlan.zhihu.com/p/55003485
参考:http://c.biancheng.net/cpp/html/2856.html

原文链接: https://www.cnblogs.com/hornets/p/12461380.html

欢迎关注

微信关注下方公众号,第一时间获取干货硬货;公众号内回复【pdf】免费获取数百本计算机经典书籍;

也有高质量的技术群,里面有嵌入式、搜广推等BAT大佬

    c/c++中的内存精讲之内存分配

原创文章受到原创版权保护。转载请注明出处:https://www.ccppcoding.com/archives/334678

非原创文章文中已经注明原地址,如有侵权,联系删除

关注公众号【高性能架构探索】,第一时间获取最新文章

转载文章受原作者版权保护。转载请注明原作者出处!

(0)
上一篇 2023年3月1日 下午9:47
下一篇 2023年3月1日 下午9:47

相关推荐