C++ membery primitives

分配	释放	类别	可否重载
malloc	free	C 函数	不可
new	delete	C++ 表达式	不可
::operator new	::operator delete	C++ 函数	可
allocator< T >::allocate	allocator< T >::deallocate	C++ 标准库	可自由设计以搭配任何容器

第四种方法在不同的编译版本上有着不同的使用方法

#ifdef _MSC_VER
    int *p4 = allocator<int>().allocate(3, (int*)0);
    allocator<int>().deallocate(p4, 3);
#endif

#ifdef __BORLANDC__
    int *p4 = allocator<int>().allocate(5);
    allocator<int>().deallocate(p4, 5);
#endif

#ifdef __GNUC__
    // 在早期的 GUNC 中使用这种调用方法
    void *p4 = alloc::allocate(512);
    alloc::deallocate(p4, 512);
    // 在后期的 GUNC 中进行了进一步的优化和区分
    int *p4 = allocator<int>().allocate(7);
    allocator<int>().deallocate((int*)p4, 7);
    // 而早期的 alloc 仍然十分重要，于是换成了这种写法
    void *p5 = __gnuc_cxx::__pool_alloc<int>().allocate(9);
    __gnuc_cxx::__pool_alloc<int>().deallocate((int*)p5, 9);
#endif

new/delete expression

new 会先分配内存，然后调用构造函数，所以 new 的具体实现如下，而平时重载的 new，都是重载了 ::operator new

Complex *pc = new Complex(1, 2);
            ↓↓
try {
    void *mem = operator new(sizeof(Complex));// operator new 的实现调用了 malloc
    pc = static_cast<Complex*>(mem);
    pc->Complex::Complex(1, 2);
    // 在 GCC 中用户无法直接使用构造函数
} catch(std::bad_alloc) {
}

delete pc;
    ↓↓
pc->Complex::~Complex();
operator delete(pc);    // operaotr delete 的实现调用了 free

array new/delete

通过 new 开辟一个数组，在数组的起始位置会分配一个 4 字节的 cookie，在 cookie 里面记录了这次分配数组的长度。如果使用 delete 释放，只会释放其中的一块，其他块就发生内存泄漏，而使用 delete[] 释放，就可以保证申请的内存完全被释放了。

对于数组的构建和删除的过程中，按 0、1、2 下标顺序调用构造函数，按 2、1、0 下表顺序调用析构函数。

placement new

placement new 允许我们将对象构造于一个已经分配的内存中

char *buf = new char[sizeof(Complex)*3];
Complex *pc= new(buf)Complex(1, 2);
            ↓↓
try {
    void *mem = operator new(sizeof(Complex), buf);
    // 和 new 不同的地方在于多传了 buf 参数，于是 operator new 什么也不做直接返回 buf
    pc = static_cast<Complex*>(mem);
    pc->Complex::Complex(1, 2);
} catch(std::bad_alloc) {
}

class allocate

malloc 在分配内存的首尾分别会有 4 个字节的 cookie，记录了分配的内存的大小。所以频繁的 malloc 会造成很大一部分的内存浪费。

解决这种方法的技术是通过内存池技术，我可以一次性分配一大块的内存，在后续程序分配内存过程中，从这一大块中分配出一部分以供程序使用。

第一版的内存管理技术如下

class Screen{
public:
    static void* operator new(size_t size) {
        Screen *p;
        if(!freeStore){ // 如果没有可以用的内存空间，则再分配一次
            size_t chunk = screenChunk * size;
            freeStore = p = reinterpret_cast<Screen*> (new char[chunk]);  // char 字节为 1
            for(; p != &freeStore[screenChunk - 1]; ++ p){
                p -> next = p + 1; // 将得到的内存串成链表
            }
            p -> next = NULL;
        }
        p = freeStore;
        freeStore = freeStore -> next;
        return p;
    }
    static void operator delete(void *p) {
        (static_cast<Screen*>(p))->next = freeStore;
        // 显然，把 delete 掉的内存空间直接插入到头部，是最快的插入方式
        freeStore = static_cast<Screen*>(p);
    }
private:
    Screen *next;
    static Screen *freeStore;   // 将可用内存用链表形式存储，存下链表头指针
    static const int screenChunk;   // 选择一次性分配的内存空间
private:
    int i;
    /* 在第二版中，使用如下方法
    union {
        int i;
        Screen *next;
    }
        因为 next 只有在没有使用的时候才有意义，i 只有在被使用的时候才有意义，所以可以使用 union 来节省内存的消耗
    */
};
Screen* Screen::freeStore = NULL;
const int Screen::screenChunk = 24;
int main() {
    // freopen("in", "r", stdin);
    Screen *p[100];
    for(int i=0; i<100; i++) {
        p[i] = new Screen;
    }
    cout << "size of Screen " << sizeof(Screen) << endl;
    for(int i=0; i<10; i++) {
        cout << "address of p[" << i << "] " << p[i] << endl;
    }
    return 0;
}

第二版本和第一版本类似，只是加上了 union 优化。
前两个版本的分配内存操作都是在对象内实现的，然而对于每一个对象都写一个内存分配显然不符合实际，所以第三版本就是将内存分配的过程提取出来，单独封装成一个类 allocate，在每个类内存包含这个 allocate，然后调用 allocate 的函数完成分配过程。

new handler

当 operator new 没有能力分配足够的内存时，会抛出一个 bad_alloc 异常。但在抛出异常之前，其实系统会调用你设定了 new_handler 函数，这是 C++ 平台给程序员提供的一种方式。

typedef void(*new_handler);
new_handler set_new_handler(new_handler p)  throw();

优秀的 new handler 应该完成两件事：

让更多的内存可用
调用 abort 或 exit 放弃操作，结束程序。

std::allocator

std::allocator 运行模式

allocator 维护 16 个链表 free_list[16]，每个链表维护一个固定大小的内存池，从 free_list[0] 维护 8 字节开始，每个的链表比上一个链表多维护 8 个字节。当应用程序想要分配一个大小的内存，会向上调整到 8 的整数，然后从链表中分配。

allocator 每次会分配 size * 20 * 2 + RoundUp() 的内存，前 20 个块给链表，后面的一半内存称为备用池 pool，就是多分配出的一部分等着给下一次分配使用，从 pool 切出来的数量永远控制在 1-20 之间。RoundUp 是随着轮次的增多，每次多分配的内存，计算方式是 累计申请量>>4，然后调到 8 的倍数。

分配过程通过例子来解释：假设系统内存为 10000

分配 32 字节，此时 free_list[3] 为空且 pool 为空，所以会通过 malloc 一次分配 32 * 20 * 2 + RoundUp(0>>4) 字节。然后从中切出第一块给客户，剩下的 19 个块挂到 free_list[3] 上。后面的 *2 操作就是给 pool 的大小。
- 累计申请量：1280，pool 大小：640
分配 64 字节，此时 free_list[7] 为空但存在 pool，所以直接把 pool 分配给它用，切出第一块给客户，剩下 9 块挂到 free_list[7] 上。
- 累计申请量：1280，pool 大小：0
分配 96 字节，此时又重复第一次的过程，分配 96 * 20 * 2 + RoundUp(1280>>4) 字节并拿出前 20 块给 free_list[11] 使用。
- 累计申请量：5200，pool 大小：2000
分配 88 字节，此时 free_list[10] 为空但存在 pool，所以从 pool 分配，因为从 pool 每次分配的块数在 1-20 之间，也就是分配了 20 个出来。
- 累计申请量：5200，pool 大小：240
连续申请 3 个 88 字节，因为 free_list[10] 里面还有 19 个空闲，所以直接分配 3 个给客户
- 累计申请量：5200，pool 大小：240
申请 8 字节，此时 free_list[0] 为空但存在 pool，所以直接从 pool 分配 20 块 8 字节给 free_list[0] 使用
- 累计申请量：5200，pool 大小：80
申请 104 字节，此时 free_list[12] 为空但 pool 不够分配一块，那么把 80 的 pool 分配给 free_list[9]，在通过 malloc 分配 104 * 20 * 2 + RoundUp(5200>>4) 字节
- 累计申请量：9688，pool 大小：2408
申请 112 字节，此时 free_list[13] 为空但存在 pool，所以直接从 pool 分配20 块挂到 free_list[13] 上
- 累计申请量：9688，pool 大小：168
申请 48 字节，此时 free_list[5] 为空但存在 pool，所以直接从 pool 分配 3 个挂到 free_list[5] 上
- 累计申请量：9688，pool 大小：24
申请 72 字节，此时 free_list[8] 为空但 pool 不够分配一块，那么先把 24 字节的 pool 挂到 free_list[2] 上，然后又要通过 malloc 分配。显然此时系统已经没有多余的内存完成分配，那么系统会从已经分配的最接近 72 的资源里面分配一块给客户使用，也就是说此时会从 free_list[9] 分配一块 80 字节的块并切成 72+8 的两部分，第一部分分配给客户，第二部分变成 pool。
- 累计申请量：9688，pool 大小：8
申请 120 字节，此时 free_list[14] 为空但 pool 不够分配一块，那么先把 8 字节的 pool 挂到 free_list[0] 上，显然此时 malloc 仍然不够内存使用，但 free_list[14] 和 free_list[15] 都是空的，那么就办法分配了。
- 累计申请量：9688，pool 大小：0

allocator 第二级配置器源码

enum {__ALIGN = 8};                         // 小区块的上调边界
enum {__MAX_BYTES = 128};                   // 小区块的上限
enum {__NFREELISTS = __MAX_BYTES/__ALIGN};  // free-list 的个数

class alloc {
private:
    union obj{
        union obj* free_list_link;
    };
    static char* start_free;                // 指向 pool 的头
    static char* end_free;                  // 指向 pool 的尾
    static size_t heap_size;                // 累计分配量
    static obj* free_list[__NFREELISTS];    // free_list 数组

    static size_t ROUND_UP(size_t bytes) {  // 将 bytes 向上调整到 8 的倍数
        return ((bytes + __ALIGN-1)) & ~(__ALIGN-1);
    }
    static size_t FREELIST_INDEX(size_t bytes) {    // 获得应该从哪个 free_list 分配内存
        return (bytes+__ALIGN-1)/__ALIGN -1;
    } 
    static void* refill(size_t n) {         // 为链表填充内存，此时的 n 已经是 8 的倍数
        int nobjs = 20;
        char *chunk = chunk_alloc(n, nobjs);
        obj **my_free_list;
        obj *result;
        obj *current_obj;
        obj *next_obj;
        if(1 == nobjs)  return chunk;
        my_free_list = free_list + FREELIST_INDEX(n);
        result = (obj*)chunk;
        *my_free_list = next_obj = (obj*)(chunk+n);     // 直接拿第二块挂到链表上
        for(int i=1; ; i++) {
            current_obj = next_obj;
            next_obj = (obj*)((char*)next_obj+n);
            if(nobjs-1 == i) {
                current_obj->free_list_link = NULL;
                break;
            } else {
                current_obj->free_list_link = next_obj;
            }
        }
        return result;
    }
    static char* chunk_alloc(size_t size, int &nobjs){  // 分配一大块内存
        char *result;
        size_t total_bytes = size*nobjs;
        size_t bytes_left = end_free - start_free;
        if(bytes_left >= total_bytes) {      // 先从 pool 池分配，如果能够满足分配 20 个块
            result = start_free;
            start_free += total_bytes;
            return result;
        } else if(bytes_left >= size) {      // 如果不够 20 个但至少能分配一个
            nobjs = bytes_left/size;
            total_bytes = size*nobjs;
            result = start_free;
            start_free += total_bytes;
            return result;
        } else {                            // pool 池不够用
            size_t bytes_to_get = 2*total_bytes+ROUND_UP(heap_size>>4);
            if(bytes_left > 0) {         // 处理 pool 池碎片
                obj **my_free_list = free_list + FREELIST_INDEX(bytes_left);
                ((obj*)start_free)->free_list_link = *my_free_list;
                *my_free_list = (obj*)start_free;
            }
            start_free = (char*)malloc(bytes_to_get);   // 先分配到 pool 池中
            if(0 == start_free) {           // 如果系统内存不够分配
                obj **my_free_list;
                obj *p;
                for(int i=size; i<=__MAX_BYTES; i += __ALIGN) {  // 往后找一块可以拿来用的内存
                    my_free_list = free_list + FREELIST_INDEX(i);
                    p = *my_free_list;
                    if(0 != p) {            // 如果找到一块可以用的
                        *my_free_list = p->free_list_link;
                        start_free = (char*)p;
                        end_free = start_free+i;
                        return chunk_alloc(size, nobjs);// 扩充的 pool，所以在分配一次一定可以分配到
                    }
                }
                // 尝试利用一级配置器分配内存
                end_free = 0;
//              start_free = (char*)malloc_alloc::allocate(bytes_to_get);
            }
            heap_size += bytes_to_get;
            end_free = start_free + bytes_to_get;
            return chunk_alloc(size, nobjs);            // 扩充的 pool，所以在分配一次一定可以分配到
        }
    }

public:
    static void* allocate(size_t n) {
        obj **my_free_list;                 // obj**
        obj *result;
        if(n > (size_t)__MAX_BYTES) {        // 改用第一级p配置器
//          return malloc_alloc::allocate(n);
        }
        my_free_list = free_list + FREELIST_INDEX(n);
        result = *my_free_list;             // 获得对应的链表指针
        if(result == NULL) {                // 如果链表为空
            void *r = refill(ROUND_UP(n));
            return r;
        }
        *my_free_list = result->free_list_link;
        return result;
    }
    static void deallocate(void *p, size_t n) {
        obj *q = (obj*) p;
        obj **my_free_list;                 // obj**
        if(n > (size_t)__MAX_BYTES) {        // 改用第一级p配置器
//          malloc_alloc::deallocate(p, n);
            return ;
        }
        my_free_list = free_list + FREELIST_INDEX(n);
        q->free_list_link = *my_free_list;
        *my_free_list = q;
    }
};
char* alloc::start_free = NULL;
char* alloc::end_free = NULL;
size_t alloc::heap_size = 0;
alloc::obj* alloc::free_list[__NFREELISTS] = {0};

原文链接: https://www.cnblogs.com/Jiaaaaaaaqi/p/12629901.html

欢迎关注

微信关注下方公众号，第一时间获取干货硬货；公众号内回复【pdf】免费获取数百本计算机经典书籍;

也有高质量的技术群，里面有嵌入式、搜广推等BAT大佬

原创文章受到原创版权保护。转载请注明出处：https://www.ccppcoding.com/archives/339570

非原创文章文中已经注明原地址，如有侵权，联系删除

关注公众号【高性能架构探索】，第一时间获取最新文章

转载文章受原作者版权保护。转载请注明原作者出处！

C++内存管理技术