从汇编看c++中的默认拷贝函数

《c++编程思想》上说一个类如果没有拷贝函数，那么编译器就会自动创建一个默认的拷贝函数。下面就让我们看一下真实的情况。

首先看一个简单的类X，这个类没有显示定义拷贝构造函数。c++源码如下:

class X {
private:
    int i;
    int j;
};

int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}

下面是其汇编代码:

_main    PROC

; 7    : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 16                    ; 为对象x1，x2预留16byte的栈空间

; 8    :     X x1;//先定义对象x1
; 9    :     X x2 = x1;//将x1拷贝给x2

    mov    eax, DWORD PTR _x1$[ebp];将x1的首地址里面的内容给寄存器eax，也就将x1中的成员变量i的值给eax
    mov    DWORD PTR _x2$[ebp], eax;将eax里面的值写入x2的首地址，也就是将eax里面的值写给x2的成员变量i
    mov    ecx, DWORD PTR _x1$[ebp+4];将偏移x1首地址4byte的内存里面的值给寄存器eax，也就是将x1中的成员变量j的值给ecx
    mov    DWORD PTR _x2$[ebp+4], ecx;将ecx里面的值写入偏移x2首地址4byte的内存里面，也就是将ecx里面的值写给x2的成员变量j

; 10   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP

从汇编代码里面可以看出，根本没有函数被调用，所有的拷贝赋值都是通过寄存器与内存地址相互通信完成。和编译器提供默认构造函数一样，可以把这种情况看成是编译器提供了一个无用的拷贝构造函数。

那么，什么时候编译器才真正的提供默认拷贝构造函数，并且显示调用呢？

下面是一种情况，类X里面含有虚成员函数:

c++源码:

class X {
private:
    int i;
    int j;
public:
    virtual ~X() {}//虚析构函数
};

int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}

由于这里只讨论拷贝函数，所以只看主函数main和拷贝函数里面的汇编代码:

下面是主函数main里面的汇编代码:

_main    PROC

; 9    : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 由于引入了虚函数，每个类所占的空间编程12byte 成员变量i，j8byte vptr指针4byte 因此这里为x1 x2预留24byte

; 10   :     X x1;//先定义对象x1

    lea    ecx, DWORD PTR _x1$[ebp];获取x1的首地址，放入ecx，为调用构造函数的秘密参数传入，即this
    call    ??0X@@QAE@XZ;调用构造函数

; 11   :     X x2 = x1;//将x1拷贝给x2

    lea    eax, DWORD PTR _x1$[ebp];获取x1的首地址，放入寄存器eax
    push    eax;将eax压栈，作为拷贝构造函数的参数
    lea    ecx, DWORD PTR _x2$[ebp];获取x2的首地址，放入寄存器ecx，作为调用拷贝构造函数的秘密参数传入，即this
    call    ??0X@@QAE@ABV0@@Z;调用拷贝构造函数

; 12   : }

    lea    ecx, DWORD PTR _x2$[ebp];获取x2的首地址，放入ecx寄存器，作为调用析构函数传入的秘密参数，即this
    call    ??1X@@UAE@XZ                ; 调用析构函数
    lea    ecx, DWORD PTR _x1$[ebp];获取x1的首地址，放入ecx寄存器，作为调用析构函数传入的秘密参数，即this
                                ;析构的顺序与构建的顺序相反
    call    ??1X@@UAE@XZ                ; 调用析构函数
    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP

可以看到，编译器为类X提供了默认的拷贝构造函数(非无用的默认拷贝构造函数)，并且显示调用。

由于一个类继承自继承自有虚函数成员的基类，使得它本身也含有虚函数成员，因此也就属于上一种情形。所以编译器在这种情况下，也会提供非无用的默认拷贝构造函数，并且能够显示调用。

下面是第二种情况，类Y继承自虚基类X

下面是c++源码:

class X {
private:
    int i;
};

class Y : public virtual  X {
private: 
    int i;
};

int main() {
    Y y;
    Y y1 = y;
}

虚基类X和子类Y都没有显示定义拷贝构造函数

下面来看一下main函数中的汇编码:

; 12   :     Y y;

    push    1;压入标志 避免重复调用虚基类的构造函数 在多重继承中有用
    lea    ecx, DWORD PTR _y$[ebp];将对象y的首地址给ecx(this指针) 作为隐含参数传给构造函数
    call    ??0Y@@QAE@XZ;调用对象y的构造函数 由于类Y继承自虚基类 编译器提供非无用的拷贝构造函数

; 13   :     Y y1 = y;

    push    1;压入标志
    lea    eax, DWORD PTR _y$[ebp];将对象y的首地址给eax，作为参数传递给拷贝构造函数
    push    eax;压入参数
    lea    ecx, DWORD PTR _y1$[ebp];将对象y1的首地址给ecx 作为隐含的参数传递给拷贝构造函数
    call    ??0Y@@QAE@ABV0@@Z;调用类Y的拷贝函数

可以看到，虽然虚基类X和子类Y都没显示定义拷贝构造函数，但是编译器还是为类Y提供了非无用的默认的拷贝构造函数

下面是类Y的拷贝构造函数汇编码:

??0Y@@QAE@ABV0@@Z PROC                    ; Y::Y, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    sub    esp, 8
    mov    DWORD PTR _this$[ebp], ecx;ecx存有y1对象的首地址，存入
    cmp    DWORD PTR _$initVBases$[ebp], 0;_$initVBases里面存的是调用拷贝构造函数之前存入的标志
                                       ;如果标志为1 拷贝虚基类 如果标志为0 不拷贝虚基类，跳到标号$LN1@Y@2处执行
                                       ;这里将标志和0做比较
    je    SHORT $LN1@Y@2
    mov    eax, DWORD PTR _this$[ebp];将y1对象首地址给eax
    mov    DWORD PTR [eax], OFFSET ??_8Y@@7B@;将??_8Y@@7B@内存首地址写给y1对象首地址所指向的内存，即初始化vt_offset指针
    cmp    DWORD PTR ___that$[ebp], 0;将对象y的首地址值和0 比较
    jne    SHORT $LN4@Y@2;不等于0就跳到标号处执行 否则顺序执行
    mov    DWORD PTR tv79[ebp], 0;将0写入指定内存
    jmp    SHORT $LN5@Y@2;跳到标号处执行
$LN4@Y@2:
    mov    ecx, DWORD PTR ___that$[ebp];将y对象首地址给ecx
    mov    edx, DWORD PTR [ecx];获取y对象vt_offset指针所指向内存的首地址
    mov    eax, DWORD PTR ___that$[ebp];将y对象的首地址给eax
    add    eax, DWORD PTR [edx+4];获取y对象中虚基类父对象相对于首地址处的vt_offset指针的偏移量，并和y对象首地址相加 算出y对象中虚基类父对象的首地址
    mov    DWORD PTR tv79[ebp], eax;将y对象中虚基类父对象首地址写入指定内存
$LN5@Y@2:
    mov    ecx, DWORD PTR tv79[ebp];将y对象中虚基类父对象的首地址给ecx
    mov    edx, DWORD PTR [ecx];将y对象中的虚基类父对象首地址值内容给edx 即将虚基类父对象中的成员变量i值给edx
    mov    eax, DWORD PTR _this$[ebp];将y1对象的首地址给eax
    mov    DWORD PTR [eax+8], edx;将edx的内容写给偏移y1对象首地址8byte处内存 这里拷贝y对象虚基类成员变量
$LN1@Y@2:
    mov    ecx, DWORD PTR _this$[ebp];将y1对象的首地址给ecx
    mov    edx, DWORD PTR ___that$[ebp];将y对象首地址给edx
    mov    eax, DWORD PTR [edx+4];将偏移y对象首地址4byte处的内存内容给eax 即将y对象自己的成员变量i值给eax
    mov    DWORD PTR [ecx+4], eax;将eax的内容写入偏移y1对象首地址4byte处的内存 即将eax的内容写给y1自己的成员变量i 这里拷贝y对象自己的成员变量
    mov    eax, DWORD PTR _this$[ebp]
    mov    esp, ebp
    pop    ebp
    ret    8
??0Y@@QAE@ABV0@@Z ENDP

下面是第三种情形，类X继承自类Y，类Y有显示定义的拷贝构造函数，而类没有提供拷贝构造函数：

下面是c++源码：

class Y {
private:
    int j;
public:
   Y(const Y& y) {}
   Y() {};//必须为Y提供默认的构造函数，否则编译出错
};
class X : public Y {
private:
    int i;
    int j;
};


int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}

下面是mian函数汇编代码:

; 16   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 为x1 x2预留24byte空间

; 17   :     X x1;//先定义对象x1

    lea    ecx, DWORD PTR _x1$[ebp];获取x1的首地址，作为隐含参数传递给构造函数
    call    ??0X@@QAE@XZ;//调用编译器为类X提供的默认构造函数

; 18   :     X x2 = x1;//将x1拷贝给x2

    lea    eax, DWORD PTR _x1$[ebp];获取x1的首地址，传给寄存器eax
    push    eax;将eax压栈，作为调用类X的拷贝构造函数的参数
    lea    ecx, DWORD PTR _x2$[ebp];获取x2的首地址，作为调用类X的拷贝函数的隐含参数
    call    ??0X@@QAE@ABV0@@Z;调用编译器提供的默认拷贝构造函数

; 19   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0

下面是类X的拷贝构造函数的汇编码:

??0X@@QAE@ABV0@@Z PROC                    ; X::X, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx
    mov    DWORD PTR _this$[ebp], ecx;ecx里面有x2的首地址
    mov    eax, DWORD PTR ___that$[ebp];将x1的首地址给eax
    push    eax;将eax的首地址压栈，作为调用父类拷贝构造函数的参数
    mov    ecx, DWORD PTR _this$[ebp];将x2的首地址给ecx，作为隐含参数传给父类的拷贝构造函数
    call    ??0Y@@QAE@ABV0@@Z            ; 调用父类拷贝构造函数
    mov    ecx, DWORD PTR _this$[ebp];获取x2的首地址给ecx
    mov    edx, DWORD PTR ___that$[ebp];获取x1的首地址给edx
    mov    eax, DWORD PTR [edx+4];将偏移x1首地址4byte处的内存里面的值写给eax，即将x1中子类成员变量i的值写给eax，因为x1的首地址处存放的是父类成员变量i，其值
                              ;由父类拷贝构造函数负责拷贝给x2
    mov    DWORD PTR [ecx+4], eax;将eax的值写入偏离x2首地址4byte处的内存里面，即将eax的值写入x2中子类成员变量i，因为x2的首地址处存放父类成员变量i，其值
                              ;由父类拷贝构造函数负责拷贝
    mov    ecx, DWORD PTR _this$[ebp];将x2的首地址给ecx
    mov    edx, DWORD PTR ___that$[ebp];将x1的首地址给edx
    mov    eax, DWORD PTR [edx+8];将偏移x1首地址8byte处的内存里面的值给eax，即将x1中子类成员变量j的值给eax
    mov    DWORD PTR [ecx+8], eax;将eax的值写入偏移x2首地址8byte的内存里面，即将eax的值写入x2子类成员j中
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址给eax，作为返回值。构造函数总是返回对象首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0X@@QAE@ABV0@@Z ENDP

从汇编码中可以看到，编译器确实为类X提供了默认的拷贝构造函数，并且进行了显示调用。而且在调用类X的拷贝构造函数中，首先调用父类的拷贝构造函数，拷贝父类中的成员变量，然后再拷贝子类中的成员变量。

下面是父类Y中的拷贝构造函数汇编码:

??0Y@@QAE@ABV0@@Z PROC                    ; Y::Y, COMDAT
; _this$ = ecx

; 5    :    Y(const Y& y) {}

    push    ebp
    mov    ebp, esp
    push    ecx;//这里压栈的目的是为隐含传给父类拷贝函数的this(即x2的首地址)
    mov    DWORD PTR _this$[ebp], ecx;ecx里面含有x2的首地址(即this),放入刚才的预留空间
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址写入eax，作为返回值。构造函数总是返回对象首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0Y@@QAE@ABV0@@Z ENDP                    ; Y::Y
_TEXT    ENDS

从汇编吗可以看到，由于父类自己显示定义了拷贝构造函数，编译器只是负责调用而已，并不提供像上面子类X里面默认拷贝构造函数的拷贝功能，即并不拷贝父类成员变量i。因为，在c++源码里面，父类拷贝构造函数本身就是空函数，什么也不做。

如果子类X 父类Y都不提供拷贝构造函数，情形有时怎样的呢？

下面是c++源码:

class Y {
private:
    int j;
};
class X : public Y {
private:
    int i;
    int j;
};


int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}

下面是对应的汇编码：

_main    PROC

; 12   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 为x1 x2预留24byte空间

; 13   :     X x1;//先定义对象x1
; 14   :     X x2 = x1;//将x1拷贝给x2

    mov    eax, DWORD PTR _x1$[ebp];获取x1的首地址里面的值，存入eax,即获取x1父类成员变量i的值写给eax
    mov    DWORD PTR _x2$[ebp], eax;将eax的值写入x2的首地址指向的内存，即将eax的值写给x2中的父类成员变量i
    mov    ecx, DWORD PTR _x1$[ebp+4];获取偏移x1首地址4byte处的内存里面的值，写入ecx，即获取x1子类成员变量i的值写给ecx
    mov    DWORD PTR _x2$[ebp+4], ecx;将ecx的值写入偏移x2首地址4byte处的内存里面，即将ecx的值写给x2中子类成员变量i
    mov    edx, DWORD PTR _x1$[ebp+8];获取偏移x1首地址8byte处的内存里面的值，写入edx，即获取x1子类成员变量j的值写给edx
    mov    DWORD PTR _x2$[ebp+8], edx;将edx的值写入偏移x2首地址8byte处的内存里面，即将edx的值写入x2子类成员变量j

; 15   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP

可以看到，编译器执行了拷贝过程，但是提供的是像刚开始的无用的默认拷贝构造函数，无论是拷贝父类成员变量，还是子类成员变量，都没有函数的调用。

下面看第四种情况，类X含有类Y的成员变量，类Y的成员变量有拷贝构造函数。

c++源码如下:

class Y {
private:
    int j;
public:
    Y(const Y& y) {}
    Y() {}//必须为Y提供默认的构造函数，否则编译报错
};
class X  {
private:
    int i;
    int j;
    Y y;
};


int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}

下面是main函数中的汇编码:

_main    PROC

; 16   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 为x1 x2预留24byte的空间

; 17   :     X x1;//先定义对象x1

    lea    ecx, DWORD PTR _x1$[ebp];获取x1的首地址，作为隐含参数传递给构造函数
    call    ??0X@@QAE@XZ;调用构造函数

; 18   :     X x2 = x1;//将x1拷贝给x2

    lea    eax, DWORD PTR _x1$[ebp];获取x1的首地址，放入寄存器eax
    push    eax;将eax压栈，为作为参数传递给编译器提供的默认拷贝构造函数
    lea    ecx, DWORD PTR _x2$[ebp];获取x2的首地址，作为隐含参数传递给编译器提供的默认拷贝构造函数
    call    ??0X@@QAE@ABV0@@Z;调用拷贝构造函数

; 19   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP

下面是编译器为类X提供的默认拷贝构造函数的汇编码:

??0X@@QAE@ABV0@@Z PROC                    ; X::X, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx;压栈的目的是为this(即x2的首地址)预留空间
    mov    DWORD PTR _this$[ebp], ecx;ecx里面含有x2的首地址，放入刚才预留的空间里面
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址给eax
    mov    ecx, DWORD PTR ___that$[ebp];将x1的首地址给ecx
    mov    edx, DWORD PTR [ecx];将x1的首地址的内容写入edx，即将x1中的成员变量i写入edx
    mov    DWORD PTR [eax], edx;将edx的值写入x2的首地址，即将edx的值写入x2的成员变量i
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址写入寄存器eax
    mov    ecx, DWORD PTR ___that$[ebp];将x1的首地址写入寄存器ecx
    mov    edx, DWORD PTR [ecx+4];将偏移x1首地址4byte处的内存里面的值写入edx，即将x1的成员变量j的值写入edx
    mov    DWORD PTR [eax+4], edx;将edx的值写入偏移x2首地址4byte处的内存，即将edx的值写入x2的成员变量j
    mov    eax, DWORD PTR ___that$[ebp];将x1的首地址存入寄存器eax
    add    eax, 8;//将x1的首地址加8，得到x1中成员对象y所处的地址，放入eax中
    push    eax;将eax的值压栈，作为调用成员变量y的拷贝函数的参数
    mov    ecx, DWORD PTR _this$[ebp];将x2的首地址存入寄存器ecx
    add    ecx, 8;将x2的首地址加8，得到x2中成员对象y所在地址，放入ecx，这个地址作为隐含的参数传给成员变量函数的拷贝构造函数
    call    ??0Y@@QAE@ABV0@@Z            ; 调用成员对象y的拷贝构造函数
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址放入eax，作为返回值。构造函数总是返回对象的首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0X@@QAE@ABV0@@Z ENDP

从汇编吗可以看到，调用类X拷贝构造函数的时候，先将x1中的成员变量i，j拷贝到x2中，然后才是调用成员对象y的拷贝构造函数拷贝y中的成员变量。这和继承不同，在继承中，总是先调用父类的拷贝构造函数，再进行子类中的拷贝。这说明，对于这种包含成员对象的情况，成员对象的拷贝函数调用时机与他们定义的位置有关。在这里，类X的成员对象y在成员变量i，j之后定义，因此，它的拷贝构造函数要等拷贝完i，j之后才会被调用。

下面是类Y中的拷贝构造函数汇编代码:

??0Y@@QAE@ABV0@@Z PROC                    ; Y::Y, COMDAT
; _this$ = ecx

; 6    :     Y(const Y& y) {}

    push    ebp
    mov    ebp, esp
    push    ecx;压栈ecx的目的是为了存放this(x2中成员对象y的首地址)预留空间
    mov    DWORD PTR _this$[ebp], ecx;ecx里面有x2中成员对象y的首地址，放入刚才的预留空间
    mov    eax, DWORD PTR _this$[ebp];将x2中成员变量首地址放入eax，作为返回值。构造函数总是返回对象首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0Y@@QAE@ABV0@@Z ENDP

从代码中可以看到，由于类Y显示定义了拷贝构造函数，编译器也只是负责显示调用，并没有提供任何的拷贝功能。因为在类Y中，拷贝构造函数就是被定义成了一个空函数

和继承一样，如果成员对象也没有拷贝构造函数呢？

下面是c++源码:

class Y {
private:
    int j;

};
class X  {
private:
    int i;
    int j;
    Y y;
};


int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}

下面是对象的汇编码:

_main    PROC

; 14   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 00000018H

; 15   :     X x1;//先定义对象x1
; 16   :     X x2 = x1;//将x1拷贝给x2

    mov    eax, DWORD PTR _x1$[ebp];将x1中首地址的内容写入eax，即将x1中的成员变量值i写入eax
    mov    DWORD PTR _x2$[ebp], eax;将eax的值写入x2的首地址处，即将eax的值写入x2的成员变量i
    mov    ecx, DWORD PTR _x1$[ebp+4];将偏移x1首地址4byte处的内存里面的内容写入ecx，即将x1中成员变量j的值写入ecx
    mov    DWORD PTR _x2$[ebp+4], ecx;将ecx的值写入偏移x2首地址4byte处的内存，即将ecx的值写入x2中成员变量j
    mov    edx, DWORD PTR _x1$[ebp+8];将偏移x1首地址8byte处(这里是x1成员对象y的首地址)的内存值写入edx，即将x1中成员对象y中的成员变量i值写入edx
    mov    DWORD PTR _x2$[ebp+8], edx;将edx的值写入偏移x2首地址8byte处(这里是x2成员对象y的首地址)的内存里面，即将edx的值写入x2中成员对象y的成员变量i里面

从汇编吗可以看出，编译器在这种情况下任然只是提供无用的默认拷贝构造函数，即没有显示的函数调用，只是用寄存器和内存之间的通信完成拷贝过程

综合上面的分析，可以看到：

对于一个类，如果它没有显示定义拷贝构造函数，编译器并不总是提供非无用的默认拷贝构造函数，除非:

1 该类包含虚函数成员函数(包括继承自虚基类或者继承的基类中有虚函数成员),这时编译器提供为该类提供非无用的默认拷贝构造函数

2 该类继承自虚基类(不管虚基类有没有显示定义拷贝构造函数，编译器都会为该类提供一个非无用的默认拷贝构造函数)

2 该类继承自一个基类，而基类含有自定义的拷贝函数，这时编译器为该类提供非无用的默认拷贝构造函数。(如果基类本身没有定义拷贝构造函数，但是编译器会为基类提供一个非无用的默认拷贝构造函数，也属于这种情况。也就是说，基类只要含有一个非无用的拷贝构造函数就行，不管这个非无用的拷贝构造函数是自定义的，还是编译器提供的)

3 该类包含一个成员对象，而该成员对象有自定的拷贝构造函数，这时编译器为该类提供非无用的默认拷贝构造函数。(如果成员对象本身没有定义拷贝构造函数，但是编译器会为成员对象提供一个非无用的默认拷贝构造函数，也属于这种情况。也就是说，成员对象只要包含一个非无用的拷贝构造函数就行，不管这个非无用的拷贝构造函数时自定义的，还是编译器提供的。这中情况和上一种类似).

并且，如果一个类自定义了一个拷贝构造函数，编译器只是负责调用，不会额外提供任何拷贝过程；而对于编译器提供的默认拷贝函数，不管是无用的，还是非无用的，都仅仅只是位拷贝.

原文链接: https://www.cnblogs.com/chaoguo1234/archive/2013/05/12/3074031.html

欢迎关注

微信关注下方公众号，第一时间获取干货硬货；公众号内回复【pdf】免费获取数百本计算机经典书籍

原创文章受到原创版权保护。转载请注明出处：https://www.ccppcoding.com/archives/88132

非原创文章文中已经注明原地址，如有侵权，联系删除

关注公众号【高性能架构探索】，第一时间获取最新文章

转载文章受原作者版权保护。转载请注明原作者出处！

从汇编看c++中的默认拷贝函数

相关推荐