从汇编看c++中的默认拷贝函数

《c++编程思想》上说一个类如果没有拷贝函数,那么编译器就会自动创建一个默认的拷贝函数。下面就让我们看一下真实的情况。

首先看一个简单的类X,这个类没有显示定义拷贝构造函数。c++源码如下:

class X {
private:
    int i;
    int j;
};

int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}

下面是其汇编代码:

_main    PROC

; 7    : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 16                    ; 为对象x1,x2预留16byte的栈空间

; 8    :     X x1;//先定义对象x1
; 9    :     X x2 = x1;//将x1拷贝给x2

    mov    eax, DWORD PTR _x1$[ebp];将x1的首地址里面的内容给寄存器eax,也就将x1中的成员变量i的值给eax
    mov    DWORD PTR _x2$[ebp], eax;将eax里面的值写入x2的首地址,也就是将eax里面的值写给x2的成员变量i
    mov    ecx, DWORD PTR _x1$[ebp+4];将偏移x1首地址4byte的内存里面的值给寄存器eax,也就是将x1中的成员变量j的值给ecx
    mov    DWORD PTR _x2$[ebp+4], ecx;将ecx里面的值写入偏移x2首地址4byte的内存里面,也就是将ecx里面的值写给x2的成员变量j

; 10   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP

从汇编代码里面可以看出,根本没有函数被调用,所有的拷贝赋值都是通过寄存器与内存地址相互通信完成。和编译器提供默认构造函数一样,可以把这种情况看成是编译器提供了一个无用的拷贝构造函数。

那么,什么时候编译器才真正的提供默认拷贝构造函数,并且显示调用呢?

下面是一种情况,类X里面含有虚成员函数:

c++源码:

class X {
private:
    int i;
    int j;
public:
    virtual ~X() {}//虚析构函数
};

int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}

由于这里只讨论拷贝函数,所以只看主函数main和拷贝函数里面的汇编代码:

下面是主函数main里面的汇编代码:

_main    PROC

; 9    : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 由于引入了虚函数,每个类所占的空间编程12byte 成员变量i,j8byte vptr指针4byte 因此这里为x1 x2预留24byte

; 10   :     X x1;//先定义对象x1

    lea    ecx, DWORD PTR _x1$[ebp];获取x1的首地址,放入ecx,为调用构造函数的秘密参数传入,即this
    call    ??0X@@QAE@XZ;调用构造函数

; 11   :     X x2 = x1;//将x1拷贝给x2

    lea    eax, DWORD PTR _x1$[ebp];获取x1的首地址,放入寄存器eax
    push    eax;将eax压栈,作为拷贝构造函数的参数
    lea    ecx, DWORD PTR _x2$[ebp];获取x2的首地址,放入寄存器ecx,作为调用拷贝构造函数的秘密参数传入,即this
    call    ??0X@@QAE@ABV0@@Z;调用拷贝构造函数

; 12   : }

    lea    ecx, DWORD PTR _x2$[ebp];获取x2的首地址,放入ecx寄存器,作为调用析构函数传入的秘密参数,即this
    call    ??1X@@UAE@XZ                ; 调用析构函数
    lea    ecx, DWORD PTR _x1$[ebp];获取x1的首地址,放入ecx寄存器,作为调用析构函数传入的秘密参数,即this
                                ;析构的顺序与构建的顺序相反
    call    ??1X@@UAE@XZ                ; 调用析构函数
    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP

可以看到,编译器为类X提供了默认的拷贝构造函数(非无用的默认拷贝构造函数),并且显示调用。

由于一个类继承自继承自有虚函数成员的基类,使得它本身也含有虚函数成员,因此也就属于上一种情形。所以编译器在这种情况下,也会提供非无用的默认拷贝构造函数,并且能够显示调用。

下面是第二种情况,类Y继承自虚基类X

下面是c++源码:

class X {
private:
    int i;
};

class Y : public virtual  X {
private: 
    int i;
};

int main() {
    Y y;
    Y y1 = y;
}

虚基类X和子类Y都没有显示定义拷贝构造函数

下面来看一下main函数中的汇编码:

; 12   :     Y y;

    push    1;压入标志 避免重复调用虚基类的构造函数 在多重继承中有用
    lea    ecx, DWORD PTR _y$[ebp];将对象y的首地址给ecx(this指针) 作为隐含参数传给构造函数
    call    ??0Y@@QAE@XZ;调用对象y的构造函数 由于类Y继承自虚基类 编译器提供非无用的拷贝构造函数

; 13   :     Y y1 = y;

    push    1;压入标志
    lea    eax, DWORD PTR _y$[ebp];将对象y的首地址给eax,作为参数传递给拷贝构造函数
    push    eax;压入参数
    lea    ecx, DWORD PTR _y1$[ebp];将对象y1的首地址给ecx 作为隐含的参数传递给拷贝构造函数
    call    ??0Y@@QAE@ABV0@@Z;调用类Y的拷贝函数

可以看到,虽然虚基类X和子类Y都没显示定义拷贝构造函数,但是编译器还是为类Y提供了非无用的默认的拷贝构造函数

下面是类Y的拷贝构造函数汇编码:

??0Y@@QAE@ABV0@@Z PROC                    ; Y::Y, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    sub    esp, 8
    mov    DWORD PTR _this$[ebp], ecx;ecx存有y1对象的首地址,存入
    cmp    DWORD PTR _$initVBases$[ebp], 0;_$initVBases里面存的是调用拷贝构造函数之前存入的标志
                                       ;如果标志为1 拷贝虚基类 如果标志为0 不拷贝虚基类,跳到标号$LN1@Y@2处执行
                                       ;这里将标志和0做比较
    je    SHORT $LN1@Y@2
    mov    eax, DWORD PTR _this$[ebp];将y1对象首地址给eax
    mov    DWORD PTR [eax], OFFSET ??_8Y@@7B@;将??_8Y@@7B@内存首地址写给y1对象首地址所指向的内存,即初始化vt_offset指针
    cmp    DWORD PTR ___that$[ebp], 0;将对象y的首地址值和0 比较
    jne    SHORT $LN4@Y@2;不等于0就跳到标号处执行 否则顺序执行
    mov    DWORD PTR tv79[ebp], 0;将0写入指定内存
    jmp    SHORT $LN5@Y@2;跳到标号处执行
$LN4@Y@2:
    mov    ecx, DWORD PTR ___that$[ebp];将y对象首地址给ecx
    mov    edx, DWORD PTR [ecx];获取y对象vt_offset指针所指向内存的首地址
    mov    eax, DWORD PTR ___that$[ebp];将y对象的首地址给eax
    add    eax, DWORD PTR [edx+4];获取y对象中虚基类父对象相对于首地址处的vt_offset指针的偏移量,并和y对象首地址相加 算出y对象中虚基类父对象的首地址
    mov    DWORD PTR tv79[ebp], eax;将y对象中虚基类父对象首地址写入指定内存
$LN5@Y@2:
    mov    ecx, DWORD PTR tv79[ebp];将y对象中虚基类父对象的首地址给ecx
    mov    edx, DWORD PTR [ecx];将y对象中的虚基类父对象首地址值内容给edx 即将虚基类父对象中的成员变量i值给edx
    mov    eax, DWORD PTR _this$[ebp];将y1对象的首地址给eax
    mov    DWORD PTR [eax+8], edx;将edx的内容写给偏移y1对象首地址8byte处内存 这里拷贝y对象虚基类成员变量
$LN1@Y@2:
    mov    ecx, DWORD PTR _this$[ebp];将y1对象的首地址给ecx
    mov    edx, DWORD PTR ___that$[ebp];将y对象首地址给edx
    mov    eax, DWORD PTR [edx+4];将偏移y对象首地址4byte处的内存内容给eax 即将y对象自己的成员变量i值给eax
    mov    DWORD PTR [ecx+4], eax;将eax的内容写入偏移y1对象首地址4byte处的内存 即将eax的内容写给y1自己的成员变量i 这里拷贝y对象自己的成员变量
    mov    eax, DWORD PTR _this$[ebp]
    mov    esp, ebp
    pop    ebp
    ret    8
??0Y@@QAE@ABV0@@Z ENDP

下面是第三种情形,类X继承自类Y,类Y有显示定义的拷贝构造函数,而类没有提供拷贝构造函数:

下面是c++源码:

class Y {
private:
    int j;
public:
   Y(const Y& y) {}
   Y() {};//必须为Y提供默认的构造函数,否则编译出错
};
class X : public Y {
private:
    int i;
    int j;
};


int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}

下面是mian函数汇编代码:

; 16   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 为x1 x2预留24byte空间

; 17   :     X x1;//先定义对象x1

    lea    ecx, DWORD PTR _x1$[ebp];获取x1的首地址,作为隐含参数传递给构造函数
    call    ??0X@@QAE@XZ;//调用编译器为类X提供的默认构造函数

; 18   :     X x2 = x1;//将x1拷贝给x2

    lea    eax, DWORD PTR _x1$[ebp];获取x1的首地址,传给寄存器eax
    push    eax;将eax压栈,作为调用类X的拷贝构造函数的参数
    lea    ecx, DWORD PTR _x2$[ebp];获取x2的首地址,作为调用类X的拷贝函数的隐含参数
    call    ??0X@@QAE@ABV0@@Z;调用编译器提供的默认拷贝构造函数

; 19   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0

下面是类X的拷贝构造函数的汇编码:

??0X@@QAE@ABV0@@Z PROC                    ; X::X, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx
    mov    DWORD PTR _this$[ebp], ecx;ecx里面有x2的首地址
    mov    eax, DWORD PTR ___that$[ebp];将x1的首地址给eax
    push    eax;将eax的首地址压栈,作为调用父类拷贝构造函数的参数
    mov    ecx, DWORD PTR _this$[ebp];将x2的首地址给ecx,作为隐含参数传给父类的拷贝构造函数
    call    ??0Y@@QAE@ABV0@@Z            ; 调用父类拷贝构造函数
    mov    ecx, DWORD PTR _this$[ebp];获取x2的首地址给ecx
    mov    edx, DWORD PTR ___that$[ebp];获取x1的首地址给edx
    mov    eax, DWORD PTR [edx+4];将偏移x1首地址4byte处的内存里面的值写给eax,即将x1中子类成员变量i的值写给eax,因为x1的首地址处存放的是父类成员变量i,其值
                              ;由父类拷贝构造函数负责拷贝给x2
    mov    DWORD PTR [ecx+4], eax;将eax的值写入偏离x2首地址4byte处的内存里面,即将eax的值写入x2中子类成员变量i,因为x2的首地址处存放父类成员变量i,其值
                              ;由父类拷贝构造函数负责拷贝
    mov    ecx, DWORD PTR _this$[ebp];将x2的首地址给ecx
    mov    edx, DWORD PTR ___that$[ebp];将x1的首地址给edx
    mov    eax, DWORD PTR [edx+8];将偏移x1首地址8byte处的内存里面的值给eax,即将x1中子类成员变量j的值给eax
    mov    DWORD PTR [ecx+8], eax;将eax的值写入偏移x2首地址8byte的内存里面,即将eax的值写入x2子类成员j中
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址给eax,作为返回值。构造函数总是返回对象首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0X@@QAE@ABV0@@Z ENDP

从汇编码中可以看到,编译器确实为类X提供了默认的拷贝构造函数,并且进行了显示调用。而且在调用类X的拷贝构造函数中,首先调用父类的拷贝构造函数,拷贝父类中的成员变量,然后再拷贝子类中的成员变量。

下面是父类Y中的拷贝构造函数汇编码:

??0Y@@QAE@ABV0@@Z PROC                    ; Y::Y, COMDAT
; _this$ = ecx

; 5    :    Y(const Y& y) {}

    push    ebp
    mov    ebp, esp
    push    ecx;//这里压栈的目的是为隐含传给父类拷贝函数的this(即x2的首地址)
    mov    DWORD PTR _this$[ebp], ecx;ecx里面含有x2的首地址(即this),放入刚才的预留空间
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址写入eax,作为返回值。构造函数总是返回对象首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0Y@@QAE@ABV0@@Z ENDP                    ; Y::Y
_TEXT    ENDS

从汇编吗可以看到,由于父类自己显示定义了拷贝构造函数,编译器只是负责调用而已,并不提供像上面子类X里面默认拷贝构造函数的拷贝功能,即并不拷贝父类成员变量i。因为,在c++源码里面,父类拷贝构造函数本身就是空函数,什么也不做。

如果子类X 父类Y都不提供拷贝构造函数,情形有时怎样的呢?

下面是c++源码:

class Y {
private:
    int j;
};
class X : public Y {
private:
    int i;
    int j;
};


int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}

下面是对应的汇编码:

_main    PROC

; 12   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 为x1 x2预留24byte空间

; 13   :     X x1;//先定义对象x1
; 14   :     X x2 = x1;//将x1拷贝给x2

    mov    eax, DWORD PTR _x1$[ebp];获取x1的首地址里面的值,存入eax,即获取x1父类成员变量i的值写给eax
    mov    DWORD PTR _x2$[ebp], eax;将eax的值写入x2的首地址指向的内存,即将eax的值写给x2中的父类成员变量i
    mov    ecx, DWORD PTR _x1$[ebp+4];获取偏移x1首地址4byte处的内存里面的值,写入ecx,即获取x1子类成员变量i的值写给ecx
    mov    DWORD PTR _x2$[ebp+4], ecx;将ecx的值写入偏移x2首地址4byte处的内存里面,即将ecx的值写给x2中子类成员变量i
    mov    edx, DWORD PTR _x1$[ebp+8];获取偏移x1首地址8byte处的内存里面的值,写入edx,即获取x1子类成员变量j的值写给edx
    mov    DWORD PTR _x2$[ebp+8], edx;将edx的值写入偏移x2首地址8byte处的内存里面,即将edx的值写入x2子类成员变量j

; 15   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP

可以看到,编译器执行了拷贝过程,但是提供的是像刚开始的无用的默认拷贝构造函数,无论是拷贝父类成员变量,还是子类成员变量,都没有函数的调用。

下面看第四种情况,类X含有类Y的成员变量,类Y的成员变量有拷贝构造函数。

c++源码如下:

class Y {
private:
    int j;
public:
    Y(const Y& y) {}
    Y() {}//必须为Y提供默认的构造函数,否则编译报错
};
class X  {
private:
    int i;
    int j;
    Y y;
};


int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}

下面是main函数中的汇编码:

_main    PROC

; 16   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 为x1 x2预留24byte的空间

; 17   :     X x1;//先定义对象x1

    lea    ecx, DWORD PTR _x1$[ebp];获取x1的首地址,作为隐含参数传递给构造函数
    call    ??0X@@QAE@XZ;调用构造函数

; 18   :     X x2 = x1;//将x1拷贝给x2

    lea    eax, DWORD PTR _x1$[ebp];获取x1的首地址,放入寄存器eax
    push    eax;将eax压栈,为作为参数传递给编译器提供的默认拷贝构造函数
    lea    ecx, DWORD PTR _x2$[ebp];获取x2的首地址,作为隐含参数传递给编译器提供的默认拷贝构造函数
    call    ??0X@@QAE@ABV0@@Z;调用拷贝构造函数

; 19   : }

    xor    eax, eax
    mov    esp, ebp
    pop    ebp
    ret    0
_main    ENDP

下面是编译器为类X提供的默认拷贝构造函数的汇编码:

??0X@@QAE@ABV0@@Z PROC                    ; X::X, COMDAT
; _this$ = ecx
    push    ebp
    mov    ebp, esp
    push    ecx;压栈的目的是为this(即x2的首地址)预留空间
    mov    DWORD PTR _this$[ebp], ecx;ecx里面含有x2的首地址,放入刚才预留的空间里面
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址给eax
    mov    ecx, DWORD PTR ___that$[ebp];将x1的首地址给ecx
    mov    edx, DWORD PTR [ecx];将x1的首地址的内容写入edx,即将x1中的成员变量i写入edx
    mov    DWORD PTR [eax], edx;将edx的值写入x2的首地址,即将edx的值写入x2的成员变量i
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址写入寄存器eax
    mov    ecx, DWORD PTR ___that$[ebp];将x1的首地址写入寄存器ecx
    mov    edx, DWORD PTR [ecx+4];将偏移x1首地址4byte处的内存里面的值写入edx,即将x1的成员变量j的值写入edx
    mov    DWORD PTR [eax+4], edx;将edx的值写入偏移x2首地址4byte处的内存,即将edx的值写入x2的成员变量j
    mov    eax, DWORD PTR ___that$[ebp];将x1的首地址存入寄存器eax
    add    eax, 8;//将x1的首地址加8,得到x1中成员对象y所处的地址,放入eax中
    push    eax;将eax的值压栈,作为调用成员变量y的拷贝函数的参数
    mov    ecx, DWORD PTR _this$[ebp];将x2的首地址存入寄存器ecx
    add    ecx, 8;将x2的首地址加8,得到x2中成员对象y所在地址,放入ecx,这个地址作为隐含的参数传给成员变量函数的拷贝构造函数
    call    ??0Y@@QAE@ABV0@@Z            ; 调用成员对象y的拷贝构造函数
    mov    eax, DWORD PTR _this$[ebp];将x2的首地址放入eax,作为返回值。构造函数总是返回对象的首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0X@@QAE@ABV0@@Z ENDP

从汇编吗可以看到,调用类X拷贝构造函数的时候,先将x1中的成员变量i,j拷贝到x2中,然后才是调用成员对象y的拷贝构造函数拷贝y中的成员变量。这和继承不同,在继承中,总是先调用父类的拷贝构造函数,再进行子类中的拷贝。这说明,对于这种包含成员对象的情况,成员对象的拷贝函数调用时机与他们定义的位置有关。在这里,类X的成员对象y在成员变量i,j之后定义,因此,它的拷贝构造函数要等拷贝完i,j之后才会被调用。

下面是类Y中的拷贝构造函数汇编代码:

??0Y@@QAE@ABV0@@Z PROC                    ; Y::Y, COMDAT
; _this$ = ecx

; 6    :     Y(const Y& y) {}

    push    ebp
    mov    ebp, esp
    push    ecx;压栈ecx的目的是为了存放this(x2中成员对象y的首地址)预留空间
    mov    DWORD PTR _this$[ebp], ecx;ecx里面有x2中成员对象y的首地址,放入刚才的预留空间
    mov    eax, DWORD PTR _this$[ebp];将x2中成员变量首地址放入eax,作为返回值。构造函数总是返回对象首地址
    mov    esp, ebp
    pop    ebp
    ret    4
??0Y@@QAE@ABV0@@Z ENDP

从代码中可以看到,由于类Y显示定义了拷贝构造函数,编译器也只是负责显示调用,并没有提供任何的拷贝功能。因为在类Y中,拷贝构造函数就是被定义成了一个空函数

和继承一样,如果成员对象也没有拷贝构造函数呢?

下面是c++源码:

class Y {
private:
    int j;

};
class X  {
private:
    int i;
    int j;
    Y y;
};


int main() {
    X x1;//先定义对象x1
    X x2 = x1;//将x1拷贝给x2
}

下面是对象的汇编码:

_main    PROC

; 14   : int main() {

    push    ebp
    mov    ebp, esp
    sub    esp, 24                    ; 00000018H

; 15   :     X x1;//先定义对象x1
; 16   :     X x2 = x1;//将x1拷贝给x2

    mov    eax, DWORD PTR _x1$[ebp];将x1中首地址的内容写入eax,即将x1中的成员变量值i写入eax
    mov    DWORD PTR _x2$[ebp], eax;将eax的值写入x2的首地址处,即将eax的值写入x2的成员变量i
    mov    ecx, DWORD PTR _x1$[ebp+4];将偏移x1首地址4byte处的内存里面的内容写入ecx,即将x1中成员变量j的值写入ecx
    mov    DWORD PTR _x2$[ebp+4], ecx;将ecx的值写入偏移x2首地址4byte处的内存,即将ecx的值写入x2中成员变量j
    mov    edx, DWORD PTR _x1$[ebp+8];将偏移x1首地址8byte处(这里是x1成员对象y的首地址)的内存值写入edx,即将x1中成员对象y中的成员变量i值写入edx
    mov    DWORD PTR _x2$[ebp+8], edx;将edx的值写入偏移x2首地址8byte处(这里是x2成员对象y的首地址)的内存里面,即将edx的值写入x2中成员对象y的成员变量i里面


从汇编吗可以看出,编译器在这种情况下任然只是提供无用的默认拷贝构造函数,即没有显示的函数调用,只是用寄存器和内存之间的通信完成拷贝过程

综合上面的分析,可以看到:

对于一个类,如果它没有显示定义拷贝构造函数,编译器并不总是提供非无用的默认拷贝构造函数,除非:

1 该类包含虚函数成员函数(包括继承自虚基类或者继承的基类中有虚函数成员),这时编译器提供为该类提供非无用的默认拷贝构造函数

2 该类继承自虚基类(不管虚基类有没有显示定义拷贝构造函数,编译器都会为该类提供一个非无用的默认拷贝构造函数)

2 该类继承自一个基类,而基类含有自定义的拷贝函数,这时编译器为该类提供非无用的默认拷贝构造函数。(如果基类本身没有定义拷贝构造函数,但是编译器会为基类提供一个非无用的默认拷贝构造函数,也属于这种情况。也就是说,基类只要含有一个非无用的拷贝构造函数就行,不管这个非无用的拷贝构造函数是自定义的,还是编译器提供的)

3 该类包含一个成员对象,而该成员对象有自定的拷贝构造函数,这时编译器为该类提供非无用的默认拷贝构造函数。(如果成员对象本身没有定义拷贝构造函数,但是编译器会为成员对象提供一个非无用的默认拷贝构造函数,也属于这种情况。也就是说,成员对象只要包含一个非无用的拷贝构造函数就行,不管这个非无用的拷贝构造函数时自定义的,还是编译器提供的。这中情况和上一种类似).

并且,如果一个类自定义了一个拷贝构造函数,编译器只是负责调用,不会额外提供任何拷贝过程;而对于编译器提供的默认拷贝函数,不管是无用的,还是非无用的,都仅仅只是位拷贝.

原文链接: https://www.cnblogs.com/chaoguo1234/archive/2013/05/12/3074031.html

欢迎关注

微信关注下方公众号,第一时间获取干货硬货;公众号内回复【pdf】免费获取数百本计算机经典书籍

原创文章受到原创版权保护。转载请注明出处:https://www.ccppcoding.com/archives/88132

非原创文章文中已经注明原地址,如有侵权,联系删除

关注公众号【高性能架构探索】,第一时间获取最新文章

转载文章受原作者版权保护。转载请注明原作者出处!

(0)
上一篇 2023年2月9日 下午11:27
下一篇 2023年2月9日 下午11:27

相关推荐