什么是拷贝构造函数

首先对于普通类型的对象来说,它们之间的复制是很简单的,例如:

int a = 100; int b = a; 而类对象与普通对象不同,类对象内部结构一般较为复杂,存在各种成员变量。

下面看一个类对象拷贝的简单例子。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
#include <iostream>
using namespace std;

class CExample {
private:
     int a;
public:
      //构造函数
     CExample(int b)
     { a = b;}

      //一般函数
     void Show ()
     {
        cout<<a<<endl;
      }
};

int main()
{
     CExample A(100);
     CExample B = A; //注意这里的对象初始化要调用拷贝构造函数,而非赋值
      B.Show ();
     return 0;
}

运行程序,屏幕输出100。从以上代码的运行结果可以看出,系统为对象 B 分配了内存并完成了与对象 A 的复制过程。就类对象而言,相同类型的类对象是通过拷贝构造函数来完成整个复制过程的。

下面举例说明拷贝构造函数的工作过程。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
#include <iostream>
using namespace std;

class CExample {
private:
    int a;
public:
    //构造函数
    CExample(int b)
    { a = b;}

    //拷贝构造函数
    CExample(const CExample& C)
    {
        a = C.a;
    }

    //一般函数
    void Show ()
    {
        cout<<a<<endl;
    }
};

int main()
{
    CExample A(100);
    CExample B = A; // CExample B(A); 也是一样的
     B.Show ();
    return 0;
}

CExample(const CExample& C) 就是我们自定义的拷贝构造函数。可见,拷贝构造函数是一种特殊的构造函数,函数的名称必须和类名称一致,它必须的一个参数是本类型的一个引用变量。

拷贝构造函数的调用时机

在C++中,下面三种对象需要调用拷贝构造函数!

对象以值传递的方式传入函数参数

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
class CExample
{
private:
 int a;

public:
 //构造函数
 CExample(int b)
{
  a = b;
  cout<<"creat: "<<a<<endl;
 }

 //拷贝构造
 CExample(const CExample& C)
 {
  a = C.a;
  cout<<"copy"<<endl;
 }

 //析构函数
 ~CExample()
 {
  cout<< "delete: "<<a<<endl;
 }

     void Show ()
 {
         cout<<a<<endl;
     }
};

//全局函数,传入的是对象
void g_Fun(CExample C)
{
 cout<<"test"<<endl;
}

int main()
{
 CExample test(1);
	//传入对象
 g_Fun(test);

 return 0;
}

调用g_Fun()时,会产生以下几个重要步骤:

  1. test对象传入形参时,会先会产生一个临时变量,就叫 C 吧。

  2. 然后调用拷贝构造函数把test的值给C。 整个这两个步骤有点像:CExample C(test);

  3. 等g_Fun()执行完后, 析构掉 C 对象。

对象以值传递的方式从函数返回

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
class CExample
{
private:
 int a;

public:
 //构造函数
 CExample(int b)
 {
  a = b;
 }

 //拷贝构造
 CExample(const CExample& C)
 {
  a = C.a;
  cout<<"copy"<<endl;
 }

     void Show ()
     {
        	cout<<a<<endl;
    	}
};

//全局函数
CExample g_Fun()
{
 CExample temp(0);
 return temp;
}

int main()
{
 g_Fun();
 return 0;
}

当g_Fun()函数执行到return时,会产生以下几个重要步骤:

  1. 先会产生一个临时变量,就叫XXXX吧。

  2. 然后调用拷贝构造函数把temp的值给XXXX。整个这两个步骤有点像:CExample XXXX(temp);

  3. 在函数执行到最后先析构temp局部变量。 等g_Fun()执行完后再析构掉XXXX对象。

  4. 对象需要通过另外一个对象进行初始化;

对象需要通过另外一个对象进行初始化

CExample A(100);
CExample B = A;
// CExample B(A);

后两句都会调用拷贝构造函数。

默认拷贝构造函数

很多时候在我们都不知道拷贝构造函数的情况下,传递对象给函数参数或者函数返回对象都能很好的进行,这是因为编译器会给我们自动产生一个拷贝构造函数,这就是“默认拷贝构造函数”.

这个构造函数很简单,仅仅使用“老对象”的数据成员的值对“新对象”的数据成员一一进行赋值,它一般具有以下形式:

1
2
3
4
5
Rect::Rect(const Rect& r)
{
    width=r.width;
    height=r.height;
}

以上代码不用我们编写,编译器会为我们自动生成。但是如果认为这样就可以解决对象的复制问题,那就错了,让我们来考虑以下一段代码:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
#include<iostream>
using namespace std;
class Rect
{
public:
    Rect()
    {
         count++;
    }
        ~Rect()
    {
         count--;
    }
    static int getCount()
    {
         return count;
    }
private:
    int width;
    int height;
    static int count;
};

int Rect::count=0;
int main()
{
    Rect rect1;
    cout<<"The count of Rect:"<<Rect::getCount()<<endl;
    Rect rect2(rect1);
    cout<<"The count of Rect:"<<Rect::getCount()<<endl;
    return 0;
}

这段代码对前面的类,加入了一个静态成员,目的是进行计数。

在主函数中,首先创建对象rect1,输出此时的对象个数,然后使用rect1复制出对象rect2,再输出此时的对象个数,按照理解,此时应该有两个对象存在,但实际程序运行时,输出的都是1,反应出只有1个对象。此外,在销毁对象时,由于会调用销毁两个对象,类的析构函数会调用两次,此时的计数器将变为负数。

说白了,就是拷贝构造函数无法创建新的静态数据成员。

出现这些问题最根本就在于在复制对象时,计数器没有递增,我们重新编写拷贝构造函数,如下:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
#include<iostream>
using namespace std;
class Rect
{
public:
    Rect()
    {
        count++;
    }
    Rect(const Rect& r)
    {
        width=r.width;
        height=r.height;
        count++;
    }
    ~Rect()
    {
        count--;
    }
    static int getCount()
    {
        return count;
    }
private:
    int width;
    int height;
    static int count;
};

int Rect::count=0;
int main()
{
    Rect rect1;
    cout<<"The count of Rect:"<<Rect::getCount()<<endl;
    Rect rect2(rect1);
    cout<<"The count of Rect:"<<Rect::getCount()<<endl;
    return 0;
}

浅拷贝和深拷贝的区别

浅拷贝

所谓浅拷贝,指的是在对象复制时,只对对象中的数据成员进行简单的赋值,默认拷贝构造函数执行的也是浅拷贝。大多情况下“浅拷贝”已经能很好地工作了,但是一旦对象存在了动态成员,那么浅拷贝就会出问题了,让我们考虑如下一段代码:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
#include<iostream>
#include<assert.h>
using namespace std;
class Rect
{
public:
    Rect()
    {
         p=new int(100);
    }
    ~Rect()
    {
         assert(p!=NULL);
        delete p;
    }

private:
    int width;
    int height;
    int *p;
};


int main()
{
    Rect rect1;
    Rect rect2(rect1);
    return 0;
}

在这段代码运行结束之前,会出现一个运行错误。原因就在于在进行对象复制时,对于动态分配的内容没有进行正确的操作。我们来分析一下:

在运行定义rect1对象后,由于在构造函数中有一个动态分配的语句,因此执行后的内存情况大致如下:

在使用rect1复制rect2时,由于执行的是浅拷贝,只是将成员的值进行赋值,这时 rect1.p = rect2.p,也即这两个指针指向了堆里的同一个空间,如下图所示:

当然,这不是我们所期望的结果,在销毁对象时,两个对象的析构函数将对同一个内存空间释放两次,这就是错误出现的原因。我们需要的不是两个p有相同的值,而是两个p指向的空间有相同的值,解决办法就是使用“深拷贝”。

深拷贝

当数据成员中有指针时,如果采用简单的浅拷贝,则两类中的两个指针将指向同一个地址,当对象快结束时,会调用两次析构函数,而导致指针悬挂现象。所以,这时,必须采用深拷贝。

在“深拷贝”的情况下,对于对象中动态成员,就不能仅仅简单地赋值了,而应该重新动态分配空间,如上面的例子就应该按照如下的方式进行处理:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
#include<iostream>
#include<assert.h>
using namespace std;
class Rect
{
public:
    Rect()
    {
         p=new int(100);
    }
    Rect(const Rect& r)
    {
         width=r.width;
        height=r.height;
         p=new int(100);
        *p=*(r.p);
    }
    ~Rect()
    {
         assert(p!=NULL);
        delete p;
    }

private:
    int width;
    int height;
    int *p;
};


int main()
{
    Rect rect1;
    Rect rect2(rect1);
    return 0;
}

此时,在完成对象的复制后,内存的一个大致情况如下:

此时rect1的p和rect2的p各自指向一段内存空间,但它们指向的空间具有相同的内容,这就是所谓的“深拷贝”。

默认拷贝构造函数的合成时机

编译器并不会在所有类中都生成默认拷贝构造函数.决定一个拷贝构造函数是否被生成的标准在于类是否需要"按位拷贝".

在以下4种情况不需要合成默认拷贝构造函数,而是由编译器另外合成新的拷贝构造函数:

  1. 当class内含一个成员对象而后者的类声明中有一个拷贝构造函数.
  2. 当class继承自一个基类而后者存在一个拷贝构造函数时(不论是被显式声明还是被合成而得).
  3. 当class声明一个或多个虚函数时.
  4. 当class派生自一个继承串链,其中有一个或多个虚基类时.

对于前两种情况,编译器必须将成员对象或基类的拷贝构造函数调用操作安插到合成的拷贝构造函数中.

情况3因为拷贝过程中会出现类的"切割"情况:基类拷贝派生类.此时两者的vptr指向的地址不同.需要在拷贝构造函数中显式设定实例化类对象的vptr.

情况4由于在执行期前不知道正确的基类,无法判断是否符合"按位拷贝".

为什么拷贝构造函数的形参一般是const引用类型?

Sample (Sample a);

不幸的是,即使是这样朴实无华的声明也隐含了一个微妙的错误,呵,我们来看看:当某个时候需要以一个Sample对象的值来为一个新对象进行初始化时,编译器会在各个重载的构造函数版本(如果有多个的话)搜寻,它找到的这个版本,发现声明参数与传入的对象一致,因此该构造函数将会被调用。目前为止,一切都在我们的意料之中,但问题很快来了:该函数的参数我们使用了值传递的方式,按照前面的分析,这需要调用复制构造函数,于是编译器又再度搜寻,最后当然又找到了它,于是进行调用,但同样地,传参时又要进行复制,于是再调用…这个过程周而复始,每次都是到了函数入口处就进行递归,直到堆栈空间耗尽,程序崩溃…

由是观之,值传递看来是行不通的了;我想C语言的用户这时很快会反应到与值传递对应的方式:地址传递(传址),于是声明变为这样:

Sample (Sample *p);

只作为一般的构造函数,它应该可以运行得很好,但别忘了我们要提供的是复制构造函数,它要求能够接受一个同类型对象,像这样:

1
2
Sample a;
Sample b(a);

而不是接受指针:

1
2
Sample a;
Sample b(&a);   // 还要取地址?当然,它可以正确运行,但...

虽然在初始化对象时可以像上面一样人为加一个取址符,但在函数参数表中(或者函数返回)进行值传递时,编译器可不知道在找不着合适定义的情况下牵就选择你的指针版本。

如果一个类中只存在一个参数为X&的拷贝构造函数,那么就不能使用const X或volatile X的对象实行拷贝初始化.而如果定义了一个拷贝构造函数,那么编译器就不会再自动默认拷贝构造函数。

因此若想让定义的拷贝构造函数能够支持const和普通类型的参数,需要使用const形参。

六、防止默认拷贝发生

通过对对象复制的分析,我们发现对象的复制大多在进行“值传递”时发生,这里有一个小技巧可以防止按值传递——声明一个私有拷贝构造函数。甚至不必去定义这个拷贝构造函数,这样因为拷贝构造函数是私有的,如果用户试图按值传递或函数返回该类对象,将得到一个编译错误,从而可以避免按值传递或返回对象。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
//防止按值传递
class CExample
{
private:
    int a;
public:
    //构造函数
    CExample(int b)
    {
        a = b;
        cout<<"creat: "<<a<<endl;
    }
private:
//拷贝构造函数,只是声明
CExample(const CExample& C);
public:
    ~CExample()
    {
        cout<< "delete: "<<a<<endl;
    }
    void Show ()
    {
        cout<<a<<endl;
    }
};

void g_Fun(CExample C)
{
    cout<<"test"<<endl;
}

int main()
{
    CExample test(1);
    //g_Fun(test);   //无法在函数内生成临时变量,拷贝函数出错

    return 0;
}

七、拷贝构造函数的细节

  1. 拷贝构造函数的作用

    作用就是用来复制对象的,在使用这个对象的实例来初始化这个对象的一个新的实例。

  2. 参数传递过程到底发生了什么?

    将地址传递和值传递统一起来,归根结底还是传递的是”值”(地址也是值,只不过通过它可以找到另一个值)

    1. 值传递:

      对于内置数据类型的传递时,直接赋值拷贝给形参(注意形参是函数内局部变量);

      对于类类型的传递时,需要首先调用该类的拷贝构造函数来初始化形参(局部对象);如void foo(class_type obj_local){}, 如果调用foo(obj); 首先class_type obj_local(obj) ,这样就定义了局部变量obj_local供函数内部使用

    2. 引用传递:

      无论对内置类型还是类类型,传递引用或指针最终都是传递的地址值!而地址总是指针类型(属于简单类型), 显然参数传递时,按简单类型的赋值拷贝,而不会有拷贝构造函数的调用(对于类类型).

    3. 在类中有指针数据成员时,拷贝构造函数的使用?

    因为默认的拷贝构造函数是按成员拷贝构造,这导致了两个不同的指针(如ptr1=ptr2)指向了相同的内存。当一个实例销毁时,调用析构函数 free(ptr1)释放了这段内存,那么剩下的一个实例的指针ptr2就无效了,在被销毁的时候free(ptr2)就会出现错误了, 这相当于重复释放一块内存两次。这种情况必须显式声明并实现自己的拷贝构造函数,来为新的实例的指针分配新的内存。

  3. 以下函数哪个是拷贝构造函数,为什么?

     X::X(const X&);   //拷贝构造函数
     X::X(X);
     X::X(X&, int a=1);   //拷贝构造函数
     X::X(X&, int a=1, int b=2);  //拷贝构造函数
    

    解答:

    对于一个类X, 如果一个构造函数的第一个参数是下列之一:

     a) X&
     b) const X&
     c) volatile X&
     d) const volatile X&
    

    且没有其他参数或其他参数都有默认值,那么这个函数是拷贝构造函数.

  4. 一个类中可以存在多于一个的拷贝构造函数吗?

    解答:

    类中可以存在超过一个拷贝构造函数。

    1
    2
    3
    4
    5
    
    class X {
    public:
      X(const X&); // const 的拷贝构造
     X(X&); // 非const的拷贝构造
    };
    

    ``

    注意,如果一个类中只存在一个参数为 X& 的拷贝构造函数,那么就不能使用const X或volatile X的对象实行拷贝初始化.

    如果一个类中没有定义拷贝构造函数,那么编译器会自动产生一个默认的拷贝构造函数。

    这个默认的参数可能为 X::X(const X&)或 X::X(X&),由编译器根据上下文决定选择哪一个。

  5. 什么情况下必须定义拷贝构造函数?

    当类的对象用于函数值传递时(值参数,返回类对象),拷贝构造函数会被调用。如果对象复制并非简单的值拷贝,那就必须定义拷贝构造函数。例如大的堆栈数据拷贝。如果定义了拷贝构造函数,那也必须重载赋值操作符。

八、拷贝构造函数和赋值运算符

在默认情况下(用户没有定义,但是也没有显式的删除),编译器会自动的隐式生成一个拷贝构造函数和赋值运算符。但用户可以使用delete来指定不生成拷贝构造函数和赋值运算符,这样的对象就不能通过值传递,也不能进行赋值运算。

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
class Person
{
public:

Person(const Person& p) = delete;
Person& operator=(const Person& p) = delete;
private:

int age;
string name;
};

上面的定义的类Person显式的删除了拷贝构造函数和赋值运算符,在需要调用拷贝构造函数或者赋值运算符的地方,会提示无法调用该函数,它是已删除的函数。

还有一点需要注意的是,拷贝构造函数必须以引用的方式传递参数。这是因为,在值传递的方式传递给一个函数的时候,会调用拷贝构造函数生成函数的实参。如果拷贝构造函数的参数仍然是以值的方式,就会无限循环的调用下去,直到函数的栈溢出。

九、调用时机

拷贝构造函数和赋值运算符的行为比较相似,都是将一个对象的值复制给另一个对象;但是其结果却有些不同,拷贝构造函数使用传入对象的值生成一个新的对象的实例,而赋值运算符是将对象的值复制给一个已经存在的实例。

这种区别从两者的名字也可以很轻易的分辨出来,拷贝构造函数也是一种构造函数,那么它的功能就是创建一个新的对象实例;赋值运算符是执行某种运算,将一个对象的值复制给另一个对象(已经存在的)。

调用的是拷贝构造函数还是赋值运算符,主要是看是否有新的对象实例产生。如果产生了新的对象实例,那调用的就是拷贝构造函数;如果没有,那就是对已有的对象赋值,调用的是赋值运算符。

调用拷贝构造函数主要有以下场景:

  1. 对象作为函数的参数,以值传递的方式传给函数。  

  2. 对象作为函数的返回值,以值的方式从函数返回。

  3. 使用一个对象给另一个对象初始化。

代码如下:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
#include<iostream>
using namespace std;
class Person
{
public:
    Person()
    {
        cout<< "Default Constructor"<<endl;
    }
    Person(const Person& p)
    {
        cout << "Copy Constructor" << endl;
    }
    Person& operator=(const Person& p)
    {
        cout << "Assign Operator" << endl;
        return *this;
    }

private:
    int age;
    string name;
};

void f(Person p)
{
    return;
}

Person f1()
{
Person p;
return p;
}

int main()
{

Person p;
cout<<endl<<"test 1"<<endl;
Person p1 = p;    // 1
cout<<endl<<"test 2"<<endl;
Person p2;
p2 = p;           // 2
cout<<endl<<"test 3"<<endl;
f(p2);            // 3
cout<<endl<<"test 4"<<endl;
p2 = f1();        // 4
cout<<endl<<"test 5"<<endl;
Person p3 = f1(); // 5
return 0;
}

上面代码中定义了一个类Person,显式的定义了拷贝构造函数和赋值运算符。

然后定义了两个函数:f,以值的方式参传入Person对象;f1,以值的方式返回Person对象。

在main中模拟了5个场景,测试调用的是拷贝构造函数还是赋值运算符。执行结果如下:

分析如下:

  1. 这是虽然使用了”=”,但是实际上使用对象p来创建一个新的对象p1。也就是产生了新的对象,所以调用的是拷贝构造函数。

  2. 首先声明一个对象p2,然后使用赋值运算符”=”,将p的值复制给p2,显然是调用赋值运算符,为一个已经存在的对象赋值 。

  3. 以值传递的方式将对象p2传入函数f内,调用拷贝构造函数构建一个函数f可用的临时变量。

  4. 函数f1以值的方式返回一个Person对象,在返回时会调用拷贝构造函数创建一个临时变量作为返回值,返回后调用赋值运算符将临时对象tmp赋值给p2.本应该是这样,但其实函数返回对象的时候到底是否创建临时变量,因编译器而异。在笔者编译环境下,不需要创建临时变量,直接返回函数中的相应对象。

  5. 由test4可知,在函数中调用默认构造函数,然后直接将该对象返回,而且p3使用返回值创建新的对象也不需要使用拷贝构造函数。

注意:函数返回是否创建临时变量,需要参考返回值优化。