# 第4章 复合类型

## 4.1 数组

例子：
```C
short months[12]; // creates array of 12 short
typeName arrayName[arraySize];
```

`sizeof`运算符返回类型或数据对象第长度（单位为字节）。注意，如果将`sizeof`运算符用于数组名，得到的将是整个数组中第字节数。但如果将`sizeof`用于数组元素，则得到的是元素的长度（单位为字节）。

```C
// arrayone.cpp -- small arrays of integers
#include <iostream>
int main()
{
    using namespace std;
    int yams[3] = {7, 8, 6};

    cout << "Size of yams array = " << sizeof yams << " bytes\n";
    cout << "Size of one element = " << sizeof yams[0] << " bytes\n";
}
```

**Output:**
```C
Size of yams array = 12 bytes
Size of one element = 4 bytes
```

### 4.1.2 数组的初始化规则
只有在定义数组时才能使用初始化，此后就不能使用了，也不能将一个数组赋给另一个数组：
```C
int cards[4] = {3, 6, 8, 10};  // okay
int hand[4];                   // okay
hand[4] = {5, 6, 7, 9};        // not allowed
hand = cards;                  // not allowed
```

初始化数组的时候，提供的值可以少于数组的元素数目。例如，下面的语句只初始化hotelTips的前两个元素：
```C
float hotelTips[5] = {5.0, 2.5};
```

如果只对数组的一部分进行初始化，则编译器将把其他的元素设置为0。因此，将数组中所有的元素都初始化0非常简单-- 只要显式地将第一个元素初始化为0，然后让编译器将其他的元素都初始化为0即可。

如果初始化为{1} 而不是 {0}，则第一个元素被设置为1，其他元素都被设置为0。

如果初始化数组时方括号内([])为空，C++ 编译器将计算元素个数。例如，对于下面的声明：
```C
short things[] = {1, 5, 3, 6};
```
编译器将使things数组包含4个元素。

### 4.1.3 C++11数组初始化的方法
1. 初始化数组时，可以省略等号(=)：
```C
double earnings[4] {1.2, 1.6, 1.3, 1.4};
```

2. {}内可以为空，这将把所有的元素都设置为0
```C
unsigned int counts[10] = {};  // all elements set to 0
float balances[100] {};        // all elements set to 0
```

3. 列表初始化禁止缩窄转换
```C
long plifs[] = {25, 92, 3.0};  // not allowed
char slifs[] = {'h', 1122011}; // not allowed
char tlifs[] = {'h', 112};     // allowed
```
上述代码中，
- 第一条不能通过编译，因为浮点数转为整型是缩窄操作，即使浮点数的小数点后面为0.
- 第二条语句也不能通过编译，因为1122011超出了char变量的取值范围(这里假设char变量的长度为8位)
- 第三条可以通过编译，因为虽然112 是一个int值，但是在char变量的取值范围内。

---

## 4.2 字符串

1. C-风格字符串(C-Style String)
2. String 类库的方法

#### C-风格字符串(C-Style String)
性质：以空字符(null character)结尾，空字符被写作`\0`，其ASCII码为0，用来标记字符串的结尾。
```C
char dog[8] = {'b', 'e', 'a', 'u', 'x', ' ', 'I', 'I'}; //not a string
char cat[8] = {'f', 'a', 't', 'e', 's', 's', 'a', '\0'}; //a string
```
这两个数组都是char数组，但只有第二个数组是字符串。空字符对C-风格字符串而言至关重要。

例如，C++中很多处理字符串对函数，其中包括cout使用的那些函数。他们都逐个处理字符串中的字符，直到到达空字符为止。如果使用cout 显示上面的cat 这样的字符串，则将显示前7个字符，发现空字符后停止。如果使用cout 显示上面的 dog 数组（它不是字符串），cout 将打印出数组中的 8 个字母，并接着将内存中随后的各个字节解释为要打印的字符，直到遇到空字符为止。

#### 字符串常量(String constant) 或字符串字面值(string literal)
不用使用大量单引号，以及手动加上空字符

双引号扩起来的字符串会隐式包括结尾的空字符。
```C
char bird[11] = "Mr. Cheeps";
char fish[] = "Bubbles";
```

<img src="https://github.com/Weizhuo-Zhang/c-_primer_plus/blob/master/chapter04/pics/init_string.png?raw=1" width="70%">

注意，字符串常量（使用双引号）不能与字符常量（使用单引号）互换。字符常量(如'S')是字符串编码的简写形式。在ASCII系统上，'S'芝士83的另一种写法，因此，下面的语句将83赋给shirt_size:
```C
char shirt_size = 'S';
```

但`"S"`不是字符常量，它表示的是两个字符(字符 S 和 \0)组成的字符串。更糟糕的是，**“S”实际表示的是字符串所在的内存地址。因此下面的语句试图将一个内存地址赋给 shirt_size**：
```C
char shirt_size = "S";
```

---

### 4.2.1 拼接字符串常量
任何两个由（空白、制表符和换行符）分隔的字符串常量都将自动拼接成一个。因此下面所有的输出语句都是等效的：
```C
cout << "I'd give my right arm to be" " a great violinist.\n";
cout << "I'd give my right arm to be a great violinist.\n";
cout << "I'd give my right ar"
    "m to be a great violinist.\n";
```
第一个字符串中的 \0 字符将被第二个字符串的第一个字符取代。

### 4.2.2 在数组中使用字符串

sizeof 运算符指出整个数组的长度：15字节，但 `strlen()` 函数返回的是存储在数组中的字符串长度，而不是数组本身的长度。另外，`strlen()`只计算课件的字符，而不把空字符计算在内。因此，对于 `Basicman` 返回的值为8，而不是9.

### 4.2.3 字符串输入
cin使用空白（空格、制表符和换行符）来确定字符串的结束位置。

### 4.2.4 每次读取一行字符串输入
#### getline() 和 get()
这两个函数都读取一行输入，直到达到换行符。然而，随后 getline() 将丢弃换行符，而 get() 将换行符保留在输入序列中。

**1. 面向行的输入：getline()**

getline() 函数读取整行，

**2. 面向行的输入：get()**

`get()`不会读取并且丢弃换行符，而是将其留在输入队列中。假设我们连续调用两次`get()`。

```C
cin.get(name, ArSize);
cin.get(dessert, ArSize);
```

第一次调用后，换行符将留在输入队列中，因此第二次调用时看到的第一个字符便是换行符。因此`get()`认为已经到达行尾，而没有发现任何可读取的内容。如果不借助帮助，`get()`将不能跨过换行符。

幸运的是，`get()`有另外一种变体。使用不带任何参数的`cin.get()`调用可读取的下一个字符(即便是换行符)，因此可以用它来处理换行符，为读取下一行输入做好准备。
```C
cin.get(name, ArSize);
cin.get();
cin.get(desert, ArSize);
```

另一种使用`get()`的方式是将两个类成员函数拼接起来(合并)：
```C
cin.get(name, ArSize).get();
```

**3. 空行和其他问题**
当`getline()`或`get()`读取空行时，将发生什么情况？最初的做法是，下一条输入语句将在前一条`getline()`或`get()`结束读取的位置开始读取；但当前的做法是，当`get()`(不是`getline()`)读取空行后将设置失效位(failbit)。这意味着接下来的输入将被阻断，但是可以用下面的命令来恢复输入：
```C
cin.clear();
```
另一个潜在的问题是，输入字符串可能比分配的空间长。如果输入行包含的字符数比指定的多，则`getline()`和`get()` 会把剩余的字符留在输入队列中，而`getline()`还会设置失效位，并关闭后面的输入。

---

## 4.3 String 类简介

string 对象优点

1. 可以将string对象声明为简单变量，而不是数组：
```c
string str1;               // create an empty string object
string str2 = "panter";    // create an initialized string
```
2. **类设计让程序能够自动处理string的大小**。例如`str1`的声明创建一个长度为0的string对象，但程序将输入读取到`str1`中的时候，将自动调整`str1`的长度：
```
cin >> str1;               // str1 resized to fit input
```

### 4.3.1 C++11 字符串初始化

```c
char first_date[] = {"Le Chapon Dodu"};
char second_date[] = {"The Elegant Plate"};
string third_date[] = {"The Bread bowl"};
string fourth_date[] {"Hank's Fine Eats"};
```

### 4.3.2 赋值、拼接和附加
- **赋值**
   * 不能将一个数组赋给另一个数组
   * 但可以将一个`string`对象赋给另一个`string`对象
   
- **拼接**
   * `+` 运算符将两个string对象合并起来
   ```c
   str3 = str1 + str2;
   ```

- **附加**
   * `+=` 运算符将字符串附加到string对象末尾
   ```c
   str1 += str2;
   ```
   
### 4.3.3 string类的其他操作

**头文件cstring(以前为string.h)**

- `strcpy()`将字符串复制到字符数组中。
- `strcat()`将字符串附加到字符数组末尾。
```c
strcpy(charr1, charr2); // copy charr2 to charr1
strcat(charr1, charr2); // append contents of charr2 to charr1
```
---

### 4.3.4 string 类 I/O

**程序清单4.10 strtype4.cpp**
```c
// strtype4.cpp -- line input
#include <iostream>
#include <string>              // make string class available
#include <cstring>             // C-style string library

int main()
{
    using namespace std;
    char charr[20];
    string str;
    
    cout << "Length of string in charr before input: "
         << strlen(charr) << endl;
    cout << "Length of string in str before input: "
         << str.size() << endl;
    cout << "Enter a line of text:\n";
    cin.getline(charr, 20);      // indicate maximum length
    cout << "You entered: " << charr << endl;
    cout << "Enter another line of text:\n";
    getline(cin, str);           // cin now an argument; no length specifier
    cout << "You entered: " << str << endl;
    cout << "Length of string in charr after input: "
         << strlen(charr) << endl;
    cout << "Length of string in str after input: "
         << str.size() << endl;
    return 0;
}
```

**Output**
```
Length of string in charr after input: 27
Length of string in str after input: 27
Enter a line of text:
peanut butter
You entered: peanut butter
Enter another line of text:
blueberry jam
You entered: blueberry jam
Length of string in charr after input: 13
Length of string in str after input: 13
```

- `charr`输入前长度为27，这是因为初始化的数组的内容是未定义的；其次，函数`strlen()`从数组的第一个元素开始计算字符数，直到遇到空字符。
- `str`中的字符串长度为0，这是因为没有被初始化的string对象的长度被自动设置为0.

**读取一行**
- **cin.getline(charr, 20)**: 读取一行到数组，getline是istream类的一个类方法，第一个参数是目标数组，第二个参数是数组的长度，getline()用它来避免数组越界。
- **getline(cin, str)**: 读取一行到string对象，这个getline()不是类方法，它将cin作为参宿和，指出到哪里去查找输入。另外，也没有指出字符串长度的参数，因为string对象将根据字符串的长度自动调整自己的大小。

**为什么cin.getline()不能处理string对象**
在引入string类之前很久，C++就有istream类。因此istream的设计考虑到了诸如double和int等其他基本类型的类方法，但没有处理string对象的类方法。

由于istream类中没有处理string对象的类方法，下述代码为啥可行呢?
```c
cin >> str;
```
这是使用了string类的一个友元函数


### 4.3.5 其他形式的字符串字面值

**原始(raw)字符串**
在原始字符串中，字符表示的就是自己，例如，序列 \n 不表示换行符，而表示两个常规字符 -- 斜杠和 n。因此，原始字符串将"(和)"作为界定符，并使用前缀`R`来表示原始字符串：
```c
cout << R"(Jim "King" Tutt uses "\n" indead of endl.)" << '\n';
cout << "Jim \"King\" Tutt uses \" \\n\" indead of endl." << '\n';
```

---


## 4.4 结构简介

```c
struct inflatable      // structure declaration
{
    char name[20];
    float volume;
    double price;
};
```

定义结构后，便可以创建这种类型的变量了：
```c
inflatable hat;                // hat is a structure variable of type inflatable
inflatable woopie_cushion;     // type inflatable variable
inflatable mainframe;          // type inflatable variable
```
可以发现，C++允许在声明结构变量时候省略关键字struct：
```c
struct inflatable goose;       // keyword struct required in C
inflatable vincent;            // keyword struct not required in C++
```

**访问成员**
```c
hat.volume
```

### 4.4.1 在程序中使用结构

**程序清单4.11 structur.cpp**
```c
// structur.cpp -- a simple structure
#include <iostream>
struct inflatable    // structure declaration
{
    char name[20];
    float volume;
    double price;
};

int main()
{
    using namespace std;
    inflatable guest = 
    {
        "Glorious Gloria",   // name value
        1.88,                // volume value
        29.99                // price value
    };  // guest is a structure variable of type inflatable
    
    inflatable pal =
    {
        "Audacious Arthur",
        3.12,
        32.99
    };
    
    //NOTE: some implementations require using
    // static inflatable guest =
    return 0;
}
```

### 4.4.2 C++11 结构初始化

与数组一样，C++11 也支持将列表初始化用于结构，且等号(=)是可选的：

```c
inflatable duck {"Daphne", 0.12, 9.98};
```
其次，如果打括号内未包含任何多西，各个成员变量都将被设置为零。例如，下面的声明导致`mayor.volume`和`mayor.price`将被设置为零，且`mayor.name`的每个字节都被设置为零：
```c
inflatable mayor {};
```

### 4.4.4 其他结构属性

**同时定义结构和创建结构变量**
```c
struct perks
{
    int key_number;
    char car[12];
} mr_smith, ms_jones;    // two perks variables
```

**声明没有名称的结构类型**

声明没有名称的结构类型，方法是省略名称，同时定义一种结构类型和一个这种类型的变量，以下代码创建了一个position的结构变量，但是由于这种类型没有名称，因此以后无法创建这种类型的变量。
```c
struct
{
    int x;
    int y;
} position;
```

### 4.4.6 结构中的位字段

与C语言一样，C++也允许指定占用特定位数的结构成员，这使得创建与某个硬件设备上的寄存器对应的数据结构非常方便。字段的类型应该为整型或枚举，接下来是冒号，冒号后面是一个数字，它指定了使用的位数。可以使用没有名称的字段来提供来提供间距。每个成员都被称为位字段(bit field)
```c
struct torgle_register
{
    unsigned int SN : 4;       // 4 bits for SN value
    unsigned int : 4;          // 4 bits unused
    bool goodIn : 1;           // valid input (1 bit)
    bool goodTorgle: 1;        // successful torgling
};
```

---

## 4.5 共用体

共用体(union)是一种数据格式，它能够存储不同的数据类型，但只能同时存储其中的一种类型。也就是说，结构可以同时存储int, long 和 double，共用体只能存储int, long 或 double。
```c
union one4all
{
    int int_val;
    long long_val;
    double double_val;
};
```

可以使用`one4all`变量存储int, long 或 double, 条件是在不同时间进行：
```c
one4all pail;
pail.int_val = 15;           // store an int
pail.double_val = 1.38       // store a double, int value is lost
```

因此，pail有时可以是int变量，而有时又可以是double变量。成员名称表示了变量的容量。由于共用体每次只能存储一个值，因此它必须要有足够的空间来存储最大的成员。所以，共用体的长度为其最大成员的长度。

**用途**

- 当数据项使用两种或更多种格式(但不会同时使用)时，可节省空间。

```c
struct widget
{
    char brand[20];
    int type;
    union id
    {
        long id_num;
        char id_char[20];
    } id_val;
};

widget prize;

if (prize.type == 1)
    cin >> prize.id_val.id_num;
else:
    cin >> prize.id_val.id_str;
```

**匿名共用体(anonymous union)**
```c
struct widget
{
    char brand[20];
    int type;
    union id
    {
        long id_num;
        char id_char[20];
    };
};

widget prize;

if (prize.type == 1)
    cin >> prize.id_num;
else:
    cin >> prize.id_str;
```

---

## 4.6 枚举

- enum用于代替const
```c
enum spectrum {red, orange, yellow, green, blue, violet, indigo, ultraviolet};
```
- red, orange, yellow等作为符号常量，他们对应的整数值0-7，这些常量叫做枚举量(enumerator).

```c
spectrum band;          // band a variable of type spectrum
band = blue;            // valid, blue is an enumerator
band = 2000;            // invalid, 2000 not in an enumerator
```

**enum 强制类型转换(typecast)**
```c
band = spectrum(3);     // typecast 2 to type spectrum
band = spectrum(10000); // undefined
```

### 4.6.1 设置枚举量的值
- 显式设置枚举量的值：
```c
enum bits{one = 1, two = 2, four = 4, eight = 8};
enum bigstep{fist, second=1000, third};    // first = 0, third = 101
enum {zero, null=0, one, numero_uno=1};    // zero = null = 0,  one = numero_uno = 1
```

---

## 4.7 指针和自由存储空间

### 指针与C++基本原理
面向对象编程与传统的过程性编程的区别在于，OOP强调的是在运行阶段(而不是编译阶段)进行决策。使用OOP时，可以在运行阶段确定数组的长度。

### 4.7.2 指针的危险
C++ 创建指针时，计算机将分配用来存储地址的内存，但不会分配用来存储指针所指向的数据的内存。下述代码中，fellow是一个指针，但是不知道指向哪里。fellow没有初始化。
```c
long * fellow;         // create a pointer to long
*fellow = 23333;       // place a value i never-never land
```

### 4.7.3 指针和数字
整数赋值给指针的时候，需要进行强制类型转换。
```c
int * pt;
pt = 0xB800000;          // Error type not match
pt = (int *) 0xB800000;  //  types now match
```

### 4.7.4 使用new来分配内存
指针真正的用武之地在于，在运行阶段分配未命名的内存来存储值。在这种情况下，只能通过指针来访问内存。在C语言中，可以用库函数`malloc()`来分配内存；C++中有更好的方法---`new`运算符。

**Method 1**

用`new`分配一块int大小的内存，但是只能通过指针访问。
```c
int * pn = new int;
```

**Method 2**

指针也是指向int大小的内存，此时可以通过hinggens来访问。
```
int hinggens;
int * pt = % hinggens;
```

**PS**
new分配的内存通常与常规变量声明分配的内存块不同，变量nights和pd的值都存储在栈(stack)的内存区域中，而new从堆(heap)或自由存储区(free store)的内存分配内存。

### 4.7.5 使用delte释放内存
使用 delete，它能在内存使用完后，将内存归还给内存池。使用delete时，后面要加上指向内存块的指针(这些内存块最初使用new分配的):
```c
int * ps = new int;
...
delete ps;
```

#### 内存泄漏(memory leak)
以上操作将释放ps指向的内存，但不会删除指针ps本身。例如，可以将ps重新指向另一个新分配但内存块。一定要配对地使用new 和 delete，否则会发生内存泄漏(momeory leak)。


### 使用new来创建动态数组
#### 静态联编(static binding)
如果通过声明来创建数组，则在程序被编译时将为他分配内存。在编译时给数组分配内存被称为静态联编(static binding)。

#### 动态联编(dynamic binding)
但使用new时，如果在运行阶段需要数组，则创建它；如果不需要，则不创建。还可以在程序运行时选择数组的长度，这被称为动态联编(dynamic binding)。

#### 1. 使用new创建动态数组
```c
int * psome = new int [20];
// new 返回第一个元素的地址
delete [] psome;
```

#### new 和 delete 规则
* 不要使用delete来释放不是new分配的内存
* 不要使用delete释放同一个内存块两次。
* 如果使用 new [] 为数组分配内存，则应使用 delete [] 来释放。
* 如果使用 new [] 为一个实体分配内存，则应该使用delete(没有方括号)来释放。
* 对空指针应用delete是安全的。

#### 2. 使用动态数组
不能修改数组名的值，但指针是变量，因此可以修改它但值。请注意，将p3加1但效果。表达式p3[0]现在指的是数组但第2个值。将它减1后，指针将指向原来的值，这样程序便可以给`delete[]`提供正确的地址。
```c
p3 = p3 + 1; // okay for pointers, wrong for array names
```

---


## 4.8 指针、数组和指针算术

指针和数组基本等价的原因在于指针算术(pointer arithmetic)和C++内部处理数组的方式。指针变量加1后，增加的量等于它指向的类型的字节数。将指向double的指针加1后，如果系统对double使用8字节存储，则数值将增加8。将指向short的指针加1后，如果系统对short使用2个字节存储，则指针值将增加2.

#### 指针和字符串
字符串字面值是常量，这就是为什么以下声明中使用关键字`const`的原因。以这种方式使用`const`意味着可以用`bird`来访问字符串，但不能修改它。
```c
const char * bird = "wren"; // bird holds address of string
```

以下代码可能导致问题。在这种情况下，函数将字符串中剩余但部分复制到数组后面的内存字节中，这可能会覆盖程序正在使用的其他程序。要避免这种问题，请使用strncpy()。该函数还接受第3个参数--要复制的最大字符数。
```c
char food[20] = "carrots";
strcpy(food, "a picnic basket filled with many goodies"); // May cause error
strncpy(food, "a picnic basket filled with many goodies", 19);
food[19] = '\0';
```

### 4.8.4 使用new创建动态结构
用new创建的动态结构，不能用成员运算符句点(.)访问结构内部元素，因为这种结构没有名称，只是知道它的地址。C++专门为这种情况了一个运算符：箭头运算符(->)。例如，如果ps指向一个inflatable结构，则ps->price指向结构的price成员。
```c
inflatable * ps = new inflatable;
```