<span type="title">结构体和链表</span> | <span type="update">2018-07-11</span> | <span type="version">0.9</span>


<span type="intro"><p class="card-text">本章讲解结构体和链表，这些高级数据结构都是基于指针操作实现的应用，能够实现更加复杂的功能。</p></span>

# 结构体

结构体是一种复合数据结构，就其结构而言，其非常类似于数组，但和数组又有一定的区别。你可以认为结构体是一种抽象的数组模板。

## 结构体的定义、赋值和使用

```c
#include <iostream>
#include <stdio.h>
using namespace std;
int main(void)
{
    struct student
    {
        char name[30];
        int id;
        char addr[10];
    } cm,lj;

    student marvin = {"Corkine",2017110658,"CCNU"};
    marvin.id++;
    printf("%s, %d",marvin.name,marvin.id
           );
    return 0;
}
```

如上声明了一个结构体，采用 `struct student` 包裹一个大括号加上分号即可声明这一种抽象结构。对于这种结构，student并非是变量，而是一种数据类型，类似于float、bool以及typedef定义的你的数据类型。此数据类型的特殊之处在于其复合了多个数据类型，student包含了name、id、addr这三个变量，采用类似于声明的方式声明其结构体内部变量的类型，可以有默认值。在分号之前，可以顺手创建几个变量，采用逗号隔开，这些变量的类型是 student。这就是结构体的定义。

结构体在内存中非常类似于数组的表示方法， `student marvin = {,,}` 这句话可以看出，在内存中这三个变量是相连的。逗号分隔的是结构体中对应顺序的变量的值。这就是结构体赋值的方法。

结构体的变量可以用.运算符取出，取出后的东西就相当于其内部定义变量的类型，可以进行任何属于此变量类型的操作，比如 marvin.id++ 就对这个 int 类型的数据加了1。

**此外，需要注意，虽然结构体变量类似于数组，但是结构体变量可以直接赋值，相当于COPY一份数据给另一个结构体变量。**比如：`cm = marvin;`


## 结构体和函数

结构体可以作为函数的参数和返回值。

但结构体作为参数时，并非像数组传递的是一个地址，而是单独COPY了一份数据给函数，传递的是值。

比如：

```c
#include <iostream>
#include <stdio.h>
using namespace std;
struct student
    {
        char name[30];
        int id;
        char addr[10];
    } cm,lj;
void renew(student one)
{
    one.id = 12345;
    cout << one.name << ", " << one.id << endl;
}
student reone(void)
{
    student one = {"NOBODY",20000000,"NOWHERE"};
    return one;
}
int main(void)
{

    student marvin = {"Corkine",2017110658,"CCNU"};
    marvin.id++;
    printf("%s, %d\n",marvin.name,marvin.id);

    renew(marvin);
    printf("After renew: %s, %d\n",marvin.name,marvin.id);

    marvin = reone();
    printf("After reone: %s, %d\n",marvin.name,marvin.id);

    return 0;
}
```
```
Corkine, 2017110659
Corkine, 12345
After renew: Corkine, 2017110659
After reone: NOBODY, 20000000
```

相反，结构体作为返回值的时候，则是COPY了一份数据给原始的变量，这样就得到了更改。

## 结构体和指针

**结构体各结构的地址**

虽然结构体非常类似于数组，但是结构体变量可以直接赋值，这和数组不同，那么打印结构体会怎样呢？cout << marvin 出错。使用C的“%p”运算符的话可以运行，但是和 &marvin 得到的地址不同：

```c
printf("%p,%p,%p,%p\n",marvin,&marvin,&(marvin.name),&(marvin.id));
//6B726F43,00656E69,00000000,00000000 marvin和&marvin打印结果不同
```

**结构体指针取内部元素操作**

结构体可以定义指针，并且可以使用指针操作，和数组一样，但是，我们现在定义了一个叫做“指向运算符”的符号，可以不用写星号和点号，直接用 `ptr->name` 来获取结构体内部的 name 属性。

```c
student marvin = {"Corkine",2017110658,"CCNU"};
student *ptr = &marvin; //注意这里marvin取其地址，也就是不把结构体名看作一个指针。
marvin.id++;
printf("%s, %d\n",marvin.name,marvin.id);
//printf("With Ptr: %s, %d\n",*ptr.name,*ptr.id); 在纯C环境下可能不起作用？
printf("With Magic: %s, %d\n",ptr->name,ptr->id); //和前者相同
```

**结构体指针作为函数参数**

在之前的例子中，我们传入函数的时候结构体自动进行了赋值，就像除了数组的其余数据结构一样。但是，我们其实可以像数组一样传递过去一个地址，就像这样：

```c
void renew_2(student *one)
{
    one->id = 20000001;
}

renew_2(&marvin);
printf("After pointer renew: %s, %d\n",marvin.name,marvin.id);
//After pointer renew: NOBODY, 20000001
```

## 结构体数组

结构体可以组成结构体数组，如下：

```c
student cms[3] = {{"Corkine",2001,"CCNU"},{"Liuji",2002,"CCNU"},{"Marvin",2003,"CCNU"}};
student *ptr2 = cms; //指向结构体数组的指针
cout << ptr2->name << ", " << ptr2->id << endl; //显然像数组一样，会打印第一个元素，也就是Corkine和2001.
ptr2++;
cout << ptr2->name << ", " << ptr2->id << endl; //跨越了一个元素，打印Liuji和2002.

```

## 区分结构体和数组

之前在前面说，结构体可以看做一个包含多种数据类型的数组，其在内存上的储存也是类似。但是，其实它们除了这点几乎没有相同。结构体使用前需要像函数一样定义抽象结构，在调用前需要定义结构体变量，采用的定义方式和数组定义类似。但是，结构体可以完全和部分赋值，而数组不可以，结构体作为函数参数是传递数据（也可以传递数据），而数组是传递地址。结构体的指针操作使用特殊操作符，而不是星号和点号。结构体可以和数组混杂构成结构体数组，结构体数组包含了数组的特色：数组名就是指针，指针运算跳转一个结构体，其也包含了结构体的特色：内部变量和指向运算符。

我个人认为造成所有的这些不同的原因是：结构体名作为数值，而数组名作为地址 而造成的。

# 链表

## 定义

链表是为了解决以下问题而设计的：

对于结构体，其不能够在两个结构体变量间插入一个新变量，起码不能在内存中这样做，否则插入点之后的数据都要向后移动，对于这种情况，可以使用链表解决。

链表包含了很多结构体，不过这些结构体变量并非按照数组那样在内存中顺序排列，每个结构体提供下一个结构体的地址信息，首尾相连，构成了链表。

链表包含链表头（HEAD），其就是一个结构体，指向第一个由内容的结构体，接着是多个链表节点，其中每个链表节点由保存数据的内部变量以及一个存储指向下一个节点地址的变量组成。NULL表示结尾。

## 动态申请内存空间

区别于结构体、数组等，链表是动态生成的，因此需要向解释器动态申请内存来使用。使用以下语句：

```c
int *ptr1 = new int(1024);
int *ptr2 = new int[4];

delete ptr1;
delete []ptr2;
```

申请内存空间需要声明需要的长度（类型），放在运算符 new 之后。接着是可选的括号，放置默认值，对于数组而言，要声明数组长度，方便分配内存。调用返回一个地址，对于数组而言，其地址的基类是地址元素的类。类需要写在指针前，就像普通的指针定义。这句话好像把指针定义和赋值写在一起了。

删除使用 delete 运算符即可。对于数组需要使用 []ptr 这种形式。删除后，其内存空间被自动回收。

## 实现链表

下面的代码实现了链表的结构：

```c
#include <stdio.h>
#include <iostream>
using namespace std;
struct student
{
    int id;
    student *next;
};
student *create(void)
{
    student *head, *temp;
    int num,n = 0;
    head = new student;//分配地址到head指针
    temp = head;//初始化时从head获取指针地址
    cin >> num;
    while (num != -1){
        n++;//链表包含struct的个数
        temp->id = num;
        temp->next = new student;//获取下一个struct内存，并且链接到next变量上
        temp = temp->next;//temp变量后移，方便继续创建
        cin >> num;
    }
    if (n==0) head = NULL; else temp->next = NULL;//设置最终结束标记
    return head;
}
```