<span type="title">数据类型、字符串和格式化基础</span> | <span type="update">2018-06-21</span> | <span type="version">0.8</span>


<span type="intro"><p class="card-text">在第一部分主要讲解了C的数据类型，其中包括int、float、char、bool等。</p><p class="card-text">在第二部分，则主要介绍了字符串和在C中进行格式化的两个重要函数：scanf、printf。这部分内容和数据类型有密切关系，因此放在此处进行讲解。在掌握这部分内容之后就可以利用C的基本运算符和数据进行基本的运算和输出了。在下一章节中将会主要介绍众多运算符及其顺序、表达式、三种基本语句以及字符串I/O的机制问题。这两个章节构成了一门语言的基本结构。</p></span>

# 3. C的数据类型

```c
#include <stdio.h>
int main(void) {
    printf("Date:2018-05-19 Author：Corkine Ma");
    return 0;
}
```

C的两大特征是快速和简洁，因此自带了很多数据类型，丰富的数据类型为不同硬件下C的运行提供了很好的发挥空间，常见的数据类型有`int, sort, long , unsigned, char, float, double, -Bool`. 使用 `sizeof()`可以获取当前的数据类型所占的byte数，比如在Qt-Win下，unsigned 8 byte，long long int 和 float 8 byte，int 4 byte。

**获取输入**：使用 `scanf("%d",&varname)` 获取用户输入，相当于input()在Python中的作用，不过可以自动转换为相应类型，并且varname还需要提前定义。

**数据类型**：整数在计算机中的存储基本都是按照bit的位数来定义的，2 bit可以定义4个数字，8bit可以定义2**8个数字。符号单独在前面占一位进行定义，正数和负数的定义方式不同。小数的话，采用的是浮点数定义，也就是 aEb，其中a为E次方的乘数，b为E次方的指数。这三个元素分别存储在对应的比特中，符号另存。浮点数有精度的问题，其往往是真实数值的近似，计算速度慢。

## 3.1 C数据类型简介

### 3.1.1 int 类型

int类型一般使用16bit定义，范围在-32768~32768之间。可以通过以下方法声明：

```c
int var_1;
int var_2, var_3;
int var_1 = 20;

int var_1 = 20, var_2 = 30; //错误
int var_1, var_2 = 30; //不推荐
printf("var_1 is %d, var_2 is %d",var_1,var_2);//如果少写，那么系统会随机从内存中取值，而不会报错。
//如果类型不匹配, IDE会提醒，尽量不要不匹配，如果为了显示float，使用%.f来像整数一样显示即可。
```

初始化变量后，系统会自动将内存中某片区域给此变量，并且赋值。

**不同进制**

10进制int使用“%d”打印。

8进制数字的写法为 octal，%o, %#o

16进制的写法为 hex, %x, %#x

其中带有#的表示显示前缀。

**不同整型**

其余整型有（方括号可不写）：

- sort [int] 和int占有相同的bit，不过表示数字更小。打印使用%hd/ho/hx/hu

- long [int] 表示数字更多，一般为32位。会减慢计算。打印使用%ld/lx/lo/lu

- long long [int] 表示数字更多，一般为64位。64位推荐使用。打印使用%lld/llo/llx/llu

- unsigned [int] 非负整数，相比较int可表示更大数值。一般用于计数。打印使用%u，如果是u long long int,使用%llu

**整数溢出**

不要错误的使用打印符号，请手动进行类型转换。

注意，对于无符号变量使用%d会导致负值，这是因为非负数和整数表示方式不同。同样，short int 使用 %d ，不会出现什么问题，但是 long int使用 %d 会导致截断。

超出600000多的int类型会溢出，溢出后会归零。负数会随机赋值。浮点数溢出精度后只会截断，不影响数据。



### 3.1.2 char 类型

char是ASCII码字符类型，使用单引号表示，而双引号则表示字符串。char的长度为1（char），即1个byte占有几个bit意味着1个char占有几个bit。

```c
char grade = 'A';//正确
char grade = 65;//ASCII码，不推荐

char beep = '\007';
char beep = '\a';
char beep = 7;//10进制
//转义序列，不论是字幕还是各种进制的转义，都必须加引号

char ret = 13;//10进制
char ret = 015;//8进制
char ret = 0xd;//16进制
//这三种不同进制表示均可以，且不用加引号

char var_a = "B"; char var_b = C;//统统错误
```

常见的有：

- \0oo 8进制

- \xhh 16进制

- \" 双引号

- \' 单引号

- \\ 反斜杠

使用 `%e` 来打印char类型。

使用 <inttypes.h> 来包含可移植的类型，比如uint32_t表示unsigned 32bit int，int16_t表示 16bit的有符号类型整数。

### 3.1.3 float double 类型

float为单精度数，标准规定其至少表示6位数，比如33.333 333，包含点和整数部分的6位数。通常系统使用32bit表示1个float，其中8位表示指数和符号，24位表示非指数和符号。

double为双精度数。其至少表示10位数字。一般为64bit。此处的e好像不是数学中的$e$，而是10.

```c
double a = 27e-5;
printf("a in double is %f, in e is %e",a,a);
//a in double is 0.000270, in e is 2.700000e-004

double a = 27e1000;
printf("a in double is %.10, in e is %e",a,a);
//a in double is , in e is 1.#INF00e+000
```

double和float类型都使用%f进行打印，使用%e表示E形式。

进行比如 2.0 × 3.0 的计算，会默认使用double，但这有可能减慢速度，因此使用 2.0f × 3.0f 强制使用float类型计算。还有 2.0L和3.0L代表long double。

小数溢出最大为INF，表示无穷大，最小为NaN，代表不是Number的Number类型的数。

## 3.2 使用数据类型

C需要声明数据，其会自动在声明的时候进行转换，比如

```c
int apple = 3;
int orange = 3.0; // 不好
int banana = 3.1; // 不好
float pi = 3.141592654 //不好
```

除此之外，在打印的时候也容易出错，这里更应该小心，因为C不会自动转换数据。

**转义序列的使用**

```c
float money;
printf("小明科技公司涨薪计算\n请输入你的薪水：￥_____\b\b\b\b");
scanf("%f",&money);
printf("\n\t%.2f 涨薪水后的工资为：%.2f",money,money*1.3);
printf("\rGee!\n");
```

如上所示，\r表示回到行首，\n表示换行。\b表示光标回退，但不删除回退过程中的东西。

**刷新输出**

有三种情况下会遇到刷新输出的问题，其一是缓冲区满的时候，其二为遇到换行符的时候，其三为需要输入的时候。

# 4. 字符串和格式化I/O基础

## 4.1 常量

```c
#include <stdio.h>
#define PI 3.1415926 //define不需要等号

int main()
{
    const double R = 2.66666;
    printf("pi is define by define , it is %f, "
           "R is define by const, it is %f",PI,R);
    //常量使用define定义并直接使用,也可以使用const定义。
    return 0;
}

```

常量一般大写表示，在C预处理器中使用原型定义或者使用const定义。有一些头文件定义了很多常量，比如 limits.h 和 float.h。

## 4.2 字符串

char数组使用 `char string_name[length]`定义，其表示由 length 长度组成的排列好的 char 扩展类型。其中字符串的每个单元是一个字符，其长度为定义的 length，是确定的。在最后一个位置为ASCII字符 “\0” （被程序自动添加）。

字符串使用双引号表示，其中双引号只是指示类型，并没有实际作用。

**使用方法**

实际使用如下，可在常量定义（不需要输入等号，或者说赋值，一般大写表示），或者作为变量要求输入。

```c
#include <stdio.h>
#include <string.h>
#define SAYHI "Hello from Qt Creator!"
int main()
{
    char name[40];
    const HIAGAIN = "Hello Again！";
    scanf("%s",name);
    printf("Gee! %s, %s, %s\n",name,SAYHI,HIAGAIN);
    return 0;
}
```

**作用过程**

需要注意的是，输入“Corkine Ma”，scanf只会读取“Corkine”，因为其从第一个不为空白的字符开始读取，到遇到的第一个空白（空格、制表符、换行）终止。

**常见问题**

此外，需要注意“x”和‘x’的区别，前者包含两个字符，而后者只包含一个字符。

strlen()可以获取字符串长度，它会在遇到“\0”的字符处停止（字符串固定长度，但是\0后的内存并没有使用）。

## 4.3 PRINTF函数

### 4.3.1 修饰符和格式化

printf()函数接受第一个参数为字符串，代表格式化模板（控制描述），其余参数为传入此模板的一些变量、常量或者表达式，最后输出的是字符串。

格式化常见的有：`%a %c %d %g %e %f %o %x %% %u %s %p`

格式化的同时可以添加修饰符，比如 a.bf 可以定义长度为a，精度为b的 float/double 类型格式。使用h、l、ll、L可以定义长短整数等。

此外，格式化还有一些标志，比如：- 表示项目左对齐，+ 表示正数和负数添加符号， space 空格表示负数有符号，正数没符号，但是有空格。 # 表示8进制和16进制的前导，0表示使用0作为前导（对于数字）。

```c
#include <stdio.h>
int main()
{
    int a = -1000;
    double b = 3e-2;
    unsigned int c = 240;
    printf("a is %d, %0d, %+d\n"
           "b is %e, %f, %10.3f\n"
           "c is %-10d, %u, % 10d, %010d\n",a,a,a,b,b,b,c,c,c,c);
    return 0;
}

a is -1000, -1000, -1000
b is 3.000000e-002, 0.030000,      0.030
c is 240       , 240,        240, 0000000240
```



### 4.3.2 通过float.h查看系统提供的格式精度

```c
#include <stdio.h>
#include <string.h>
#include <float.h>
int main()
{
    double a = 1.0/3.0;
    float b = 1.0/3.0;
    printf("a1 is %.4f, a2 is %.12f, a3 is %.16f \n",a,a,a);
    printf("b1 is %.4f, b2 is %.12f, b3 is %.16f \n",b,b,b);
    printf("the float.h say FLT_DIG is %u, DBL_DIG is %u \n",FLT_DIG,DBL_DIG);

    return 0;
}
>> a1 is 0.3333, a2 is 0.333333333333, a3 is 0.3333333333333333
>> b1 is 0.3333, b2 is 0.333333343267, b3 is 0.3333333432674408
>> the float.h say FLT_DIG is 6, DBL_DIG is 15
```

### 4.3.3 不匹配的转换和PRINTF作用过程

使用printf()的时候，当转换不匹配时，问题很严重。比如，由float转换成为sort int。但是，有时候，即便格式正确，也不能进行转换。这是因为，对于一句printf()来说，其将所有需要转换的值放到一个称作是stack的内存中，其工作机制是，按照格式要求的位数按照顺序读取变量，比如%f要求一个32位的double，而第一个变量提供的是16位的int，那么程序会继续用下一个变量的前16位数来补全这个%f的格式。然后继续读取剩下的，可以看到，即便后来的完全对应，读取已经完全错了。

可以使用多个printf来避免这种问题，或者仔细检查格式。

printf有返回值，很少被用到。

## 4.4 SCANF函数

### 4.4.1 修饰符和格式化

scanf函数做的事情是，将输入的字符串转换成为各种模板规定的类型。即便输入的是0-10这种数字，其本质上也是按照char来读取的，scanf就是进行的这种转换。

对于读作字符串而言，第二个参数不需要使用指针，只用变量名即可。而对于其余类型，比如整数、浮点和字符，必须使用&表示的指针来将内容按照模板进行转换并读取到相应类型的变量中去。

scanf支持的修饰符大体和printf类似，`%c %d %e/f/g/a %o %s %u %x`, 但是 `%f %e %g` 这种可以用于double和float的，一般只作为float类型输入，区别于正常状态下作为double的printf，如果要指定double，则需要用到%l修饰符，即 %lf、%le、%lg。

### 4.4.2 SCANF函数作用过程

对于%d而言，程序会跳过空白字符（\t,\n,space），直到遇到一个非空白字符，试图读取一个整数，并将其按照字符一个一个读取，一直遇到到其遇到一个非数字字符。如果遇到非数字字符，那么就自动结束，将这个非数字字符放回输入。下一个接着此处继续读取。如果说，其在第一个非空白字符的地方没有遇到数字，那么没有任何变量赋值，下一次从这里重新开始。

如果使用 %s，那么除了空白字符以外所有字符都可接受，其会在第一个非空白字符开始，在第一个遇到的空白符或者字段结尾终止。%s传递给变量不需要指针。

对于 %c，所有字符都是平等的（包括空白字符），其只要一个字符。

对于 “%s,%s” 的格式，比如这样输入：“abc ,def” 必须在逗号前加空格，让第一个格式结束，并且过滤掉都好后从第一个非空白字符开始。

```c
#include <stdio.h>
int main()
{
    char n1[30];
    char n2[30];
    scanf("%s, %s",n1,n2);
    scanf("%s %s",n1,n2);
    printf("n1 is %s, n2 is %s\n",n1,n2);
    scanf("%d and %d",&d1,&d2);
    printf("d1 is %d, d2 is %d",d1,d2);
    return 0;
}


>> corkine ,ma
>> n1 is corkine, n2 is //可以看出除了问题，第一个捕获正确
>> corkine ma
>> n1 is corkine, n2 is ma //这样正确，推荐字符串使用空格捕获
>> 20 and40 //这样写可以
>> 20
>> , 40 //这样写也行
>> d1 is 20, d2 is 40 //对于整数来说，推荐使用逗号捕获

```

## 4.5 PRINTF & SCANF 的 *修饰符

```c
#include <stdio.h>
int main()
{
    double number = 3.8e-7 ;
    unsigned int width,precision;
    printf("What field width? and what precision\n");
    scanf("%u,%u",&width,&precision);
    printf("The number is: %*.*f\n",width,precision,number);

    return 0;
}


>> What field width? and what precision
>> 10,30
>> The number is: 0.000000380000000000000010000000
    
```

使用*可以将格式化的工作留给程序自己完成。上面是一个例子。

下面又是一例：

```c
#include <stdio.h>
#include <string.h>
int main()
{
    char name[10];
    char xing[10];
    printf("input your name\n");
    scanf("%s %s",name,xing);
    printf("%s %s\n% *d % *d",name,xing,strlen(name),strlen(name),strlen(xing),strlen(xing));

    return 0;
}
>> input your name
>> marvin lii
>> marvin lii
>>      6   3

```

_____________________

更新日志：

2018年5月20日 SP1.0-180520