# 制作小工具


在linux的世界里,很多工作都是由小工具完成的,它恐怕是现如今流行的`微服务`架构最早的实践了.

所谓小工具有这样的特点:

1. 从标准输入读取数据
2. 在标准输出显示数据
3. 处理文本数据，而不是难以阅读的二进制格式
4. 只做一件简单的事

通过标准输入输出可以方便的做重定向,而文本数据除了机器好读,人也好读.


所谓重新定向是指使用`>`,`>>`作为输出,使用`<`,`<<`作为输入


比较让人熟知的就是`grep`小工具了,它的作用是过滤掉文本中不含关键字的行.而一般我们都是拿他和其他工具配合使用的,比如我希望查看之前使用过的带`python`的历史记录,那就可以这样写:

```shell
history | grep python
```

当然了其他语言比如python也可以制作小工具,而且由于语法更加简单,抽象层次更高,实际上写起来会更加简单,但在这边用c/c++来做小工具有其合理的一面

1. 不用依赖环境

    c/c++不依赖于运行环境,只要编译通过了就可以运行二进制代码.而带有vm的语言比如java,python,脱离了vm就无法运行了
    
2. 高效

    多数情况下,,相同的逻辑,C/C++制作的工具有最高的运行效率
    
3. 小巧

    像go语言,也是编译成二进制后执行的语言,但由于其抽象层次更高,生成的代码比使用c/c++写的大得多,而c++如果使用模板的话也会比C写的大得多

## 从一个例子开始

我们来写一个gps数据格式转换工具,使用它我们可以将gps数据转化为符合规定的json格式,gps数据是形如:

```
42.363400,-71.098465,Speed = 21
42.363400,-71.097588,Speed = 23
42.363400,-71.098465,Speed = 27
.
.
.
```
的csv数据

而地图应用需要的格式则形如:

```json
data = [
{latitude: 42.363400, longitude: -71.098465, info: 'Speed = 21'},
.
.
.
]
```
的json数据



好,开始我们的小程序:

In [8]:
%%writefile src/C11/geo2json.cpp
#include <stdio.h>

int main(){
    float latitude;
    float longitude;
    char info[80];
    int started = 0;
    puts("data=[");
    while (scanf("%f,%f,%79[^\n]",&latitude,&longitude,&info) == 3){
        if (started){
            printf(",\n");
        } else {
            started = 1;
        }
        printf("{latitude: %f, longitude: %f, info: '%s'}",latitude,longitude,info);
    }
    puts("\n]");
    return 0;
}

Overwriting src/C11/geo2json.cpp


In [11]:
!g++ -o bin/geo2json src/C11/geo2json.cpp

In [16]:
!./bin/geo2json < source/gpsdata.csv 

'.' 不是内部或外部命令，也不是可运行的程序
或批处理文件。


### 数据验证

不难发现,输入数据中有错误数据,我们的程序要加入一些验证逻辑来进行错误检验,当然了,错误信息应该输出在stderr里

In [20]:
%%writefile src/C11/geo2json.cpp
#include <stdio.h>

int main(){
    float latitude;
    float longitude;
    char info[80];
    int started = 0;
    puts("data=[");
    while (scanf("%f,%f,%79[^\n]",&latitude,&longitude,&info) == 3){
        if (started){
            printf(",\n");
        } else {
            started = 1;
        }
        
        if ((latitude < -90.0) || (latitude > 90.0)) {
             fprintf(stderr,"Invalid latitude: %f\n", latitude);
             return 2;
        }
        if ((longitude < -180.0) || (longitude > 180.0)) {
             fprintf(stderr, "Invalid longitude: %f\n", longitude);
             return 2;
        }
        
        printf("{latitude: %f, longitude: %f, info: '%s'}",latitude,longitude,info);
    }
    puts("\n]");
    return 0;
}

Overwriting src/C11/geo2json.cpp


In [21]:
!g++ -o bin/geo2json src/C11/geo2json.cpp

In [22]:
!./bin/geo2json < source/gpsdata.csv 

'.' 不是内部或外部命令，也不是可运行的程序
或批处理文件。


## 创建自己的数据流

通过重新定向标准输出当然是一种省时省力的方法,但当需要同时按需输出到不同的文件中时,这种方法就很不便利了,像python中可以使用`open`函数打开一个文件一样,C中也可以使用`fopen`来做到同样的效果,而且其用法与python中不用with上下文管理器的`open`用法几乎一样,不同之处只在它的输入输出使用`fscanf`和`fprintf`.

`fopen`在`stdlib.h`中


在函数这部分我们已经介绍过如何利用`main`函数的参数来构造命令行工具,

In [None]:
%%writefile src/C11/geo2json.cpp
#include <stdio.h>
#include <unistd.h>

int main(int argc, char* args[])
{
char* delivery = "";
int thick = 0;
int count = 0;
char ch;
while ((ch = getopt(argc, args, "d:t")) != EOF)
 switch (ch) {
 case 'd':
   delivery = optarg;
   break;
 case 't':
   thick = 1;
   break;
 default:
   fprintf(stderr, "Unknown option: '%s'\n", optarg);
   return 1;
 }

argc -= optind;
args += optind;

if (thick)
 puts("Thick crust.");

if (delivery[0])
 printf("To be delivered %s.\n", delivery);

puts("Ingredients:");

for (count = 0; count < argc; count++)
 puts(args[count]);
return 0;
}