# AWK 简明教程

AWK 是一个专为文本处理设计的行扫描语言，最常用于日志分析、字段提取、过滤、聚合统计等场景。其核心模式是：
pattern { action }

---

# 1. 基本概念

AWK 对输入执行以下自动操作：
- 按行读取文本
- 自动将每行分割成字段
- 使用 $1, $2, ..., $NF 表示字段
- $0 表示整行
- NR 表示当前行号
- NF 表示当前行字段数

默认分隔符为空白，使用 -F 指定其他分隔符。

示例：
awk '{print $1, $3}' file.txt

---

# 2. 基本操作

## 2.1 打印字段
awk '{print $1, $2}' file

## 2.2 使用条件过滤
awk '$3 > 100 {print $1, $3}' file

## 2.3 正则过滤
awk '/ERROR/ {print $0}' logfile

## 2.4 忽略空行与注释
awk 'NF > 0 && !/^#/' config.txt

---

# 3. BEGIN 与 END 块

BEGIN 在处理文件前执行  
END 在处理文件后执行

## 示例：求和
awk '{sum += $3} END {print sum}' file

## 示例：求平均
awk '{s += $2; n++} END {print s / n}' file

## 设置输出字段分隔符
awk 'BEGIN {OFS=","} {print $1, $2, $3}' file

---

# 4. 使用 -F 处理 CSV

按逗号分隔：
awk -F, '{print $2}' data.csv

同时设定输出分隔符：
awk -F, 'BEGIN{OFS=","} {print $1, $3}' data.csv

---

# 5. 关联数组（哈希表）

AWK 支持关联数组，适用于计数与聚合。

## 计数示例（类似 Python Counter）
awk '{count[$1]++} END {for (k in count) print k, count[k]}' file

## 按字段聚合求和
awk '{sum[$2] += $3} END {for (k in sum) print k, sum[k]}' file

---

# 6. 常见实战案例

## 6.1 打印最后一列
awk '{print $NF}' file

## 6.2 排序（借助 sort）
awk '{print $2, $5}' file | sort -k2,2nr

## 6.3 查找特定字段匹配的行
awk '$2 == "running"' instances.txt

## 6.4 多条件过滤
awk '$2 == "ERROR" && $3 > 500' log

## 6.5 求字段最大值
awk 'NR==1 || $3 > max {max = $3} END {print max}' file

---

# 7. 常用模式总结（背下来即可）

1. 打印字段  
   awk '{print $1, $2}'

2. 条件过滤  
   awk '$3 > 0'

3. 正则匹配  
   awk '/pattern/'

4. 求和  
   awk '{sum += $3} END {print sum}'

5. 求平均  
   awk '{s += $2; n++} END {print s/n}'

6. CSV 分隔符  
   awk -F, '{print $1}'

7. 关联数组计数  
   awk '{a[$1]++} END {for(i in a) print i, a[i]}'

8. 打印最后一列  
   awk '{print $NF}'

9. 排除注释与空行  
   awk 'NF > 0 && !/^#/'

10. 按字段聚合求和  
    awk '{sum[$2] += $3} END {for(k in sum) print k, sum[k]}'

---

# 8. 总结

- AWK 擅长单行文本处理与字段操作  
- 自动分割行和字段  
- 支持强大的关联数组  
- BEGIN 与 END 适用于初始化与汇总  
- 常与 sort、grep、sed 组合使用  

掌握以上内容即可覆盖 80% 的日常 AWK 使用场景。