ExcelBoot - yaml驱动Excel生成

概述

许多伙伴日常中有很多excel制作的重复性的工作，譬如

将数据库中的表与字段导出为excel，作为数据结构交付文档；
统计单张表的数据，并导出为excel
统计几张表的数据，拼接起来，并导出为excel
统计单个库的数据，并导出为excel
统计几个库的数据，拼接起来，并导出为excel
从几个excel中读取数据，加工，并导出为excel
从json url中读取数据，加工，并导出为excel
从库、excel、json url等多个数据源中读取数据，加工，并导出为excel
各种样式调整，如列宽、行高、字体、颜色等等
根据数据库数据来生成绘图, 如折线图/条形图/饼图等

这些excel制作的工作繁杂，而且重复性高，可以考虑通过写代码(python)方式来生成excel；

但是大部分伙伴开发能力不足，因此创作了ExcelBoot工具，支持通过yaml配置excel生成步骤（虽然不用写代码，但还是需要写yaml，还是有一定的学习门槛）；

框架通过编写简单的yaml, 就可以执行一系列复杂的excel操作步骤, 如sql查询/sql导出/列变换/定位行、列、单元格/设置样式/修改行高列宽/增删行列/合并单元格/插入图片/插入文件/插入plot绘图/打印变量等，极大的简化了伙伴生成excel的工作量与工作难度，大幅提高人效；

框架通过提供类似pythonfor/if/break语义的步骤动作，赋予伙伴极大的开发能力与灵活性，能适用于广泛的应用场景。

框架提供include机制，用来加载并执行其他的步骤yaml，一方面是功能解耦，方便分工，一方面是功能复用，提高效率与质量，从而推进脚本整体的工程化。

特性

底层excel操作基于 pandas 与 openpyxl 库来实现
支持通过yaml来配置执行的步骤，简化了生成代码的开发: 每个步骤可以有多个动作，但单个步骤中动作名不能相同（yaml语法要求）; 动作代表excel上的一种操作，如switch_sheet/export_df等等;
支持类似pythonfor/if/break语义的步骤动作，灵活适应各种场景
支持include引用其他的yaml配置文件，以便解耦与复用

同类yaml驱动框架

HttpBoot SeleniumBoot AppiumBoot MiniumBoot MonitorBoot

todo

支持更多的动作

安装

pip3 install ExcelBoot

安装后会生成命令ExcelBoot;

注：对于深度deepin-linux系统，生成的命令放在目录~/.local/bin，建议将该目录添加到环境变量PATH中，如

export PATH="$PATH:/home/shi/.local/bin"

使用

# 1 执行单个文件
ExcelBoot 步骤配置文件.yml

# 2 执行多个文件
ExcelBoot 步骤配置文件1.yml 步骤配置文件2.yml ...

# 3 执行单个目录, 即执行该目录下所有的yml文件
ExcelBoot 步骤配置目录

# 4 执行单个目录下的指定模式的文件
ExcelBoot 步骤配置目录/step-*.yml

如执行 ExcelBoot example/step-dbschema.yml，输出如下

shi@shi-PC:[/home/shi/code/python/ExcelBoot]: ExcelBoot example/step-dbschema.yml 
2022-12-06 19:08:17,916 - boot - DEBUG - Load and run step file: /ohome/shi/code/python/ExcelBoot/example/step-dbschema.yml
2022-12-06 19:08:17,921 - boot - DEBUG - handle action: connect_db={'ip': '192.168.62.200', 'port': 3306, 'dbname': 'test', 'user': 'root', 'password': 'root', 'echo_sql': True}
2022-12-06 19:08:17,937 - boot - DEBUG - handle action: start_edit=data/test数据结构.xlsx
2022-12-06 19:08:17,938 - boot - DEBUG - handle action: switch_sheet=目录
2022-12-06 19:08:17,938 - boot - DEBUG - handle action: query_db={'tables': "SELECT\n    TABLE_COMMENT as 表注释,\n    TABLE_NAME as 表名\nFROM\n    information_schema. TABLES\nWHERE\n    TABLE_SCHEMA = 'test'\n"}
2022-12-06 19:08:17,938 - boot - DEBUG - SELECT
    TABLE_COMMENT as 表注释,
    TABLE_NAME as 表名
FROM
    information_schema. TABLES
WHERE
    TABLE_SCHEMA = 'test'
......

命令会自动操作并生成excel

步骤配置文件及demo

用于指定多个步骤, 示例见源码 example 目录下的文件;

顶级的元素是步骤;

每个步骤里有多个动作(如switch_sheet/export_df)，如果动作有重名，就另外新开一个步骤写动作，这是由yaml语法限制导致的，但不影响步骤执行。

简单贴出2个demo

导出数据库中的表与字段: 详见 example/step-dbschema.yml
根据sql来生成各种plot绘图, 支持1 line 折线图 2 bar 条形图 3 barh 横向条形图 4 hist 直方图 5 box 箱线图 6 kde 核密度图 7 pie 饼图; 详见 example/step-plot.yml

配置详解

支持通过yaml来配置执行的步骤;

每个步骤可以有多个动作，但单个步骤中动作名不能相同（yaml语法要求）;

动作代表excel上的一种操作，如switch_sheet/export_df等等;

下面详细介绍每个动作:

print: 打印, 支持输出变量/函数;

# 调试打印
print: "总申请数=${dyn_data.total_apply}, 剩余份数=${dyn_data.quantity_remain}"

connect_db: 连接mysql数据库

- connect_db:
    ip: 192.168.62.200
    port: 3306
    dbname: test
    user: root
    password: root
    echo_sql: true

start_edit: 开始编辑excel

- start_edit: data/test数据结构.xlsx

end_edit: 结束编辑excel（保存）

- end_edit:

switch_sheet: 切换sheet

- switch_sheet: 目录

query_db: 查询sql, 并将查询结果放到变量中

- query_db:
    # 查询结果放到变量tables
    tables: > # 查询sql
        SELECT
            TABLE_COMMENT as 表注释,
            TABLE_NAME as 表名
        FROM
            information_schema.TABLES
        WHERE
            TABLE_SCHEMA = 'test'

map_df_cols: DataFrame列转换，其中动作名中()包含的是list或DataFrame类型的变量名

- map_df_cols(tables):
      # 新列名:每一行执行的函数表达式
      # 每一行的函数执行结果组成新列，表达式可以带变量，如 $列名，表示该行中指定列的值
      序号: add_id() # 加行号
      表链接: link_sheet($表名) # sheet链接
      搜索: link(链接, http://baidu.com?wd=$表名) # url链接

map_cols: 转换sheet列，相当于map_df_cols，差异在于map_df_cols转换的是变量，map_cols转换的是sheet

- map_cols:
      header: true # 是否有表头，表示第一行作为列名
      # 新列名:每一行执行的函数表达式
      # 每一行的函数执行结果组成新列，表达式可以带变量，如 $列名，表示该行中指定列的值
      序号: add_id() # 加行号
      表链接: link_sheet($表名) # sheet链接

export_df: 将变量值导出到当前sheet

- export_df: tables # 导出变量 tables 的值到当前sheet

export_db: 将sql查询结果导出到excel

- export_db: select * from user # 查询sql

get_cell_value: 读取单元格的值

- get_cell_value:
      # 变量msg取B2单元格的单个值
      msg: B2
      # 变量取list/tuple/set/pd.Series类型的值
      # 变量col_values取B列的多个值（一维数组）
      col_values: B
      # 变量row_values取第1行的多个值（一维数组）
      row_values: 1
      # 变量boud_values取B1到D2区域的多个值（二维数组）
      boud_values: B1:D2

set_cell_value: 设置单元格的值

- set_cell_value:
      B2: txt
      # 值是变量表达式
      B4: $msg
      # 值是list/tuple/set/pd.Series类型的变量
      B: $col_values
      1: $row_values

cells: 遍历cell设置样式或值, 其中动作名中()包含的是范围字符串, 支持变量表达式

- cells(A1:C2): # 指定区域的多个单元格
    # 设置每个单元格的样式
    fill: red
- cells(A): # 指定列的多个单元格
    fill: red
- cells(1): # 指定行的多个单元格
    fill: red
- cells(A1): # 单个单元格
    fill: red

cell独有的样式

- cells(A1):
    value: test # 设置值
    style: Hyperlink  # 添加超连接样式

row/col/cell都支持的样式

- cells(A1):
- cols(A):
- rows(1):
    # 填充颜色
    fill: red
    # 字体
    font:
        name: 宋体 # 字体类型
        size: 14 # 字体大小
        color: FFFF00 # 字体颜色
        bold: true # 是否加粗
        italic: true # 是否斜体
    # 对齐样式
    alignment:
        horizontal: center # 水平对齐模式
        vertical: center # 垂直对齐模式
        text_rotation: 45 # 旋转角度
        wrap_text: true # 是否自动换行
    # 边框
    border:
        style: thick # 边线样式：double/mediumDashDotDot/slantDashDot/dashDotDot/dotted/hair/mediumDashed/dashed/dashDot/thin/mediumDashDot/medium/thick
        color: FFFF0000 # 边线颜色

cols: 遍历col设置样式, 其中动作名中()包含的是范围字符串, 支持变量表达式

- cols(D:E): # 多列
    fill: blue
- cols(D): # 单列
    fill: blue

col独有的样式

- cols(D): # 单列
    width: 40

rows: 遍历row设置样式, 其中动作名中()包含的是范围字符串, 支持变量表达式

- rows(4:5): # 多行
    fill: green
- rows(4): # 单行
    fill: green

row独有的样式

- rows(4):
    height: 40

insert_rows: 插入行

# 在第1行之上插入3行
- insert_rows: 1, 3

insert_cols: 插入列

# 在第1列之前插入3列
- insert_cols: 1, 3

delete_rows: 删除行

# 删除第1-4行
- delete_rows: 1, 3

delete_cols: 删除列

# 删除第1-4列
- delete_cols: 1, 3

merge_cells: 合并单元格

# 合并 C1 到 D2 区域的单元格
- merge_cells: C1:D2

unmerge_cells: 取消合并单元格

# 取消合并 C1 到 D2 区域的单元格
- unmerge_cells: C1:D2

insert_image: 插入图片

- insert_image: 
    # 在A1单元格处, 插入图片
    A1: a.png
    C1:
      image: c.txt
      size: 100,90 # 宽度,高度

insert_file: 插入文件

- insert_file: 
    # 在A1单元格处, 插入文件a.txt
    A1: a.txt
    C1: c.txt

insert_plot: 插入plot绘图, 根据 DataFrame 数据来生成绘图, 图形类型支持: 1 line 折线图 2 bar 条形图 3 barh 横向条形图 4 hist 直方图 5 box 箱线图 6 kde 核密度图 7 pie 饼图

# 插入plot绘图
- insert_plot:
    A1:
      df: prices # DataFrame类型的变量名
      kind: bar # 图形类型支持: 1 line 折线图 2 bar 条形图 3 barh 横向条形图 4 hist 直方图 5 box 箱线图 6 kde 核密度图 7 pie 饼图
      x: 日期 # x轴列名
      y: 成交量 # y轴列名,支持多个,用逗号分割,可省(即为所有列)

for: 循环; for动作下包含一系列子步骤，表示循环执行这系列子步骤；变量for_i记录是第几次迭代（从1开始）,变量for_v记录是每次迭代的元素值（仅当是list类型的变量迭代时有效）

# 循环3次
for(3) :
  # 每次迭代要执行的子步骤
  - switch_sheet: test

# 循环list类型的变量urls
for(urls) :
  # 每次迭代要执行的子步骤
  - switch_sheet: test

# 无限循环，直到遇到跳出动作
# 有变量for_i记录是第几次迭代（从1开始）
for:
  # 每次迭代要执行的子步骤
  - break_if: for_i>2 # 满足条件则跳出循环
    switch_sheet: test

once: 只执行一次，等价于 for(1); once 结合 moveon_if，可以模拟 python 的 if 语法效果

once:
  # 每次迭代要执行的子步骤
  - moveon_if: for_i<=2 # 满足条件则往下走，否则跳出循环
    switch_sheet: test

break_if: 满足条件则跳出循环; 只能定义在for/once循环的子步骤中

break_if: for_i>2 # 条件表达式，python语法

moveon_if: 满足条件则往下走，否则跳出循环; 只能定义在for/once循环的子步骤中

moveon_if: for_i<=2 # 条件表达式，python语法

if/else: 满足条件则执行if分支，否则执行else分支

- set_vars:
    txt: '进入首页'
- if(txt=='进入首页'): # 括号中包含的是布尔表达式，如果表达式结果为true，则执行if动作下的子步骤，否则执行else动作下的子步骤
    - print: '----- 执行if -----'
  else:
    - print: '----- 执行else -----'

include: 包含其他步骤文件，如记录公共的步骤，或记录配置数据(如用户名密码);

include: part-common.yml

set_vars: 设置变量;

set_vars:
  name: shi
  password: 123456
  birthday: 5-27

print_vars: 打印所有变量;

print_vars:

Name		Name	Last commit message	Last commit date
Latest commit History 46 Commits
ExcelBoot		ExcelBoot
example		example
img		img
tests		tests
.gitignore		.gitignore
README.md		README.md
dbexporter.py		dbexporter.py
install.sh		install.sh
publish.sh		publish.sh
requirements.txt		requirements.txt
setup.py		setup.py
test.sh		test.sh

shigebeyond/ExcelBoot

Folders and files

Latest commit

History

Repository files navigation

ExcelBoot - yaml驱动Excel生成

概述

特性

同类yaml驱动框架

todo

安装

使用

步骤配置文件及demo

配置详解

About

Resources

Stars

Watchers

Forks

Languages