# openpyxl之读取xlsx

1、基本概念

在openpyxl中，主要用到三个概念：Workbooks，Sheets，Cells。

- Workbook就是一个excel工作表；
- Sheet是工作表中的一张表页；
- Cell就是简单的一个格。

openpyxl就是围绕着这三个概念进行的，不管读写都是“三板斧”：打开Workbook，定位Sheet，操作Cell。下面分读和写分别介绍几个常见的方法。

![](page1.png)

### 文件加载

通过openpyxl.load_workbook()方法加载已经存在的xlsx文件

In [8]:
# 读取xlsx文件
import openpyxl
import sys

excel = openpyxl.load_workbook("read_test1.xlsx")

print(excel.active, excel.encoding, excel.sheetnames)

<Worksheet "page2"> utf-8 ['page1', 'page2']


### Workbook对象提供了很多属性和方法，其中，大部分方法都与sheet有关，部分属性如下：

- active：获取当前活跃的Worksheet
- worksheets：以列表的形式返回所有的Worksheet(表格)
- read_only：判断是否以read_only模式打开Excel文档
- encoding：获取文档的字符集编码
- properties：获取文档的元数据，如标题，创建者，创建日期等
- sheetnames：获取工作簿中的表（列表）

### 获取单元格内容

In [2]:
sheet = excel['page1']
sheet.cell(1, 1).value, sheet.cell(1, 2).value

('hello', 'world')

### 获得最大行和最大列

In [91]:
print(sheet.max_row)
print(sheet.max_column)

6
2


### 获取行和列

In [96]:
for row in sheet.rows:
    print(row)
    for cell in row:
        print(cell.value)

(<Cell 'page1'.A1>, <Cell 'page1'.B1>)
hello
world
(<Cell 'page1'.A2>, <Cell 'page1'.B2>)
1
2
(<Cell 'page1'.A3>, <Cell 'page1'.B3>)
3
4
(<Cell 'page1'.A4>, <Cell 'page1'.B4>)
5
6
(<Cell 'page1'.A5>, <Cell 'page1'.B5>)
7
8
(<Cell 'page1'.A6>, <Cell 'page1'.B6>)
9
0


In [98]:
for cell in list(sheet.rows)[1]:
    print(cell.value)

1
2


# openpyxl之生成xlsx

生成xlsx文件需要导入openpyxlWorkBook模块

In [153]:
from openpyxl import Workbook

wb = Workbook() #这样就新建了一个新的工作表（只是还没被保存）

In [160]:
print(wb.sheetnames) # 提供一个默认名叫Sheet的表，office2016下新建提供默认Sheet1

sheet.title = 'Sheet1'
# 新建一个工作表，可以指定索引，适当安排其在工作簿中的位置

print(wb.sheetnames)

wb.create_sheet('Data', index=1)  # 被安排到第二个工作表，index=0就是第一个位置

# 删除某个工作表
# wb.remove('Data')
del wb['Data']

['Sheet', 'Data']
['Sheet', 'Data']


### 写入单元格

In [None]:
# 直接给单元格赋值就行
sheet['A1'] = 'good'
# B9处写入平均值
sheet['B9'] = '=AVERAGE(B2:B8)'