# Как работать с Excel-файлами из Python?

Если вам нужно работать с табличными файлами из Python, а формат зависит только от вас, то по возможности используйте не `xls-`, `xlsx-`файлы, а `csv`-файлы. Такие файлы занимают меньше места на диске и их легко открыть в любом редакторе.

Если всё-таки нужен именно формат Excel, есть пара вариантов.

# 1. Если вы занимаетесь анализом данных
Если вы вхожи в мир Data Science, то наверняка используете библиотеку `pandas`, а в ней уже есть функция чтения [`pandas.read_excel`](https://pandas.pydata.org/docs/reference/api/pandas.read_excel.html#pandas.read_excel) и метод записи `pandas.DataFrame.to_excel`.

In [34]:
import pandas as pd
df = pd.read_excel('test.xlsx')
df

Unnamed: 0,x,y
0,-3,9
1,-2,4
2,-1,1
3,0,0
4,1,1
5,2,4
6,3,9


В зависимости от расширения файла, pandas подберет необходимый движок, так что можно передавать не только `xls` или `xlsx`-файлы, но и открытые форматы `.odf, .odt` или бинарные файлы `xlsb`. Если в файле несколько листов, нужно указать имя нужного.

Чтобы записать одностраничный Excel-файл, используем метод `to_excel`:

In [42]:
df.loc[df.x > 0].to_excel('pos.xlsx',
                           index=False)

pd.read_excel('pos.xlsx')

Unnamed: 0,x,y
0,1,1
1,2,4
2,3,9


Если нужно записать excel-файл, состоящий из нескольких страниц, используем объект специального класса [`pandas.ExcelWriter`](https://pandas.pydata.org/docs/reference/api/pandas.ExcelWriter.html):

In [48]:
writer = pd.ExcelWriter('pos_neg.xlsx')

df.loc[df.x > 0].to_excel(writer,
                          sheet_name='Positive',
                          index=False)

df.loc[df.x < 0].to_excel(writer,
                          sheet_name='Negative',
                          index=False)

writer.save()

In [49]:
pd.read_excel('pos_neg.xlsx', sheet_name='Positive')

Unnamed: 0,x,y
0,1,1
1,2,4
2,3,9


In [45]:
pd.read_excel('pos_neg.xlsx', sheet_name='Negative')

Unnamed: 0,x,y
0,-3,9
1,-2,4
2,-1,1


# 2. Если нужно что-то компактное

Если вам не нужен pandas, вы можете взять  библиотеку любого движков, которые тот использует под капотом, например, [`openpyxl`](https://openpyxl.readthedocs.io/en/stable/), для xlsx-файлов.

Библиотека даст больше свободы для работы с самими excel-файлами, например, можно работать со стилями ячеек или делать [условное форматирование](https://openpyxl.readthedocs.io/en/stable/formatting.html).

Но многое придется продумывать самостоятельно:

In [71]:
from openpyxl import load_workbook
wb = load_workbook('test.xlsx')
sheet = wb.active
cells = sheet['A1': 'B8']

for c1, c2 in cells:
    print(f'{c1.value:>2} {c2.value:>2}')

 x  y
-3  9
-2  4
-1  1
 0  0
 1  1
 2  4
 3  9


# 3. Если вы работаете в Windows

Если вы работаете в Windows непосредственно с Excel, как частью MS Office Excel, вы можете использовать com-объект, предоставляемый библиотекой `pywin32`. В этом случае вы сможете использовать стандартные `VBA`-команды, используемые для всей линейки продуктов MS Office.

# 4. Вызов функций Python из MS Excel

Возможно, вы хотите перенести какой-то готовый функционал, написанный на Python в Excel. Тогда вам поможет интерфейс [ExcelPython](https://github.com/ericremoreynolds/excelpython). Фактически вы сможете писать макросы в Excel, которые используют код на Python.