<center><h1>Les principales fonctions d'openpyxl</center></h1>

Découvrons ensemble quelques fonctions pour manipuler un fichier Excel avec la librairie OpenPyxl.

La documentation est disponible [ici](https://openpyxl.readthedocs.io/en/stable/tutorial.html)

Nous utiliserons également Pandas car OpenPyxl est le "moteur" utilisé derrière certaines fonctions de Pandas lorsque l'on manipule des fichiers Excel. 

De plus, elles ont l'avantage d'être plus facile à utiliser.

### Commençons par importer les packages

In [2]:
import pandas as pd
import openpyxl

### Créer un fichier Excel

Le plus simple reste ici d'utiliser un DataFrame Pandas et la méthode **to_excel()**

In [4]:
df = pd.DataFrame({
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': [7, 8, 9]
})

with pd.ExcelWriter('fichier.xlsx', engine='openpyxl') as writer:
    df.to_excel(writer, sheet_name='Feuil1', index=False)


Questions : 
- Qu'est ce qu'une méthode ? 
- À quoi sert le **with** ? 

## Intéragir avec un fichier Excel

Il faut d'abord se rappeler ce qui compose un fichier Excel. 

Un fichier Excel est un classeur (*workbook*) composé de feuilles (*worksheet*) qui sont à leur tour composées de cellules (*cells*).

Nous pouvons ainsi se mettre d'accord sur le fait qu'un fichier Excel est un **objet** avec lequel nous pouvons intéragir avec diverses **méthodes** pour modifier ses caractéristiques (ses attributs).

Essayons de modifier le contenu du fichier généré précedemment. 

Nous voulons créer une nouvelle feuille au sein de ce dernier. 

In [5]:
# Charger le fichier excel avec openpyxl
# Il faut charger le classeur (workbook) pour pouvoir le manipuler 
wb = openpyxl.load_workbook('fichier.xlsx')
wb

<openpyxl.workbook.workbook.Workbook at 0x7f3c4a8adbd0>

Remarquez que nous ne pouvons pas afficher son contenu avec un *print* car **wb** est un **objet de type Workbook**

Il faut d'abord accéder à un objet feuille avant de boucler sur son contenu.

In [6]:
sheet = wb['Feuil1'] # On utilise ici implicitement wb.__getitem__('Feuil1') pour accéder à la feuille

# On itère ensuite sur les lignes de la feuille
# avec la méthode iter_rows
for row in sheet.iter_rows(values_only=True):
    print(row)

('A', 'B', 'C')
(1, 4, 7)
(2, 5, 8)
(3, 6, 9)


Si la première question qui vous vient à l'esprit c'est : "Mais comment j'aurai pu savoir que pour accéder à une feuille, il fallait utiliser cette syntaxe wb['nom_feuille'] ?"

> La réponse est simple, il suffit de lire la documentation

Comme énoncé plus tôt, les objets obtenus avec OpenPyxl possède des attributs et des méthodes. 

Il peut exister plusieurs niveau entre les attributs, nous allons dans notre cas chercher à retirer la grille.

Pour cela nous utilisons l'objet **sheet** puis son attribut **sheet_view** et enfin l'attribut **showGridLines**. 

In [7]:
sheet.sheet_view.showGridLines = False

Pour explorer les différents attributs et méthodes, vous pouvez utiliser la fonction **dir()** de Python. 

In [27]:
dir(sheet.sheet_view)

['__add__',
 '__attrs__',
 '__class__',
 '__copy__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__elements__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__lt__',
 '__module__',
 '__namespaced__',
 '__ne__',
 '__nested__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 'colorId',
 'defaultGridColor',
 'from_tree',
 'idx_base',
 'namespace',
 'pane',
 'rightToLeft',
 'selection',
 'showFormulas',
 'showGridLines',
 'showOutlineSymbols',
 'showRowColHeaders',
 'showRuler',
 'showWhiteSpace',
 'showZeros',
 'tabSelected',
 'tagname',
 'to_tree',
 'topLeftCell',
 'view',
 'windowProtection',
 'workbookViewId',
 'zoomScale',
 'zoomScaleNormal',
 'zoomScalePageLayoutView',
 'zoomScaleSheetLayoutView',
 'zoomToFit']

Nous avons vu plus haut comment afficher tout le contenu d'une feuille mais nous pouvons aussi naturellement accéder à une cellule et la manipuler

In [8]:
# De la même manière, on accède à une cellule avec sheet['nom_de_la_cellule']
# Il faut ensuite utiliser son attribut value pour accéder à la valeur de la cellule
sheet['A1'].value


'A'

On peut ensuite lui assigner une nouvelle valeur

In [9]:
sheet['A1'] = 'Hello'
sheet['A1'].value

'Hello'

Question :
- À votre avis, le fichier Excel a-t'il lui aussi été modifié ? (Ouvrez le fichier pour vous en assurer et expliquez)

On peut aussi accéder à plusieurs cellules à la fois 

In [10]:
cell_range = sheet['A1':'C3']
for row in cell_range:
    for cell in row:
        print(cell.value)

Hello
B
C
1
4
7
2
5
8


Vous remarquerez que la lecture se fait là aussi en ligne.

Si on souhaite lire en colonne, il faut utiliser **iter_columns()**

In [11]:
for col in sheet.iter_cols(min_row=1, max_row=3, min_col=1, max_col=3):
    for cell in col:
        print(cell.value)

Hello
1
2
B
4
5
C
7
8


Nous avons vu les principales fonctions pour intéragir avec les données dans un fichier, il reste beaucoup de choses à voir, comme la validation de données, les styles (couleurs et *font*). 

Une fois de plus, référez-vous à [la documentation en ligne.](https://openpyxl.readthedocs.io/en/stable/tutorial.html)

In [12]:
# Sauvegardons ce que nous avons fait à présent
wb.save('fichier.xlsx')

### Les formules

Tout l'intérêt d'openpyxl réside dans la pratique d'injecter des formules Excel pour permettre à l'utilisateur final, souvent habitué à Excel, de pouvoir les utiliser et les comprendre à son tour. 

In [None]:
# Ici, nous voulons faire la somme des cellules A2 à A4 dans la cellule A5
# avec la fonction excel SUM 
sheet['A5'] = '=SUM(A2:A4)'
wb.save('fichier.xlsx')

Particularité d'openpyxl, il faut utiliser les noms des fonctions en ANGLAIS, de la même façon, les séparateurs ne sont plus des **points-virgules (;)** mais simplement des **virgules (,)**

Par ailleurs, il est tout à fait possible de rencontrer des erreurs sur certaines fonctions comme **UNIQUE()**, pour contourner ce problème, il faut utiliser le préfixe **_xlfn.**

Pour vous assurez qu'une fonction est présente, vous pouvez utiliser **FORMULAE**

In [15]:
from openpyxl.utils import FORMULAE

# On peut tester la présence d'une fonction dans le module openpyxl.utils.FORMULAE
'SUM' in FORMULAE

True

In [16]:
'UNIQUE' in FORMULAE

False

Explication des cellules précédentes :

```python
'SUM' in FORMULAE
```
Renvoie True car SUM est disponible directement tandis que 

```python
'UNIQUE' in FORMULAE
```
Renvoie False 

Ainsi, pour utiliser **UNIQUE**, nous devons préfixer la formule par **_xlfn.**

> Subtilité supplémentaire, **UNIQUE** est un fonction *array* c'est à dire qu'elle renvoie **une plage de cellules**, il faut donc définir la plage glissante sur laquelle on va afficher ce qu'elle renvoie. 

In [19]:
from openpyxl.worksheet.formula import ArrayFormula

formula = '=_xlfn.UNIQUE(A2:A4)'
sheet['A6'] = ArrayFormula(f"A6:A8", formula)
wb.save('fichier.xlsx')


### Les graphiques

Grâce à Openpyxl, vous pouvez créer des visualisations natives d'Excel afin que l'utilisateur final puisse intéragir avec des dernières. 

Toutes les visualisations d'Excel sont disponibles, référez-vous à la [documentation](https://openpyxl.readthedocs.io/en/stable/charts/introduction.html#charts) 


In [None]:
# Créer un graphique avec openpyxl
from openpyxl.chart import BarChart, Reference

# Je vous conseille de recharger en mémoire le fichier excel 
# à chaque modification sinon vous pourriez avoir des surprises
wb = openpyxl.load_workbook('fichier.xlsx')
sheet = wb['Feuil1']

## Paramètres du graphique
chart = BarChart() # on initialise le graphique
chart.type = "bar" # on chosit son type
chart.style = 11 # on peut définir un style
chart.title = "Mon graphique" # titre du graphique
chart.y_axis.title = 'Y axis'
chart.x_axis.title = 'X axis'


#cats = Reference(sheet, min_col=1, min_row=2, max_row=4, max_col=3) # Les titres
data = Reference(sheet, min_col=1, min_row=1, max_row=4, max_col=3) # Les valeurs


# Ajouter les données
chart.add_data(data, titles_from_data=True)

#Légende
#chart.set_categories(cats)

#Ajouter le graph
sheet.add_chart(chart, "A23")
wb.save('fichier.xlsx')

# De même, il faut utiliser close() pour fermer le fichier en mémoire
wb.close()