# Les bases pour faire interagir Excel avec Python

## Tableur VS. Structures de données

Quand Excel nous fait interagir avec des **tableurs** 👇

<img src="media/tableurs.png" width="500"/>

Python nous fait plutôt manipuler des **structures de données** 👇 

In [4]:
# des listes
l = list([1001,"Mark",55,"Italy", 4.5, "Europe"])
print(l)

[1001, 'Mark', 55, 'Italy', 4.5, 'Europe']


In [14]:
# des tuples
t = (1001,"Mark",55,"Italy", 4.5, "Europe")
print(t)

(1001, 'Mark', 55, 'Italy', 4.5, 'Europe')


In [10]:
# des dictionnaires
d = {1001:{'name':'Mark', 'age':55,'country':'Italy','score':'4.5', 'continent':'Europe'}}
print(d)

{1001: {'name': 'Mark', 'age': 55, 'country': 'Italy', 'score': '4.5', 'continent': 'Europe'}}


In [12]:
# des sets
s = set(["Europe", "America","Amercia", "Europe"])
print(s)

{'America', 'Europe', 'Amercia'}


In [None]:
...

In [None]:
...

In [None]:
...

# Lignes/colonnes VS. Index

Quand Excel nous fait interagir avec **des lignes et des colonnes** 👇

<img src="media/lignes_colonnes.png" width="500"/>

Python nous fait manipuler des éléments présents au sein des structures de données et identifiables grâce à leur **index** 👇

<img src="media/index.png" width="500"/>

In [19]:
print(l[0])

1001


In [21]:
print(t[1])

Mark


In [23]:
print(d[1001])

{'name': 'Mark', 'age': 55, 'country': 'Italy', 'score': '4.5', 'continent': 'Europe'}


# Ajouter/Supprimer VS. Slicing

Quand Excel nous amène à **ajouter/supprimer** des lignes et colonnes pour sélectionner un sous-ensemble de données 👇

<img src="media/ajout:suppression.png" width="500"/>

Python nous permet de **découper** (_slice_) des sous-ensembles de données en utilisant l'index 👇

In [29]:
print(l[0:3])

[1001, 'Mark', 55]


In [30]:
print(t[1:4])

('Mark', 55, 'Italy')


...

In [None]:
...

## Format VS. Type de données

Quand Excel nous demande de spécifier le **format** d'une cellule 👇

<img src="media/format.png" width="500"/>

Python nous amène à assigner des **types** aux données

In [32]:
print(type(l[0]))

<class 'int'>


In [36]:
print(type(l[1]))

<class 'str'>


In [34]:
print(type(l[0:1]))

<class 'list'>


# Mise en pratique 

Quand on commence à faire des tableaux de bord et calculs avec Excel, on se trouve nécessairement bloqué par une faute de frappe ou une cellule avec le mauvais format. On peut littéralement passer des heures à chercher cette erreur. 

Passer via Python peut permettre d'éviter cela, et donc de s'éviter des prises de tête. 

## Valider le type de données (Input)

In [2]:
import pyinputplus as pyip

In [19]:
user_id = pyip.inputInt(prompt='Enter an integer user ID: ')
name = pyip.inputStr(prompt='Enter a name: ')
age = pyip.inputInt(prompt='Enter an integer age: ')
country = pyip.inputStr(prompt='Enter a country: ')
score = pyip.inputFloat(prompt='Enter a float height: ')
continent = pyip.inputInt(prompt='Enter an integer continent code: ')

Enter an integer user ID: 

 1


Enter a name: 

KeyboardInterrupt: Interrupted by user

## Ajouter les données validées aux structures de données

In [27]:
import pyinputplus as pyip
import pandas as pd

In [31]:
def collect_data():
    user_id = pyip.inputInt(prompt='Enter an integer user ID: ')
    name = pyip.inputStr(prompt='Enter a name: ')
    age = pyip.inputInt(prompt='Enter an integer age: ')
    country = pyip.inputStr(prompt='Enter a country: ')
    score = pyip.inputFloat(prompt='Enter a float height: ')
    continent = pyip.inputInt(prompt='Enter an integer continent code: ')
    
    return [user_id, name, age, country, score, continent]

In [29]:
collect_data()

Enter an integer user ID: 

KeyboardInterrupt: Interrupted by user

In [32]:
data_lists = []
num_lists = pyip.inputInt(prompt='Enter the number of lists you want to create: ', min=1)
for i in range(num_lists):
    print(f'Creating List {i+1}')
    data_lists.append(collect_data())

Enter the number of lists you want to create: 

 1


Creating List 1
Enter an integer user ID: 

 11


Enter a name: 

 Francis


Enter an integer age: 

 14


Enter a country: 

 France


Enter a float height: 

 3.4


Enter an integer continent code: 

 34


In [33]:
print(data_lists)

[[11, 'Francis', 14, 'France', 3.4, 34]]


## Envoyer les données dans un tableur Excel

In [35]:
import openpyxl

In [36]:
if data_lists:  # Check if there's any data collected
    df = pd.DataFrame(data_lists)
    excel_file = 'data.xlsx'
    df.to_excel(excel_file, index=False, header=False)
    print(f'Data saved to {excel_file}')
else:
    print("No data was collected.")

Data saved to data.xlsx


## Vérifier le type des données provenant d'un tableur Excel

In [39]:
import pandas as pd

# Load Excel file
excel_file = 'data.xlsx'
try:
    df = pd.read_excel(excel_file, header=None)
    print("Excel file loaded successfully.")
    print("Checking data types...")

    # Define expected data types for each column
    expected_data_types = {
        0: 'int',
        1: 'str',
        2: 'int',
        3: 'str',
        4: 'float',
        5: 'int'
    }

    # Check data types for each cell
    for col_index, expected_type in expected_data_types.items():
        for row_index, cell_value in df[col_index].items():
            actual_type = type(cell_value).__name__
            if actual_type != expected_type:
                print(f"Mismatch at Row {row_index + 1}, Column {col_index + 1}. Expected: {expected_type}, Actual: {actual_type}")

except FileNotFoundError:
    print(f"Error: File '{excel_file}' not found.")
except Exception as e:
    print(f"An error occurred: {str(e)}")


Excel file loaded successfully.
Checking data types...
Mismatch at Row 1, Column 1. Expected: int, Actual: float
Mismatch at Row 2, Column 1. Expected: int, Actual: float
Mismatch at Row 2, Column 2. Expected: str, Actual: int
Mismatch at Row 2, Column 3. Expected: int, Actual: str
Mismatch at Row 2, Column 6. Expected: int, Actual: str
