# Premiers pas en Python pour la science des données

Dans cette section, nous allons introduire les bases de Python. L’objectif ici est de vous familiariser avec les éléments essentiels du langage nécessaires à la pratique de la science des données. Python est un outil incontournable dans ce domaine, permettant de manipuler, analyser et visualiser des données avec efficacité. En acquérant ces compétences fondamentales à travers des exemples concrets et réalistes, vous serez mieux préparés à appliquer des techniques de science des données sur des jeux de données réels et à résoudre des problèmes complexes de manière pratique.


## Pratique 1 : Types de données, mathématiques et fonction `print()`

Dans cette section, vous débuterez en apprenant les bases de la manipulation de différents types de données, ainsi que l’utilisation de la fonction `print()` pour afficher ce qui se passe dans votre programme Python.

Si vous souhaitez approfondir vos connaissances en programmation Python, vous pouvez consulter cette [documentation sur les opérateurs mathématiques](https://www.tutorialspoint.com/python/python_basic_operators.htm) pour aller plus loin.


### Utilisation de la fonction `print()`

`print()` est une fonction intégrée qui vous permet, en tant qu'utilisateur, de visualiser ce qui se passe dans le code. Elle ne modifie ni ne transmet quoi que ce soit au programme Python.

Par exemple, nous avons affiché le message « Hello World! » ci-dessous.


In [1]:
print('Hello World!')

Hello World!


### Commentaires

Il arrive que nous souhaitions expliquer ou organiser notre code sans donner d'instructions au programme. C’est là qu’interviennent les commentaires ! Le symbole `#` indique à Python que vous écrivez un commentaire destiné à être lu par un humain. Tout ce qui est écrit après le symbole `#` sur la même ligne sera ignoré par Python.


In [2]:
# Print 'Hello World!'
print('Hello World') # Un autre commentaire

Hello World


### Types de données de base

En Python, il existe plusieurs types de données que nous pouvons utiliser pour stocker des informations. Les quatre types les plus courants sont : les entiers, les nombres à virgule flottante, les chaînes de caractères et les booléens.


In [3]:
print(3)              # valeur entière  
print(3.5)            # valeur flottante  
print('Hello World')  # chaîne de caractères  
print(True)           # valeur booléenne  


3
3.5
Hello World
True


### Variables

Les variables nous permettent de stocker des données pour les manipuler ou les afficher dans différentes parties de notre programme Python. Elles réduisent la répétition de code et rendent le programme plus lisible.

Par exemple, imaginons que nous écrivons un programme pour générer un reçu pour un acheteur en ligne. Nous voudrions peut-être afficher le coût de la commande à plusieurs endroits. Pour cela, nous pourrions stocker cette valeur dans une variable nommée `cost`.


In [14]:
cost = 200 
print('Le coût de votre commande est de', cost, 'DH')  
print('Veuillez appuyer sur le bouton vert pour accepter le paiement de', cost, 'DH')  


Le coût de votre commande est de 200 DH
Veuillez appuyer sur le bouton vert pour accepter le paiement de 200 DH


### Cas particulier : guillemets à l'intérieur des chaînes de caractères

Un cas particulier à considérer est la création d'une chaîne de caractères contenant des guillemets en son sein.


In [16]:
# Cas particulier ! Guillemets dans des guillemets

# Utilisez des guillemets simples pour encapsuler la chaîne si vous avez besoin d'inclure des guillemets doubles à l'intérieur
print('Les "data" sont des informations numériques brutes exploitables pour faire des analyses')

# Utilisez des guillemets doubles pour encapsuler la chaîne si vous avez besoin d'inclure des guillemets simples à l'intérieur
print("J'utilise la data science pour résoudre des problèmes concrets en analysant les données.")

# Vous pouvez également utiliser le caractère d'échappement (\) pour dire à Python d'ignorer le caractère qui suit
print('J\'utilise la data science pour résoudre des problèmes concrets en analysant les données.')


Les "data" sont des informations numériques brutes exploitables pour faire des analyses
J'utilise la data science pour résoudre des problèmes concrets en analysant les données.
J'utilise la data science pour résoudre des problèmes concrets en analysant les données.


### Opérateurs mathématiques

Python propose plusieurs opérateurs mathématiques intégrés. Ces opérateurs peuvent être utilisés pour effectuer des transformations sur les données.

Il est important de noter que les opérateurs se comportent différemment selon les types de données.


In [7]:
# Créer des variables pour des opérations mathématiques dans les cellules suivantes

a = 2  
b = 4  
c = 'Hello '  
d = 'world'


Remarquez que lorsque vous exécutez la cellule ci-dessus, rien ne s’affiche en sortie. Python stocke les variables en mémoire, mais ne fait rien d’autre avec elles.


In [14]:
# Addition (+)
print(a + b)

6


In [15]:
# Addition des chaines de caracteres
print(c + d)

Hello World!


In [11]:
# Soustraction (-)
print(a - b)

-2


In [12]:
# Multiplication (*)
print(a * b)

8


In [13]:
# Exponent (**)
print(b ** a)

16


In [14]:
# Division (/)
print(b / a)

2.0


La division produit toujours un type de donnée `float`, même si le résultat est un nombre entier.


In [8]:
# Modulo (%)

x = 5
y = 2

print('Le reste de la division de x par y est:', x%y)

Le reste de la division de x par y est: 1


L'opérateur modulo `%` effectue d'abord une division, puis renvoie le reste de cette division. Par exemple, l'opération suivante :

5 divisé par 2 donne 2 avec un reste de 1, donc 5 % 2 renvoie 1.


In [9]:
# Division entière (//)

# La division classique (/) renvoie une valeur flottante précise
print('Deux se divise dans neuf', 9/2, 'fois')

# La division entière (//) ne renvoie que la partie entière du quotient
print('Deux se divise entier dans neuf', 9//2, 'fois')


Deux se divise dans neuf 4.5 fois
Deux se divise entier dans neuf 4 fois


### Exemple pratique

Supposons que nous travaillions dans une concession automobile et que nous voulions savoir combien de voitures vendre pour atteindre un bénéfice de 1000 000 DH. La division nous donnera une valeur en `float`, ce qui ne nous indique pas combien de voitures entières vendre pour atteindre cet objectif.

Une idée serait d'utiliser la division entière pour connaître le nombre de voitures à vendre avant d'atteindre le seuil, puis d'en ajouter une de plus.

In [17]:
# Enregistrer les valeurs pertinentes
prix_moyen_vente = 548530  # Prix moyen de vente en DH  
cout_moyen_distribution = 457340  # Coût moyen de distribution en DH  
profit_par_voiture = prix_moyen_vente - cout_moyen_distribution  # Bénéfice par voiture  
objectif_profit = 1000000  # Objectif de profit en DH  

voitures_a_vendre = objectif_profit / profit_par_voiture  # Ceci est une valeur flottante  
voitures_a_vendre_entier = (objectif_profit // profit_par_voiture) + 1  # Nombre entier de voitures à vendre  

print(voitures_a_vendre)  
print(voitures_a_vendre_entier)


10.96611470555982
11


## Essayez-vous-même !

Complétez les exercices suivants pour mettre en pratique vos compétences.

Pour adopter de bonnes habitudes, créez d’abord des variables pour résoudre les exercices, puis affichez ces variables avec la fonction `print()`.



#### 1. Exécutez le code dans la cellule ci-dessous pour voir les erreurs. Corrigez les erreurs dans le code.


In [18]:
# 1

print("Ce n'est pas ici qu'il y a une erreur. Elle se trouve ailleurs.")  
print('Albert Einstein a dit : "L’école HEC est la meilleure école du monde !"') # En réalité, il n'a probablement jamais dit cela.



Ce n'est pas ici qu'il y a une erreur. Elle se trouve ailleurs.
Albert Einstein a dit : "L’école HEC est la meilleure école du monde !"


#### 2. Exécutez le code ci-dessous pour voir l'erreur. Corrigez l'erreur dans le code.


In [19]:
# 2

print('Ceci produit", 1, 'erreur')

SyntaxError: unterminated string literal (detected at line 3) (1842254831.py, line 3)

### Pour les questions restantes, utilisez les données ci-dessous :

Imaginez que vous travaillez pour la société Renault Maroc et que vous avez les informations suivantes sur les ventes de voitures :  
- `voitures_vendues` représente le nombre de voitures vendues le mois dernier  
- `prix_moyen_vente` est le prix de vente moyen par voiture  
- `cout_moyen_distribution` est le coût moyen de distribution par voiture  

Exécutez la cellule suivante pour créer et enregistrer ces données.


In [20]:
# Données de 'Renault Maroc' pour les exercices suivants

voitures_vendues = 35  
prix_moyen_vente = 548530  
cout_moyen_distribution = 457340  


#### 3. Créez une variable pour calculer le bénéfice moyen par voiture à l’aide des données de ventes de `Renault Maroc`. Affichez le résultat.


In [24]:
# 3


#### 4. Trouvez et affichez le bénéfice total de ce mois-ci en vous basant sur les données de `Renault Maroc`.


In [26]:
# 4


#### 5. En supposant que les ventes et les marges bénéficiaires de ce mois soient identiques, combien de mois de ventes sont nécessaires pour atteindre un bénéfice de 1 000 000 DH ou plus ?


In [25]:
# 5

