# <span style="color:green"><ins>Chapitre 3: Types de données</ins></span>

In [112]:
import sys
import numpy as np

## 3.1 Identificateurs

Pour nommer une variable, une fonction, etc, il faut satisfaire à quelques contraintes :
- ils doivent commencer par une lettre (majuscule ou minuscule) ou le caractère underscore "_". 
- les caractères suivants doivent être : lettre, underscore ou chiffre

En outre, ces identificateurs ne doivent pas être des mots clés prédéfinis de python (voir section suivante)

In [113]:
# Exemples corrects
x=4
_y=8
__mavariable7=x+9
var7=89

In [114]:
# Exemple incorrect
@hello=9

SyntaxError: invalid syntax. Maybe you meant '==' or ':=' instead of '='? (671943661.py, line 2)

In [115]:
# Exemple incorrect
9azerty=x+4

SyntaxError: invalid decimal literal (2694509662.py, line 2)

In [116]:
# Exemple incorrect
ma-variable=x+4

SyntaxError: cannot assign to expression here. Maybe you meant '==' instead of '='? (3108246086.py, line 2)

## 3.2 Mots clés de Python 3

Certains noms sont "protégés" en python 3 car ils ont une signification bien précise, comme **def** par exemple, que nous avons déjà rencontré et qui sert à créer une fonction, ou **import** pour importer des librairies.<br/>
Il est interdit d'utiliser ces noms pour nommer une variable par exemple. Nous en rencontrerons d'autres dans la suite du cours. Voici la liste des mots clés de python 3.8 :

In [None]:
False
None
True 
and
as
assert
async
await
break
class
continue
def
del 
elif
else
except
finally
for
from
global
if
import
in
is
lambda
nonlocal
not
or
pass
raise
return
try
while
with
yield

L'éditeur ipython met d'ailleurs ces noms en vert et en gras par défaut. 

Si on nomme avec un de ces mots clés, python renvoie une erreur : 

In [117]:
lambda=9

SyntaxError: invalid syntax (66588166.py, line 1)

## 3.3 Types de données

Les objets manipulés peuvent être de différents type :

In [118]:
# Entiers :
type(234)

int

In [119]:
# Booléens :
type(True)

bool

In [120]:
# Nombres à virgule flottante (qui représentent les nombres réels) :
type(-5.6)

float

In [121]:
# Nombres complexes :
type(5+8.9j)

complex

In [122]:
# Chaînes de caractères (texte) :
type("Hello world")

str

In [123]:
# Fonctions :
def f(x) : return 2*x+3
type(f)

function

In [124]:
# None :
type(None)

NoneType

Pour une liste exhaustive des différents types de données, voir https://www.w3schools.com/python/python_datatypes.asp

## 3.4 Type *int*

Ce type de données représente les entiers naturels. 

### Base 10 (défaut)

In [125]:
2024

2024

### Base 2 (binaire) vers base 10 : préfixe 0b :

In [126]:
0b11111101000

2024

In [127]:
type(0b11111101000)

int

### Base 8 (octale) vers base 10 : préfixe 0o :

In [128]:
0o3750

2024

### Base 16 (hexadécimale) vers base 10 : préfixe 0x :

In [129]:
0x7E8

2024

### Base 10 vers base 2 :

In [130]:
bin(2024)

'0b11111101000'

### Base 10 vers base 8 : 

In [131]:
oct(2024)

'0o3750'

### Base 16 vers base 10 : 

In [132]:
hex(2024)

'0x7e8'

### Plus grand entier et *arithmetic overflow*

Le plus grand nombre entier "signé" représentable dépend de comment python tourne sur votre machine : en 32 bits ou en 64 bits :

In [133]:
import struct
# Use the 'calcsize' function to determine the size (in bytes) of the C int type for the current platform.
# The format string "P" is used to represent the C void pointer type, and multiplying it by 8 gives the size in bits.
# The result will be 32 for 32-bit platforms and 64 for 64-bit platforms.
print(str(struct.calcsize("P") * 8)+" bits")

64 bits


Sur 64 bits, c'est à dire avec 2^64 possibiltés de nombres différents, la convention est la suivante :<br/>
**Tous les entiers de -2^63 jusque 2^63-1**<br/>
Sur 32 bits, on irait de -2^31 jusque 2^31-1

Plus grand nombre entier : 

In [134]:
sys.maxsize

9223372036854775807

Comparons avec la valeur attendue théoriquement :

In [135]:
print(2**63-1)

9223372036854775807


Lorsqu'on dépasse ce nombre (on parle alors d'***arithmetic overflow***), il faut s'attendre à quelques surprises.<br/> 
Parfois, ça fonctionne sans problème (sous python 3) :

In [136]:
x=sys.maxsize
print(x)
print(x+1)
print(100*x)
print(x**2)

9223372036854775807
9223372036854775808
922337203685477580700
85070591730234615847396907784232501249


Parfois, ça ne fonctionne pas :

In [137]:
x=np.array([[sys.maxsize]])
print(x[0,0])                             # x
print((x+np.array([[1]]))[0,0])           # x+1
print((100*x)[0,0])                       # 100*x
print((x**2)[0,0])                        # x**2

9223372036854775807
-9223372036854775808
-100
1


**Conclusion :** Lorsqu'on s'attend à dépasser ce nombre entier max, il est préférable de transformer les entiers en nombres à virgules flottantes, qui permettent de travailler avec de plus grands nombres (voir section 3.6). Reprenons l'exemple précédent :

In [138]:
x=np.array([[float(sys.maxsize)]])        # Entier transformé en réel avec float
print(x[0,0])                             # x
print((x+np.array([[1]]))[0,0])           # x+1
print((100*x)[0,0])                       # 100*x
print((x**2)[0,0])                        # x**2

9.223372036854776e+18
9.223372036854776e+18
9.223372036854776e+20
8.507059173023462e+37


NB : lorsqu'on passe en "float", la représentation des nombres n'est plus exacte, elle est limitée par à une quinzaine de chifrres après la virgule en écriture sous format scientifique (double précision). Dans cet exemple, x et x+1 sont donc indiscernables... 

## 3.5 Données de type *bool*

On travaille ici avec des variables qui sont soit vraies (True), soit fausses (False). Ce type de variable est appelée **variable logique** et les règles de calcul sont dictées par l’algèbre de Boole. 

### Opérateurs de comparaison

- <, <=, >, >= (strictement plus petit, plus petit ou  égal, ...)
- == (égal)
- != (différent)

In [139]:
x=2          # signifie : x <- 2
x==3         # signifie : x est-il égal à 3? (2 réponses possibles : True/False)
y=(x==3)     # y est donc une variable logique
print(y)
print(x!=3)

False
True


In [140]:
print(2>8)
print(2<=8<15)

False
True


Pour tester si deux tableaux numpy sont égaux (et de même taille), on utilise `np.array_equal` :

In [141]:
A=B=np.array([[1,2],[3,4]])
C=np.array([[1,2],[3,5]])
print(np.array_equal(A,B))
print(np.array_equal(A,C))

True
False


Et pour tester si deux tableaux numpy sont presqu'égaux terme à terme, avec une certaine tolérance à spécifier, on utilise `np.allclose` (voir documentation pour son utilisation). 

Pour tester si tous les éléments d'un tableau logique sont vrais, on applique la méthode `all` à notre objet, et pour tester si au moins un  élément du tableau est vrai, on utilise la méthode `any` :

In [142]:
A=np.array([[True,True],[True,True]])
print(A.all())
A=np.array([[True,True],[False,True]])
print(A.all())

True
False


In [143]:
A=np.array([[True,True],[False,True]])
print(A.any())
A=np.array([[False,False],[False,False]])
print(A.any())

True
False


### Connecteurs logiques

On peut connecter les variables logiques a et b via les opérateurs suivants :
- a and b (et)
- a or b (ou inclusif)
- not(a) (non)

Pour rappel, leurs tables de vérités sont les suivantes :

|a|b|a and b|a or b|
|-|-|-|-|
|True|True|True|True|
|True|False|False|True|
|False|True|False|True|
|False|False|False|False|

|a|not(a)|
|-|-|
|True|False|
|False|True|

Il existe aussi le "ou exclusif" (XOR - soit a, soit b) qui n'est pas disponible par défaut en python. On peut le coder comme suit par exemple :

In [2]:
def xor(a,b) : return (a and not(b)) or (b and not(a))

In [3]:
x=4
print(x>2 and x<5)   # Vrai ET Vrai = Vrai
print(x>2 or x<3)    # Vrai OU Faux = Vrai
print(xor(x>2,x<5))  # Vrai XOR Vrai = Faux

True
True
False


### Conversion vers le type *bool*

Lors d'une opération *logique*, les autres types de données sont automatiquement converties en type *bool* comme suit :
- Conversion vers `False` : zéro (quel que soit le type numérique), `None`, ou bien les chaînes de caractères, les listes, les tuples, les dictionnaires ou les ensembles **vides**. 
- Conversion vers `True` : Tout le reste. 

Pour éviter les surprises, il est préférable de convertir soi-même les variables avec la fonction `bool`. 

In [146]:
x=4.6
bool(x)

True

In [147]:
x=[]
bool(x)

False

In [148]:
x=float('nan')
bool(x)

True

In [149]:
"a" or False      # "a" est converti en True lors de la comparaison

'a'

In [150]:
x=0
print(x and 3>2)    # 0 est converti en False lors de la comparaison
print(x or 3>2)

0
True


## 3.6 Type *float*

Contrairement aux entiers, il est impossible de représenter informatiquement tous les réels sur un intervalle donné. Tous les langages informatiques se basent donc sur une représentation bien spécifique qui permet de repésenter certains nombres réels : la représentation à virgule flottante (floating point numbers).<br/>
    Pour passer en type float, on utilise la fonction float :

In [151]:
x=1234
print(x)               # type int
print(float(x))        # type float

1234
1234.0


Lors d'opérations arithmétiques, la conversion vers le type float se fait automatiquement si besoin :

In [152]:
8/3       # la division de 2 entiers (type int) donne un réél (type float)

2.6666666666666665

In [153]:
np.sqrt(4)     # la réponse est de type float

2.0

Il faut toutefois faire la conversion manuellement dans certains cas spécifiques d'arithmetic overflow, comme mentionné à la section 3.4.

Le plus grand nombre réel et le plus petit nombre réel représentables (en valeur absolue) sont

In [154]:
sys.float_info.max

1.7976931348623157e+308

In [155]:
sys.float_info.min

2.2250738585072014e-308

Au delà de ce maximum, les nombres sont considérés comme *infinis* :

In [156]:
2*sys.float_info.max

inf

Les 2 "nombres" spéciaux sont nan (not a number) et l'infini :

In [157]:
float('inf')

inf

In [158]:
float('nan')

nan

nan est le résultat d'opérations *exotiques*, par exemple lorsqu'on calcule $\infty-\infty$ ou $0/0$ dans des tableaux numpy :

In [159]:
float('inf')-float('inf')

nan

In [160]:
x=np.array([[0.]])
y=np.array([[0.]])
print((x/y))

[[nan]]


  print((x/y))


## 3.7 Type *complex*

Lcomplexes sont représentés sous forme rectangulaire *a+bj*, où a = partie réelle (type float) et b = partie imaginaire (type float). Les entiers sont automatiquements convertis en float : 

In [161]:
z=3+4j
print(z)
print(z.real)             # partie réelle (type float)
print(z.imag)             # partie imaginaire (type float)
print(abs(z))             # module
print(z.conjugate())      # conjugué
print(np.conjugate(z))    # autre façon pour le conjugué

(3+4j)
3.0
4.0
5.0
(3-4j)
(3-4j)


## 3.8 Type *str* : Chaines de caractères

## Syntaxe de base

Les chaines de caractères (string) sont des valeurs textuelles entourées par des guillemets. Plusieurs choix sont possibles :

In [162]:
x='Hello'         # Guillemets simples (en apostrophe)
print(x)
x="Hello"         # Guillemets doubles 
print(x)
x='''Hello'''     # 3 guillemets simples
print(x)
x="""Hello"""     # 3 guillemets doubles
print(x)

Hello
Hello
Hello
Hello


L'usage des guillemets simples versus double est utile lorsque le texte contient déjà des guillemets :

In [163]:
print("C'est l'été !")

C'est l'été !


Si on avait encadré cette expression par des guillemets simples '...' on aurait eu une erreur car l'apostrophe après le C ferme alors la chaine de caractères. 

De même :

In [164]:
print('Jules César a dit : "alea jacta est"')

Jules César a dit : "alea jacta est"


Les triples guillemets permettent d'écrire des chaines sur plusieurs lignes, chaines qui peuvent contenir des guillemets "..." ou '...'. On les utilise notamment pour commenter des fonctions ; dans ce cas, la chaine de caractère est à placer directement sous l'instruction `def`, et on y accède depuis l'extérieur de la fonction via `help` :

In [165]:
def f(x) : 
    """Fonction qui calcule la racine carrée du sinus de x
        Les valeurs admises de x sont imposées par une étude du domaine :
        x appartient à [k*2*pi,k*2*pi+pi], pour tout k entier. 
        """
    return np.sqrt(np.sin(x))
    
help(f)

Help on function f in module __main__:

f(x)
    Fonction qui calcule la racine carrée du sinus de x
    Les valeurs admises de x sont imposées par une étude du domaine :
    x appartient à [k*2*pi,k*2*pi+pi], pour tout k entier.



## Séquences d'échappement

|Séquence|Signification|
|-|-|
|\\|Saut de ligne ignoré|
|\\ \\|Caractère backslash|
|\\'|Apostrophe|
|\\"|Guillemet|
|\b|Retour arrière d'un caractère|
|\\n|Saut de ligne|
|\r|Retour en début de ligne|
|\t|tabulation horizontale|

In [167]:
print("""Salut toi\
 qui me lit""")

Salut toi qui me lit


In [168]:
print("Ceci est un backslash : \\")

Ceci est un backslash : \


In [169]:
print('C\'est l\'été !')

C'est l'été !


In [170]:
print("Regarde bien la dernière lettrz\b")
print("Regarde bien la dernière lettrz\be")

Regarde bien la dernière lettrz
Regarde bien la dernière lettrze


In [171]:
print("Et je passe à la ligne\n suivante")

Et je passe à la ligne
 suivante


In [172]:
print("Et je passe à la ligne\nsuivante")

Et je passe à la ligne
suivante


In [173]:
print("Lis bien\r ceci")

Lis bien ceci


In [174]:
print("Ce sont 3 tabulations\t\t\t horizontales")

Ce sont 3 tabulations			 horizontales


## Fonction, méthodes et opérations usuelles

#### Les bases

In [175]:
len("Hi you!")    # Longueur chaine (nombre de caractères)

7

In [176]:
"Hi"+" "+"you!"  # Concaténation (mise bout à bout de chaines)

'Hi you!'

In [177]:
"Hey "*4         # Répétition

'Hey Hey Hey Hey '

In [178]:
"tho" in "Python"     # Appartenance de "tho" dans le mot "Python"

True

In [179]:
"p" in "Python"

False

In [180]:
"P" in "Python"

True

In [181]:
"Pyon" in "Python"

False

#### Méthodes renvoyant une nouvelle chaine

In [182]:
"HeLLo".lower()   # met tous les caractères en minuscule

'hello'

In [183]:
"HeLLo".upper()   # met tous les caractères en majuscule

'HELLO'

In [184]:
"HeLLo".swapcase()   # minuscule devient majuscule et inversément

'hEllO'

In [185]:
"     mathématiques   ".lstrip()     # Suppression des espaces en début de chaine

'mathématiques   '

In [186]:
"     mathématiques   ".rstrip()     # Suppression des espaces en fin de chaine

'     mathématiques'

In [187]:
txt=",,,,,ssaaww.....banana"
txt.lstrip(",.asw")                   # Suppression des caractères en tête, tels que spécifiés

'banana'

In [188]:
"mathématiques".center(33,'*')       # centrer la chaine sur 33 caractères 

'**********mathématiques**********'

In [189]:
"Le petit prince".replace('petit','grand')     # Remplacement 

'Le grand prince'

In [190]:
"Jacouille la       fripouille".split()       # Découpe la chaine

['Jacouille', 'la', 'fripouille']

In [191]:
"Jacouille*la*fripouille".split('*')    # Découpe la chaine, séparateur à sépcifier si autre chiose que des espaces

['Jacouille', 'la', 'fripouille']

#### Méthodes de test de l'état d'une chaine

In [192]:
"CECI EST EN MAJUSCULE".isupper()      # islower() existe aussi

True

In [193]:
"CECI n'EST pas TOTALEMENT EN MAJUSCULE".isupper()

False

In [194]:
"Cecinecontientquedeslettres".isalpha()    # vrai si ne contient que des lettres

True

In [195]:
"Ceci ne contient que des lettres et des epaces".isalpha()

False

In [196]:
"12345".isdigit()     # vrai si ne contient que des chiffres

True

In [197]:
"Mathématiques".startswith("Math")        # Vrai si commence par...    # endswith existe aussi

True

#### Méthodes renvoyant un indice

Aide en ligne : 
- Méthode find : https://www.w3schools.com/python/ref_string_find.asp
- Méthode rfind : https://www.w3schools.com/python/ref_string_rfind.asp

In [198]:
"Mathématiques".find("a")       # position du premier "a" en démarrant de la gauche (rappel : les indices commencent à 0)

1

In [199]:
"Mathématiques".find("t")      

2

In [200]:
"Mathématiques".rfind("a")       # position du premier "a" en démarrant de la droite

6

In [201]:
"Mathématiques".find("z")         # "z" non trouvé => -1

-1

#### Voyager dans une chaine de caractères

In [202]:
x="Mathématiques"
print(x[0])
print(x[1])
print(x[-1])      # Dernier indice
print(x[-2])
print(x[0:3])     # indices 0 à 2
print(x[:3])      # Idem
print(x[3:])      # De l'indice 3 à la fin
print(x[4:9:2])   # Indices 4 à 8 par pas de 2
print(x[::3])     # Une lettre sur 3, de gauche à droite
print(x[::-1])    # En sens inverse

M
a
s
e
Mat
Mat
hématiques
éai
Mhaqs
seuqitaméhtaM
