# P2. Exploration Python

Le répertoire `/data` contient les résultats brutes des épreuves des jeux d'été et d'hiver pour une période donnée.

On s'intéresse dans le cadre de cette partie P2 à l'exploration des résultats des JO d'été (fichier : `summer-olympics.csv`) en s'appuyant sur le langage Python (standard library seulement).


---

## Préliminaire: Chargement des données
Le code fourni ci-dessous permet de charger en mémoire le fichier de données `summer-olympics.csv` dans la variable `data`

In [1]:
import csv
import time

filename = 'data/summer-olympics.csv'

ts = time.time()

data = []
with open(filename, newline="",encoding='utf-8') as csvfile:
    reader = csv.DictReader(csvfile, delimiter=',')
    for row in reader:
        data.append(row)
n_items = len(data)

te = time.time()
        
print(f"{filename} loaded into data ({n_items} items)")
print(f"done in {te - ts:.2f} s.")


data/summer-olympics.csv loaded into data (31165 items)
done in 0.33 s.


### Question 0: Où trouver la documentation du module `csv` ? de la fonction `csv.DictReader` ? 

In [None]:
https://docs.python.org/fr/3/library/csv.html

In [None]:
help(csv)

In [None]:
help(csv.DictReader)

---
### Question 1: Quel est le type de la variable `data`? 

In [9]:
type(data)

list

### Question 2: Combien d'éléments contient la variable `data` ? 

In [None]:
31165

### Question 2: Quel est le premier élément de `data` ? 

In [12]:
data[0]

{'Year': '1896',
 'City': 'Athens',
 'Sport': 'Aquatics',
 'Discipline': 'Swimming',
 'Athlete': 'HAJOS, Alfred',
 'Country': 'HUN',
 'Gender': 'Men',
 'Event': '100M Freestyle',
 'Medal': 'Gold'}

### Question 3: Quel est le dernier élément de data ? 

In [18]:
data[31164]

{'Year': '2012',
 'City': 'London',
 'Sport': 'Wrestling',
 'Discipline': 'Wrestling Freestyle',
 'Athlete': 'LIDBERG, Jimmy',
 'Country': 'SWE',
 'Gender': 'Men',
 'Event': 'Wg 96 KG',
 'Medal': 'Bronze'}

In [19]:
data[-1]

{'Year': '2012',
 'City': 'London',
 'Sport': 'Wrestling',
 'Discipline': 'Wrestling Freestyle',
 'Athlete': 'LIDBERG, Jimmy',
 'Country': 'SWE',
 'Gender': 'Men',
 'Event': 'Wg 96 KG',
 'Medal': 'Bronze'}

---
#### On définit la variable sample de la façon suivante :

In [9]:
sample = data[25215]

In [10]:
sample

{'Year': '2004',
 'City': 'Athens',
 'Sport': 'Aquatics',
 'Discipline': 'Swimming',
 'Athlete': 'MANAUDOU, Laure',
 'Country': 'FRA',
 'Gender': 'Women',
 'Event': '100M Backstroke',
 'Medal': 'Bronze'}

### Question 4: Que représente la variable `sample` ? 

In [11]:
data[25215]

{'Year': '2004',
 'City': 'Athens',
 'Sport': 'Aquatics',
 'Discipline': 'Swimming',
 'Athlete': 'MANAUDOU, Laure',
 'Country': 'FRA',
 'Gender': 'Women',
 'Event': '100M Backstroke',
 'Medal': 'Bronze'}

### Question 5: Quel est le type de la variable `sample` ? 

In [12]:
type(sample)

dict

### Question 6: De quel sport / discipline / compétition (Event) est-il question  ? 

In [14]:
sample["Sport"]

'Aquatics'

In [15]:
sample["Discipline"]

'Swimming'

In [16]:
sample["Event"]

'100M Backstroke'

Dict / Dictionnaire : collection d'infos par key / valeur (un peu similaire avec JSON)

### Q1. Combien la France a remporté de médailles d'or aux JO de 1984 ? 

In [20]:
type(data)

list

In [22]:
type(data[0])

dict

In [56]:
selection = []                                                                   #création d'une liste vide appelée 'selection'
for e in data:                                                                   #Pour chaque élément de data
    if e['Year'] == '1984' and e['Country'] == 'FRA' and e['Medal'] == 'Gold':   #conditions
        selection.append(e)                                                      #append : ajouter l'objet e à la liste 'sélection'
len(selection)                                                                   #

21

### Q2. En 2012 combien de médailles le Japon a t-il gagné ? 

In [45]:
medals_japon = []
for e in data:
    if e['Year'] == '2012' and e['Country'] == 'JPN':
        medals_japon.append(e)
len(medals_japon)

84

### Q3. Combien de femmes françaises ont participé en 2012 ?

In [3]:
french_women_2012 = []
for e in data:
    if e['Year'] == '2012' and e['Gender'] == 'Women' and e['Country'] == 'FRA':
        french_women_2012.append(e)
len(french_women_2012)

31

### Q4. Le nombre de médailles d'or par pays en 2012

In [None]:
Important ici et nouveauté à ce stade: notion de fonction

In [57]:
#Calculer le nb de médailles d'Or gagné par un pays donné 'country' lors d'une olympiade donnée 'year'
def calcul_nb_medailles(country, year):
    selection = []
    for e in data:
        if e['Year'] == 'year' and e['Country'] == 'country' and e['Medal'] == 'Gold':
            selection.append(e)
    reponse = len(selection)
    print(year, country, reponse)
    
    return reponse

In [60]:
calcul_nb_medailles('FRA', '1984')

In [61]:
liste_pays = ['FRA', 'USA', 'GER', 'DEN', 'GRE']

In [66]:
for pays in liste_pays:
    calcul_nb_medailles(pays, '2012')

In [53]:
liste_gold_2012 = []
for e in data:
    if e['Medal'] == 'Gold' and e['Year'] == '2012':
        liste_gold_2012.append(e)
len(gold_medals)

636

In [5]:
# Ensuite, à partir de la première sélection,
# rechercher tous les pays présents et ajouter
# cela dans la liste "liste_pays"
liste_pays = []
for e in data :
    if e["Country"] not in liste_pays:
        liste_pays.append(e["Country"])
len(liste_pays)

148

liste_pays_unique = set(liste_pays)
len(liste_pays_unique)

### Q5. Combien de fois Londres a accueilli les JO ?

In [77]:
ListeLondres = []
for e in data:
    if e['City'] == "London":
        ListeLondres.append(e)
len(ListeLondres)

3567

In [81]:
AnnéesLondres = []
for e in ListeLondres:
    if e['Year'] not in AnnéesLondres:
        AnnéesLondres.append(e['Year'])
len(AnnéesLondres)

3

--- 

### Q10. Combien de joueuses comptait la sélection brésilienne de volley-ball médaillée d’or aux J.O de 2012 ? 

Fin

In [82]:
Volley_brazil_2012 = []
for e in data:
    if e['Country'] == 'BRA' and e['Sport'] == 'Volleyball' and e['Year'] == '2012' and e['Medal'] == 'Gold':
        Volley_brazil_2012.append(e)
len(Volley_brazil_2012)

12