# PROJET: Liste des matchs de l'équipe de France de 1904 à juin 2018

## Aïmen Zemzi / Ryan Daoud

Bienvenue sur notre jeu de données, la France est considérée comme l'une des meilleures nations de football, en atteste ces deux étoiles remportées en 1998 et en 2018.
C'est pour cela que nous avons décidé de lister tous les matchs de l'équipe de France de 1904 (sa date de création) à juin 2018.

Mais avant de vous montrer des données intéressantes que vous pourrez manipuler. Il est nécessaire d'effectuer quelques opérations, d'abord il faut importer les librairies ci dessous qui nous permettrons d'extraire des données spécifiques. 

In [1]:
import numpy as np
import pandas as pd
import pymongo
import datetime

### Connexion à la base de données

In [2]:
client = pymongo.MongoClient("mongodb://test:ryan1999@cluster0-shard-00-00.rcdsg.mongodb.net:27017,cluster0-shard-00-01.rcdsg.mongodb.net:27017,cluster0-shard-00-02.rcdsg.mongodb.net:27017/myFirstDatabase?ssl=true&replicaSet=atlas-b2l3g1-shard-0&authSource=admin&w=majority")
database = client['exercices']
collection = database['projet']

### Afficher la table

In [3]:
df_foot = pd.read_csv("./data/df_matches.csv", encoding = "ISO-8859-1")
df_foot.head(2)

Unnamed: 0,X2,X4,X5,X6,adversaire,score_france,score_adversaire,penalty_france,penalty_adversaire,date,year,outcome,no
0,1er mai 1904,Belgique - France,3-3,Match amical,Belgique,3,3,,,1904-05-01,1904.0,draw,1
1,12 fÃ©vrier 1905,France - Suisse,1-0,Match amical,Suisse,1,0,,,1905-02-12,1905.0,win,1


### Nettoyer les données

In [4]:
df_foot.rename(columns={'X2':'full_date'}, inplace=True)
df_foot.rename(columns={'X4':'match'}, inplace=True)
df_foot.rename(columns={'X5':'score'}, inplace=True)
df_foot.rename(columns={'X6':'type'}, inplace=True)
df_foot['date'] = pd.to_datetime(df_foot['date'], errors='coerce')
df_foot = df_foot.dropna(subset=['date'])
df_foot = df_foot.drop_duplicates(subset='date', keep='last')
l_d = df_foot.to_dict(orient='records')
for elt in l_d:
    for k,v in elt.items():
        if v == np.NaN:
            del elt[k]

### Importer les données 

In [5]:
collection.delete_many({})
collection.insert_many(l_d)

<pymongo.results.InsertManyResult at 0x7fdb97fffd88>

Une fois ces opérations effectuées, nous pouvons nous amuser et en savoir plus sur l'équipe de France. Nous avons évoqué précedemment que la France était l'une des meilleures nations de football et cette première reqûete nous le confirme. 

In [27]:
req = collection.find({"outcome":"win"})
print(req.count())
req_two = collection.find({"outcome":"draw"})
print(req_two.count())
req_three = collection.find({"outcome":"loss"})
print(req_three.count())


408
177
250


En sachant que la France comptabilisait 408 victoires en juin 2018. Cela fait un ratio de victoire presque égale à 48% qui contrairement aux apparences est un très bon résultat.

Maintenant reste à savoir, contre qui la France a performé ou non, pour cela voici une requête qui nous permet de lister toutes les rencontres contre une séléction nationale (Belgique dans l'exemple ci-dessous).

In [6]:
query = collection.find({"adversaire":"Belgique"})
list(query)

[{'_id': ObjectId('602f75651f9c21001fe15268'),
  'full_date': '1er mai 1904',
  'match': 'Belgique - France',
  'score': '3-3',
  'type': 'Match amical',
  'adversaire': 'Belgique',
  'score_france': 3,
  'score_adversaire': 3,
  'penalty_france': nan,
  'penalty_adversaire': nan,
  'date': datetime.datetime(1904, 5, 1, 0, 0),
  'year': 1904.0,
  'outcome': 'draw',
  'no': 1},
 {'_id': ObjectId('602f75651f9c21001fe1526a'),
  'full_date': '7 mai 1905',
  'match': 'Belgique - France',
  'score': '7-0',
  'type': 'Match amical',
  'adversaire': 'Belgique',
  'score_france': 0,
  'score_adversaire': 7,
  'penalty_france': nan,
  'penalty_adversaire': nan,
  'date': datetime.datetime(1905, 5, 7, 0, 0),
  'year': 1905.0,
  'outcome': 'loss',
  'no': 2},
 {'_id': ObjectId('602f75651f9c21001fe1526b'),
  'full_date': '22 avril 1906',
  'match': 'France - Belgique',
  'score': '0-5',
  'type': 'Match amical',
  'adversaire': 'Belgique',
  'score_france': 0,
  'score_adversaire': 5,
  'penalty_fr

Dans le cas où seulement un époque précise vous intéresse, vous pouvez mettre une date de début et de fin comme dans la reqûete ci-dessous.

In [25]:
from_date = datetime.datetime(2010, 12, 31, 0, 0, 0)
to_date = datetime.datetime(2018, 12, 31, 23, 59, 59)
for post in collection.find({"$and": [{"adversaire":"Angleterre"}, {"date": {"$gte": from_date, "$lt": to_date}}]}):
    print(post)

{'_id': ObjectId('602f75651f9c21001fe15558'), 'full_date': '11 juin 2012', 'match': 'France - Angleterre', 'score': '1-1', 'type': 'Euro 2012 (Groupe D)', 'adversaire': 'Angleterre', 'score_france': 1, 'score_adversaire': 1, 'penalty_france': nan, 'penalty_adversaire': nan, 'date': datetime.datetime(2012, 6, 11, 0, 0), 'year': 2012.0, 'outcome': 'draw', 'no': 5}
{'_id': ObjectId('602f75651f9c21001fe15586'), 'full_date': '17 novembre 2015', 'match': 'Angleterre - France', 'score': '2-0', 'type': 'Match amical', 'adversaire': 'Angleterre', 'score_france': 0, 'score_adversaire': 2, 'penalty_france': nan, 'penalty_adversaire': nan, 'date': datetime.datetime(2015, 11, 17, 0, 0), 'year': 2015.0, 'outcome': 'loss', 'no': 10}
{'_id': ObjectId('602f75651f9c21001fe1559c'), 'full_date': '13 juin 2017', 'match': 'France - Angleterre', 'score': '3-2', 'type': 'Match amical', 'adversaire': 'Angleterre', 'score_france': 3, 'score_adversaire': 2, 'penalty_france': nan, 'penalty_adversaire': nan, 'date

Vous avez également la possibilité de voir la moyenne de nombre de buts marqués par adversaire ainsi que la moyenne de nombre de buts encaissés par adversaire afin de vous faire une idée sur qui a plus ou moins donné du fil à retordre aux bleux. 

#### Nombres de buts marqués par adversaire

In [32]:
query = collection.aggregate([{"$group" : {"_id" : "$adversaire", "oppositions_number" : {"$sum" : 1} ,"average_goals_per_game" : {"$avg" : "$score_france"}}}, {"$sort" : { "average_goals_per_game" : -1 }}])
list(query)

[{'_id': 'JamaÃ¯que', 'oppositions_number': 1, 'average_goals_per_game': 8.0},
 {'_id': 'Lettonie', 'oppositions_number': 1, 'average_goals_per_game': 7.0},
 {'_id': 'AzerbaÃ¯djan',
  'oppositions_number': 2,
  'average_goals_per_game': 6.0},
 {'_id': 'Malte', 'oppositions_number': 2, 'average_goals_per_game': 5.0},
 {'_id': 'Nouvelle-ZÃ©lande',
  'oppositions_number': 1,
  'average_goals_per_game': 5.0},
 {'_id': 'Ã\x89gypte', 'oppositions_number': 1, 'average_goals_per_game': 5.0},
 {'_id': 'CONCACAF', 'oppositions_number': 1, 'average_goals_per_game': 5.0},
 {'_id': 'SÃ©lection FIFA',
  'oppositions_number': 1,
  'average_goals_per_game': 5.0},
 {'_id': 'Arabie saoudite',
  'oppositions_number': 1,
  'average_goals_per_game': 4.0},
 {'_id': 'Estonie', 'oppositions_number': 1, 'average_goals_per_game': 4.0},
 {'_id': 'AlgÃ©rie', 'oppositions_number': 1, 'average_goals_per_game': 4.0},
 {'_id': 'Luxembourg',
  'oppositions_number': 18,
  'average_goals_per_game': 3.9444444444444446},


#### Nombres de buts encaissés par adversaire

In [33]:
query = collection.aggregate([{"$group" : {"_id" : "$adversaire", "oppositions_number" : {"$sum" : 1} , "average_goals_per_game" : {"$avg" : "$score_adversaire"}}}, {"$sort" : { "average_goals_per_game" : -1 }}])
list(query)

[{'_id': 'AzerbaÃ¯djan',
  'oppositions_number': 2,
  'average_goals_per_game': 5.0},
 {'_id': 'Angleterre',
  'oppositions_number': 41,
  'average_goals_per_game': 2.707317073170732},
 {'_id': 'Belgique',
  'oppositions_number': 73,
  'average_goals_per_game': 2.191780821917808},
 {'_id': 'Italie',
  'oppositions_number': 38,
  'average_goals_per_game': 2.1578947368421053},
 {'_id': 'Hongrie',
  'oppositions_number': 22,
  'average_goals_per_game': 2.1363636363636362},
 {'_id': 'Pays-Bas',
  'oppositions_number': 26,
  'average_goals_per_game': 2.0384615384615383},
 {'_id': 'Royaume des\nSerbes, Croates et SlovÃ¨nes',
  'oppositions_number': 2,
  'average_goals_per_game': 2.0},
 {'_id': 'RFA',
  'oppositions_number': 15,
  'average_goals_per_game': 1.9333333333333333},
 {'_id': 'Espagne', 'oppositions_number': 35, 'average_goals_per_game': 1.8},
 {'_id': 'Autriche',
  'oppositions_number': 23,
  'average_goals_per_game': 1.7391304347826086},
 {'_id': 'TchÃ©coslovaquie',
  'oppositions

Si les matchs amicaux ne vous intéressent pas comme plus de la moitié des fans de football, il est possible dans cette reqûete de filtrer par type de rencontre, dans l'exemple ci dessous nous avons mit "Coupe du monde" pour lister tous les matchs en rapport avec cette compétition. 

In [9]:
collection.create_index([("type", "text")])
query = collection.find({"$text": {'$search':'Coupe du monde'}}).sort([("year", -1)])
list(query)

[{'_id': ObjectId('602f75651f9c21001fe155aa'),
  'full_date': '26 juin 2018',
  'match': 'Danemark - France',
  'score': '0-0',
  'type': 'Coupe du monde 2018 (Groupe C)',
  'adversaire': 'Danemark',
  'score_france': 0,
  'score_adversaire': 0,
  'penalty_france': nan,
  'penalty_adversaire': nan,
  'date': datetime.datetime(2018, 6, 26, 0, 0),
  'year': 2018.0,
  'outcome': 'draw',
  'no': 8},
 {'_id': ObjectId('602f75651f9c21001fe155a9'),
  'full_date': '21 juin 2018',
  'match': 'France - PÃ©rou',
  'score': '1-0',
  'type': 'Coupe du monde 2018 (Groupe C)',
  'adversaire': 'PÃ©rou',
  'score_france': 1,
  'score_adversaire': 0,
  'penalty_france': nan,
  'penalty_adversaire': nan,
  'date': datetime.datetime(2018, 6, 21, 0, 0),
  'year': 2018.0,
  'outcome': 'win',
  'no': 7},
 {'_id': ObjectId('602f75651f9c21001fe155a8'),
  'full_date': '16 juin 2018',
  'match': 'France - Australie',
  'score': '2-1',
  'type': 'Coupe du monde 2018 (Groupe C)',
  'adversaire': 'Australie',
  'sc

La séance de tirs aux buts doit être l'un des moments où un joueur de foot ressent le plus de pression, dans cette requête vous pouvez voir si oui ou non les bleux ont réussi à la surmonter grâce à cette liste qui nous montre tous les matchs de l'équipe de france qui ont dû allé jusqu'aux tirs au buts. 

In [31]:
query = collection.find({"penalty_france": {"$ne" : np.nan}})
list(query)

[{'_id': ObjectId('602f75651f9c21001fe15409'),
  'full_date': '8 juillet 1982',
  'match': 'RFA - France [6]',
  'score': '3-3 ap(5-4) tab',
  'type': 'Coupe du monde 1982 (Demi-finale)',
  'adversaire': 'RFA',
  'score_france': 3,
  'score_adversaire': 3,
  'penalty_france': 4.0,
  'penalty_adversaire': 5.0,
  'date': datetime.datetime(1982, 7, 8, 0, 0),
  'year': 1982.0,
  'outcome': 'draw',
  'no': 11},
 {'_id': ObjectId('602f75651f9c21001fe1542d'),
  'full_date': '21 juin 1986',
  'match': 'BrÃ©sil - France',
  'score': '1-1 ap(3-4) tab',
  'type': 'Coupe du monde 1986 (Quart de finale)',
  'adversaire': 'BrÃ©sil',
  'score_france': 1,
  'score_adversaire': 1,
  'penalty_france': 4.0,
  'penalty_adversaire': 3.0,
  'date': datetime.datetime(1986, 6, 21, 0, 0),
  'year': 1986.0,
  'outcome': 'draw',
  'no': 7},
 {'_id': ObjectId('602f75651f9c21001fe15486'),
  'full_date': '22 juin 1996',
  'match': 'France - Pays-Bas',
  'score': '0-0 ap(5-4) tab',
  'type': 'Euro 1996 (Quart de fin