#  Consignes

## Description

Ouvrir le fichier ks-projects-201801.csv, il recense environ 100 000 projets KickStarter. Intégrer les données directement avec L'API Python dans une base de données Mongo. 

Il conviendra de bien spécifier manuellement l'ID du document. Pensez aussi à bien formatter le type des données pour profiter des méthodes implémentées par Mongo. L'ensemble de données n'est pas forcément nécessaire, c'est à vous de créer votre modèle de données.

## Questions

- 1) Récupérer les 5 projets ayant reçu le plus de promesse de dons.
- 2) Compter le nombre de projets ayant atteint leur but.
- 3) Compter le nombre de projets pour chaque catégorie.
- 4) Compter le nombre de projets français ayant été instanciés avant 2016.
- 5) Récupérer les projets américains ayant demandé plus de 200 000 dollars.
- 6) Compter le nombre de projet ayant "Sport" dans leur nom

In [2]:
import pandas as pd
import pymongo

In [3]:
client = pymongo.MongoClient()
database = client['exercices']
collection = database['kickstarter']

In [4]:
df_ks = pd.read_csv("./data/ks-projects-201801-sample.csv")
df_ks.head()

  interactivity=interactivity, compiler=compiler, result=result)


Unnamed: 0,ID,name,category,main_category,currency,deadline,goal,launched,pledged,state,backers,country,usd pledged,usd_pledged_real
0,872782264,"Scott Cooper's Solo CD ""A Leg Trick"" (Canceled)",Rock,Music,USD,2011-09-16,2000,2011-08-17 06:31:31,1145,canceled,24,US,1145.0,1145.0
1,1326492673,Ohceola jewelry,Fashion,Fashion,USD,2012-08-22,18000,2012-07-23 20:46:48,1851,failed,28,US,1851.0,1851.0
2,1688410639,Sluff Off & Harald: Two latest EGGs are Classi...,Tabletop Games,Games,USD,2016-07-19,2000,2016-07-01 21:55:54,7534,successful,254,US,3796.0,7534.0
3,156812982,SketchPlanner: Create and Plan- all in one bea...,Art Books,Publishing,USD,2017-09-27,13000,2017-08-28 15:47:02,16298,successful,367,US,2670.0,16298.0
4,1835968190,Proven sales with custom motorcycle accessories,Sculpture,Art,CAD,2016-02-24,5000,2016-01-25 17:37:10,1,failed,1,CA,0.708148,0.738225


Ce warning intervient lorsque pandas n'arrive pas à inférer le type de données. Il est sympa il précise les colones 6,8,10,12. 

In [5]:
df_ks.columns[[6,8,10,12]]

Index(['goal', 'pledged', 'backers', 'usd pledged'], dtype='object')

## Question 0

### Netoyer les données

In [12]:
df_ks['launched'] = pd.to_datetime(df_ks['launched'], errors='coerce')
df_ks = df_ks.dropna(subset=['launched'])
df_ks.rename(columns={'ID':'_id'}, inplace=True)
l_d =df_ks.to_dict(orient='records')

### Importer les données

In [None]:
from pymongo import MongoClient
client = MongoClient("mongo:27017")
bdd_bellifa_ks = client.ks
bellifa_collection_ks = bdd_bellifa_ks['ADBEL-ILLAH']
bellifa_collection_ks.insert_many(l_d)

## Question 1  

In [14]:
request = bellifa_collection_ks.find().limit(5).sort([("usd_pledged_real", -1)])
for data in request:
    print(data)

{'_id': 342886736, 'name': "COOLEST COOLER: 21st Century Cooler that's Actually Cooler", 'category': 'Product Design', 'main_category': 'Design', 'currency': 'USD', 'deadline': '2014-08-30', 'goal': '50000.0', 'launched': datetime.datetime(2014, 7, 8, 10, 14, 37), 'pledged': '13285226.36', 'state': 'successful', 'backers': '62642', 'country': 'US', 'usd pledged': '13285226.36', 'usd_pledged_real': 13285226.36}
{'_id': 2103598555, 'name': 'Pebble 2, Time 2 + All-New Pebble Core', 'category': 'Product Design', 'main_category': 'Design', 'currency': 'USD', 'deadline': '2016-06-30', 'goal': '1000000.0', 'launched': datetime.datetime(2016, 5, 24, 15, 49, 52), 'pledged': '12779843.49', 'state': 'successful', 'backers': '66673', 'country': 'US', 'usd pledged': '12779843.49', 'usd_pledged_real': 12779843.49}
{'_id': 1033978702, 'name': 'OUYA: A New Kind of Video Game Console', 'category': 'Gaming Hardware', 'main_category': 'Games', 'currency': 'USD', 'deadline': '2012-08-09', 'goal': '950000.

## Question 2

In [15]:
request = bellifa_collection_ks.find({"$expr":{"$gte":["$pledged", "$goal"]}})
request.count()

67244

## Question 3

In [24]:
request = bellifa_collection_ks.aggregate([{"$group": {"_id" : "$category", "nombre_de_projet" : {"$sum" : 1}}}])
list(request)

[{'_id': 'Nonfiction', 'nombre_de_projet': 3390},
 {'_id': 'Video Art', 'nombre_de_projet': 65},
 {'_id': 'Young Adult', 'nombre_de_projet': 328},
 {'_id': 'R&B', 'nombre_de_projet': 172},
 {'_id': 'Embroidery', 'nombre_de_projet': 49},
 {'_id': 'Narrative Film', 'nombre_de_projet': 2099},
 {'_id': 'Food Trucks', 'nombre_de_projet': 687},
 {'_id': '3D Printing', 'nombre_de_projet': 271},
 {'_id': 'Webcomics', 'nombre_de_projet': 259},
 {'_id': 'Hardware', 'nombre_de_projet': 1431},
 {'_id': 'Fashion', 'nombre_de_projet': 3379},
 {'_id': 'Jewelry', 'nombre_de_projet': 472},
 {'_id': 'Textiles', 'nombre_de_projet': 105},
 {'_id': 'Radio & Podcasts', 'nombre_de_projet': 349},
 {'_id': 'Literary Journals', 'nombre_de_projet': 118},
 {'_id': 'Experimental', 'nombre_de_projet': 357},
 {'_id': 'Small Batch', 'nombre_de_projet': 701},
 {'_id': 'Games', 'nombre_de_projet': 1331},
 {'_id': 'Chiptune', 'nombre_de_projet': 10},
 {'_id': 'Pop', 'nombre_de_projet': 1302},
 {'_id': 'Comic Books', 'no

## Question 4

In [39]:
from datetime import datetime
date = datetime.strptime("2016-01-01",'%Y-%m-%d')
request = bellifa_collection_ks.find({"$and":[{'country':'FR'}, {'launched':{'$lt':date}}]})
request.count()

330

## Question 5

In [40]:
request = bellifa_collection_ks.find({"$and":[{'country':'US'}, {'usd_pledged_real':{'$gte':200000}}]})
request.count()
next(request)


{'_id': 217543389,
 'name': 'The uKeg Pressurized Growler for Fresh Beer',
 'category': 'Drinks',
 'main_category': 'Food',
 'currency': 'USD',
 'deadline': '2014-12-08',
 'goal': 75000.0,
 'launched': datetime.datetime(2014, 10, 15, 6, 34, 48),
 'pledged': 1559525.68,
 'state': 'successful',
 'backers': 10293,
 'country': 'US',
 'usd pledged': 1559525.68,
 'usd_pledged_real': 1559525.68}

## Question 6 

In [45]:
bellifa_collection_ks.create_index([("name", "text")])
request = bellifa_collection_ks.find({"$text": {"$search": "sport"}})
list(request)

[{'_id': 1875366029,
  'name': 'Sport Smart. A New Genre of Sports TV. Sport Fans Unite!!!',
  'category': 'Webseries',
  'main_category': 'Film & Video',
  'currency': 'USD',
  'deadline': '2011-01-15',
  'goal': 4500.0,
  'launched': datetime.datetime(2010, 12, 16, 8, 40, 2),
  'pledged': 25.0,
  'state': 'failed',
  'backers': 1,
  'country': 'US',
  'usd pledged': 25.0,
  'usd_pledged_real': 25.0},
 {'_id': 1126822169,
  'name': 'Frey Sports App - We connect sports people.',
  'category': 'Apps',
  'main_category': 'Technology',
  'currency': 'DKK',
  'deadline': '2017-01-11',
  'goal': 25000.0,
  'launched': datetime.datetime(2016, 12, 12, 11, 30, 28),
  'pledged': 0.0,
  'state': 'failed',
  'backers': 0,
  'country': 'DK',
  'usd pledged': 0.0,
  'usd_pledged_real': 0.0},
 {'_id': 1081541783,
  'name': 'Daily Fantasy Sports | Sports Analytics Platform | DFS',
  'category': 'Web',
  'main_category': 'Technology',
  'currency': 'USD',
  'deadline': '2017-12-09',
  'goal': 33750.0,