# Améliorez le produit IA de votre start-up

## Analyser les commentaires pour détecter les différents sujets d’insatisfaction

## Importer sur API  Yelp les avis clients des restaurants de Londres

### Importer la librairie

In [1]:
import numpy as np
import pandas as pd
from gql import gql, Client
from gql.transport.requests import RequestsHTTPTransport
import json
import csv
from string import Template

In [2]:
import warnings
warnings.filterwarnings("ignore", category=DeprecationWarning)

 ### Importation des données en provenance de l'API Yelp

In [3]:
class YelpApi:
    """
    Use Yelp API to retrieve restaurants reviews.
    This script use GRAPH SQL
    """

    def __init__(self):
        """
        Init class
        """
        self.client = None
        self.restaurants = []
        self.create_client()

    def create_client(self):
        """
        Yelp API client
        """
        reqHeaders = {
            'Authorization': 'Bearer yDUmIlP0QiOCd8Yn4TcnQxv3Gow2S7bVB2IRJJ4Ekn8ZrdI3w0hEkFpSXjCW1YPmxTgcLs8P-pUbmnQvF5kVMpVO6pQDjZ-ExPB5TJ10RHqX3Lk1CMSvt8pYNz6oYXYx'
        }

        _transport = RequestsHTTPTransport(
            url="https://api.yelp.com/v3/graphql",
            headers=reqHeaders,
            use_json=True,
        )

        self.client = Client(
            transport=_transport,
            fetch_schema_from_transport=True,
        )

    def query_gql_location(self, location, limit=50, offset=0):
        """
        Request restaurant name's and review (limit to 3 by Yelp) 
        Arguments:
            location {string} -- city name

        Keyword Arguments:
            limit {int} -- Number of record to retreive - max 50 (default: {50})
            offset {int} -- Offset (default: {0})
        """        """
       
        """
        queryTemplate = Template(
            """
            {
                search(
                    term: "restaurants", 
                    location: "$location", 
                    categories:"restaurants", 
                    limit:$limit, 
                    offset:$offset                    
                ){
                    total,                    
                        business {
                            name
                            id                        
                        reviews(limit: 50){
                            text
                            rating
                        }
                    }
                }
            }
            """
        )
        query = queryTemplate.substitute(location=location, limit=limit, offset=offset)
        request = gql(query)
        result = self.client.execute(request)
        for restaurant in result['search']['business']:
            self.restaurants.append(restaurant)

    def get_restaurants(self, location, count=50):
        """
        Get restaurants and reviews information

        Arguments:
            location {string} -- city

        Keyword Arguments:
            count {int} -- Number of restaurant (default: {50})
        """

        max_count = 50
        counter = int(count / max_count)
        modulo = count % max_count
        offset = 0
        for count_restaurant in range(counter):
            self.query_gql_location(location, max_count, offset)
            offset += max_count
        if modulo > 0:
            self.query_gql_location(location, modulo, offset)

    def to_csv(self, file):
        """
        Save review as CSV :
            text,score

        Arguments:
            file {string} -- Filename
        """
        start= 1
        with open(file, "w", newline="", encoding="utf-8") as csv_file:
            for restaurant in self.restaurants:
                for review in restaurant['reviews']:
                    wr = csv.writer(csv_file, quoting=csv.QUOTE_ALL)
                    if start == 1:
                        wr.writerow(['text', 'stars'])
                        start = 2
                    wr.writerow([review['text'].replace("\n", ""), review['rating']])

### Importation

In [4]:
yelp = YelpApi()

In [5]:
data_dir = "C:/Users/JK253/Documents/Ingenieur IA/P6/"

In [6]:
## ICi il faut definir data dir qui le repertoire ou tu veux mettre les données 
yelp.get_restaurants("London", 700)
yelp.to_csv(data_dir + 'P6_01_fichiercsv_01.csv')

### Transformation des données reçues en dataFrame

In [7]:
new_df = pd.read_csv(data_dir + 'P6_01_fichiercsv_01.csv')
new_df.head()

Unnamed: 0,text,stars
0,This place was awesome for lunch. We shared a ...,5
1,Absolutely the best Fish and Chips in London. ...,5
2,Enjoyed all our starters and the traditional f...,4
3,"Amazing, I was shocked at how delicious this p...",5
4,I really hate to say OMG because I'm really to...,5


**Pour répondre à la problématique, Pas assez de données avis clients sur la plateforme Avis Restau, j’ai commencé mon projet en collectant les informations relatives à environ 2032 restaurants pour la ville de Londres en utilisant l’API Yelp. Pour se faire j’ai du créer un compte sur API Yelp, mais aussi une application tout en m’inscrivant sur la version beta du développeur. Tout cela ma permis d’avoir accès à 2 variables fixes comportant l’identité du client et la clé API qui m’a permis d’effectuer sur mon notebook une requête graphql pour extraire uniquement les avis des clients au sujets des restaurants de Londre. De plus pour pouvoir l’utiliser j’ai défini le répertoire, transformé les données en fichier csv et sauvegarder le fichier en le nommant P6_01_fichiercsv_01.csv.**