# Fome Zero Foods - Visão Culinaria

Neste notebook vamos explorar o dataset de restaurantes da Fome Zero Foods, respondendo a perguntas de negócios sobre o contexto da visão culinaria do dataset.

## 1. Importando bibliotecas e criando Dataframe

### 1.1 Importando bibliotecas

In [1]:
import pandas as pd
import plotly.express as px

from pathlib import Path

### 1.2 Criando Dataframe

In [2]:
# caminho do arquivo
path = Path.cwd().parent / 'data' / 'processed' / 'dataset_processed.csv'

try:
    with open(path, 'r', encoding='utf-8') as arquivo:
        df = pd.read_csv(arquivo)
except FileNotFoundError:
    print(f"Arquivo não encontrado: {path}")

In [3]:
df.head(3)

Unnamed: 0,restaurant_id,restaurant_name,country_code,city,address,locality,locality_verbose,longitude,latitude,cuisines,...,has_online_delivery,is_delivering_now,price_range,aggregate_rating,rating_color,rating_text,votes,country_name,price_type,color_name
0,6310675,Mama Lou's Italian Kitchen,162,Las Piñas City,"Block 1, Lot 36, Tropical Avenue Corner Tropic...",BF International,"BF International, Las Piñas City",121.009787,14.447615,Italian,...,0,0,3,4.6,3F7E00,Excellent,619,Philippines,expensive,darkgreen
1,6310675,Mama Lou's Italian Kitchen,162,Las Piñas City,"Block 1, Lot 36, Tropical Avenue Corner Tropic...",BF International,"BF International, Las Piñas City",121.009787,14.447615,Italian,...,0,0,3,4.6,3F7E00,Excellent,619,Philippines,expensive,darkgreen
2,6314542,Blackbird,162,Makati City,"Nielson Tower, Ayala Triangle Gardens, Salcedo...","Ayala Triangle Gardens, Salcedo Village, Makat...","Ayala Triangle Gardens, Salcedo Village, Makat...",121.024562,14.556042,European,...,0,0,4,4.7,3F7E00,Excellent,469,Philippines,gourmet,darkgreen


In [4]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7512 entries, 0 to 7511
Data columns (total 23 columns):
 #   Column                Non-Null Count  Dtype  
---  ------                --------------  -----  
 0   restaurant_id         7512 non-null   int64  
 1   restaurant_name       7512 non-null   object 
 2   country_code          7512 non-null   int64  
 3   city                  7512 non-null   object 
 4   address               7512 non-null   object 
 5   locality              7512 non-null   object 
 6   locality_verbose      7512 non-null   object 
 7   longitude             7512 non-null   float64
 8   latitude              7512 non-null   float64
 9   cuisines              7512 non-null   object 
 10  average_cost_for_two  7512 non-null   int64  
 11  currency              7512 non-null   object 
 12  has_table_booking     7512 non-null   int64  
 13  has_online_delivery   7512 non-null   int64  
 14  is_delivering_now     7512 non-null   int64  
 15  price_range          

In [5]:
# Retorna uma lista ordenada alfabeticamente
cuisines_lista = sorted(df['cuisines'].unique())

print(cuisines_lista)

['Afghan', 'African', 'American', 'Andhra', 'Arabian', 'Argentine', 'Armenian', 'Asian', 'Asian Fusion', 'Assamese', 'Australian', 'Author', 'Awadhi', 'BBQ', 'Bakery', 'Balti', 'Bar Food', 'Belgian', 'Bengali', 'Beverages', 'Biryani', 'Brazilian', 'Breakfast', 'British', 'Burger', 'Burmese', 'Cafe', 'Cafe Food', 'Cajun', 'California', 'Canadian', 'Cantonese', 'Caribbean', 'Charcoal Chicken', 'Chettinad', 'Chinese', 'Coffee', 'Coffee and Tea', 'Contemporary', 'Continental', 'Creole', 'Crepes', 'Cuban', 'Deli', 'Desserts', 'Dim Sum', 'Dimsum', 'Diner', 'Donuts', 'Drinks Only', 'Durban', 'Döner', 'Eastern European', 'Egyptian', 'European', 'Fast Food', 'Filipino', 'Finger Food', 'Fish and Chips', 'French', 'Fresh Fish', 'Fusion', 'German', 'Giblets', 'Goan', 'Gourmet Fast Food', 'Greek', 'Grill', 'Gujarati', 'Hawaiian', 'Healthy Food', 'Home-made', 'Hyderabadi', 'Ice Cream', 'Indian', 'Indonesian', 'International', 'Iranian', 'Irish', 'Italian', 'Izgara', 'Japanese', 'Juices', 'Kebab', 'K

## 2. Perguntas de Negócio

### 2.1 Dos restaurantes que possuem o tipo de culinária italiana, qual o nome do restaurante com a maior média de avaliação?

In [6]:
restaurante = (
    df.loc[df['cuisines']=='Italian', ['restaurant_name', 'aggregate_rating', 'restaurant_id']]
    .groupby('restaurant_name')
    .agg(mean_rating=('aggregate_rating', 'mean'), rest_id_min=('restaurant_id', 'min'))
    .sort_values(by=['mean_rating', 'rest_id_min'], ascending=[False, True])
    .reset_index()
)

print(f"Restaurante de culinária italiana com maior média de avaliação: {restaurante.iloc[0,0]}")

Restaurante de culinária italiana com maior média de avaliação: Cafe Del Sol Classico


### 2.2 Dos restaurantes que possuem o tipo de culinária italiana, qual o nome do restaurante com a menor média de avaliação?

In [7]:
# Filtro para selecionar somente o tipo de culinária italiana e notas válidas
filtro = (df['cuisines']=='Italian') & (df['aggregate_rating']>2)
restaurante = (
    df.loc[filtro, ['restaurant_name', 'aggregate_rating', 'restaurant_id']]
    .groupby('restaurant_name')
    .agg(mean_rating=('aggregate_rating', 'mean'), rest_id_min=('restaurant_id', 'min'))
    .sort_values(by=['mean_rating', 'rest_id_min'], ascending=[True, True])
    .reset_index()
)

print(f"Restaurante de culinária italiana com menor média de avaliação: {restaurante.iloc[0,0]}")

Restaurante de culinária italiana com menor média de avaliação: Siena's


### 2.3 Dos restaurantes que possuem o tipo de culinária americana, qual o nome do restaurante com a maior média de avaliação?

In [8]:
restaurante = (
    df.loc[df['cuisines']=='American', ['restaurant_name', 'aggregate_rating', 'restaurant_id']]
    .groupby('restaurant_name')
    .agg(mean_rating=('aggregate_rating', 'mean'), rest_id_min=('restaurant_id', 'min'))
    .sort_values(by=['mean_rating', 'rest_id_min'], ascending=[False, True])
    .reset_index()
)

print(f"Restaurante de culinária americana com maior média de avaliação: {restaurante.iloc[0,0]}")

Restaurante de culinária americana com maior média de avaliação: OEB Breakfast Co.


### 2.4 Dos restaurantes que possuem o tipo de culinária americana, qual o nome do restaurante com a menor média de avaliação?

In [9]:
# Filtro para selecionar somente o tipo de culinária americana e notas válidas
filtro = (df['cuisines']=='American') & (df['aggregate_rating']>2)
restaurante = (
    df.loc[filtro, ['restaurant_name', 'aggregate_rating', 'restaurant_id']]
    .groupby('restaurant_name')
    .agg(mean_rating=('aggregate_rating', 'mean'), rest_id_min=('restaurant_id', 'min'))
    .sort_values(by=['mean_rating', 'rest_id_min'], ascending=[True, True])
    .reset_index()
)

print(f"Restaurante de culinária americana com menor média de avaliação: {restaurante.iloc[0,0]}")

Restaurante de culinária americana com menor média de avaliação: Guy Fieri's Kitchen & Bar


### 2.5 Dos restaurantes que possuem o tipo de culinária árabe, qual o nome do restaurante com a maior média de avaliação?

In [10]:
restaurante = (
    df.loc[df['cuisines']=='Arabian', ['restaurant_name', 'aggregate_rating', 'restaurant_id']]
    .groupby('restaurant_name')
    .agg(mean_rating=('aggregate_rating', 'mean'), rest_id_min=('restaurant_id', 'min'))
    .sort_values(by=['mean_rating', 'rest_id_min'], ascending=[False, True])
    .reset_index()
)

print(f"Restaurante de culinária árabe com maior média de avaliação: {restaurante.iloc[0,0]}")

Restaurante de culinária árabe com maior média de avaliação: Mandi@36


### 2.6 Dos restaurantes que possuem o tipo de culinária árabe, qual o nome do restaurante com a menor média de avaliação?

In [11]:
# Filtro para selecionar somente o tipo de culinária árabe e notas válidas
filtro = (df['cuisines']=='Arabian') & (df['aggregate_rating']>2)
restaurante = (
    df.loc[filtro, ['restaurant_name', 'aggregate_rating', 'restaurant_id']]
    .groupby('restaurant_name')
    .agg(mean_rating=('aggregate_rating', 'mean'), rest_id_min=('restaurant_id', 'min'))
    .sort_values(by=['mean_rating', 'rest_id_min'], ascending=[True, True])
    .reset_index()
)

print(f"Restaurante de culinária árabe com menor média de avaliação: {restaurante.iloc[0,0]}")

Restaurante de culinária árabe com menor média de avaliação: Empório Árabe


### 2.7 Dos restaurantes que possuem o tipo de culinária japonesa, qual o nome do restaurante com a maior média de avaliação?

In [12]:
restaurante = (
    df.loc[df['cuisines']=='Japanese', ['restaurant_name', 'aggregate_rating', 'restaurant_id']]
    .groupby('restaurant_name')
    .agg(mean_rating=('aggregate_rating', 'mean'), rest_id_min=('restaurant_id', 'min'))
    .sort_values(by=['mean_rating', 'rest_id_min'], ascending=[False, True])
    .reset_index()
)

print(f"Restaurante de culinária japonesa com maior média de avaliação: {restaurante.iloc[0,0]}")

Restaurante de culinária japonesa com maior média de avaliação: Sushi Samba


### 2.8 Dos restaurantes que possuem o tipo de culinária japonesa, qual o nome do restaurante com a menor média de avaliação?

In [13]:
# Filtro para selecionar somente o tipo de culinária japonesa e notas válidas
filtro = (df['cuisines']=='Japanese') & (df['aggregate_rating']>2)
restaurante = (
    df.loc[filtro, ['restaurant_name', 'aggregate_rating', 'restaurant_id']]
    .groupby('restaurant_name')
    .agg(mean_rating=('aggregate_rating', 'mean'), rest_id_min=('restaurant_id', 'min'))
    .sort_values(by=['mean_rating', 'rest_id_min'], ascending=[True, True])
    .reset_index()
)

print(f"Restaurante de culinária japonesa com menor média de avaliação: {restaurante.iloc[0,0]}")

Restaurante de culinária japonesa com menor média de avaliação: Orienthai


### 2.9 Dos restaurantes que possuem o tipo de culinária caseira, qual o nome do restaurante com a maior média de avaliação?

In [16]:
restaurante = (
    df.loc[df['cuisines']=='Home-made', ['restaurant_name', 'aggregate_rating', 'restaurant_id']]
    .groupby('restaurant_name')
    .agg(mean_rating=('aggregate_rating', 'mean'), rest_id_min=('restaurant_id', 'min'))
    .sort_values(by=['mean_rating', 'rest_id_min'], ascending=[False, True])
    .reset_index()
)

print(f"Restaurante de culinária caseira com maior média de avaliação: {restaurante.iloc[0,0]}")

Restaurante de culinária caseira com maior média de avaliação: Kanaat Lokantası


### 2.10 Dos restaurantes que possuem o tipo de culinária caseira, qual o nome do restaurante com a menor média de avaliação?

In [17]:
# Filtro para selecionar somente o tipo de culinária caseira e notas válidas
filtro = (df['cuisines']=='Home-made') & (df['aggregate_rating']>2)
restaurante = (
    df.loc[filtro, ['restaurant_name', 'aggregate_rating', 'restaurant_id']]
    .groupby('restaurant_name')
    .agg(mean_rating=('aggregate_rating', 'mean'), rest_id_min=('restaurant_id', 'min'))
    .sort_values(by=['mean_rating', 'rest_id_min'], ascending=[True, True])
    .reset_index()
)

print(f"Restaurante de culinária caseira com menor média de avaliação: {restaurante.iloc[0,0]}")

Restaurante de culinária caseira com menor média de avaliação: GurMekan Restaurant


### 2.11 Qual o tipo de culinária que possui o maior valor médio de um prato para duas pessoas?

In [32]:
resultado = df.groupby('cuisines')['average_cost_for_two'].mean().sort_values(ascending=False).reset_index()

print(f"Tipo de culinária com maior valor médio de um prato para duas pessoas: {resultado.iloc[0,0]}")

Tipo de culinária com maior valor médio de um prato para duas pessoas: Modern Australian


### 2.12 Qual o tipo de culinária que possui a maior nota média?

In [None]:
resultado = (
    df.loc[:, ['cuisines', 'aggregate_rating', 'restaurant_id']]
    .groupby('cuisines')
    .agg(mean_rating=('aggregate_rating', 'mean'), rest_id_min=('restaurant_id', 'min'))
    .sort_values(by=['mean_rating', 'rest_id_min'], ascending=[False, True])
    .reset_index()
)

print(f"Tipo de culinária com maior nota média: {resultado.iloc[0,0]}")

Tipo de culinária com maior nota média: Others


### 2.13 Qual o tipo de culinária que possui mais restaurantes que aceitam pedidos online e fazem entregas?

In [54]:
filtro = (df['has_online_delivery']==1) & (df['is_delivering_now']==1)

resultado = (
    df.loc[filtro, ['cuisines', 'restaurant_name', 'restaurant_id']]
    .groupby('cuisines')
    .agg(rest_name_count=('restaurant_name', 'count'), rest_id_min=('restaurant_id', 'min'))
    .sort_values(by=['rest_name_count', 'rest_id_min'], ascending=[False, True])
    .reset_index()
)

print(f"Culinária que mais possuem restaurantes que aceitam pedidos online e fazem entregas: {resultado.iloc[0,0]}")

Culinária que mais possuem restaurantes que aceitam pedidos online e fazem entregas: North Indian
