In [38]:
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
import seaborn as sns

In [39]:
# read csv of restaurants from yandex folder
restaurant = pd.read_csv('yandex/restaurants.csv')
# read csv of reviews from yandex folder
review = pd.read_csv('yandex/reviews.csv')

In [40]:
restaurant.head()

Unnamed: 0,id,name,address,phone,categories,rating,amount_of_reviews,avg_check,price_eval,working_hours
0,0,Подушечная,"Юнусабадский район, ул. Осиё, 17",+998 90 999 77 61,"['Ресторан', 'пиццерия', 'кафе']",4.86,434 отзыва,80000–120000 узб.сум,выше среднего,Открыто до 23:00
1,1,Nice Joy,"Юнусабадский район, ул. Осиё, 89/33",+998 90 999 77 62,"['Ресторан', 'суши-бар', 'кафе']",4.92,127 отзывов,80000–100000 узб.сум,выше среднего,Открыто до 23:00
2,2,Силк96,"ул. Кары-Ниязи, 68",+998 99 835 85 00,"['Ресторан', 'кафе', 'бар, паб']",4.44,80 отзывов,80000–120000 узб.сум,выше среднего,Закрыто до 15:00
3,3,Akmal Oltin Baliq,"Ташкентская область, Кибрайский район, улица У...",+998 97 145 49 95,['Кафе'],4.42,188 отзывов,,,Открыто до 23:00
4,4,СМИ,"ул. Кары-Ниязи, 68",+998 99 835 85 00,"['Бар, паб', 'кафе']",4.16,111 отзывов,30000–50000 узб.сум,высокие,Закрыто до 20:00


In [41]:
# swap the columns avg_check and price_eval of 42nd row
restaurant.loc[42, ['avg_check', 'price_eval']] = restaurant.loc[42, ['price_eval', 'avg_check']].values

In [42]:
# Check for missing values
restaurant.isnull().sum()

id                    0
name                  0
address               0
phone                 5
categories            0
rating                0
amount_of_reviews     0
avg_check            36
price_eval           37
working_hours         1
dtype: int64

In [43]:
# Fill all missing values in avg_check with 0-0
restaurant['avg_check'] = restaurant['avg_check'].fillna('0–0')
# remove 'узб.сум' from avg_check
restaurant['avg_check'] = restaurant['avg_check'].str.replace('узб.сум', '')

In [44]:
# Divide avg_check column into 2 columns: min_check and max_check using '-' as a separator
# If there is no separator, then min_check = max_check or if there is no value, then NaN
restaurant[['min_check', 'max_check']] = restaurant['avg_check'].str.split('–', expand=True)
# replace all 0 values with NaN
restaurant['min_check'] = restaurant['min_check'].replace('0', np.nan)
restaurant['max_check'] = restaurant['max_check'].replace('0', np.nan)
restaurant.head()

Unnamed: 0,id,name,address,phone,categories,rating,amount_of_reviews,avg_check,price_eval,working_hours,min_check,max_check
0,0,Подушечная,"Юнусабадский район, ул. Осиё, 17",+998 90 999 77 61,"['Ресторан', 'пиццерия', 'кафе']",4.86,434 отзыва,80000–120000,выше среднего,Открыто до 23:00,80000.0,120000.0
1,1,Nice Joy,"Юнусабадский район, ул. Осиё, 89/33",+998 90 999 77 62,"['Ресторан', 'суши-бар', 'кафе']",4.92,127 отзывов,80000–100000,выше среднего,Открыто до 23:00,80000.0,100000.0
2,2,Силк96,"ул. Кары-Ниязи, 68",+998 99 835 85 00,"['Ресторан', 'кафе', 'бар, паб']",4.44,80 отзывов,80000–120000,выше среднего,Закрыто до 15:00,80000.0,120000.0
3,3,Akmal Oltin Baliq,"Ташкентская область, Кибрайский район, улица У...",+998 97 145 49 95,['Кафе'],4.42,188 отзывов,0–0,,Открыто до 23:00,,
4,4,СМИ,"ул. Кары-Ниязи, 68",+998 99 835 85 00,"['Бар, паб', 'кафе']",4.16,111 отзывов,30000–50000,высокие,Закрыто до 20:00,30000.0,50000.0


In [45]:
# remove avg_check column
restaurant = restaurant.drop(['avg_check'], axis=1)

In [46]:
# Identify all unique values in price_eval column
restaurant['price_eval'].unique()

array(['выше среднего', nan, 'высокие', 'средние'], dtype=object)

In [47]:
# replace 'высокие' with 10, 'средние' with 5 and 'выше среднего' with 7
restaurant['price_eval'] = restaurant['price_eval'].replace('высокие', 10)
restaurant['price_eval'] = restaurant['price_eval'].replace('выше среднего', 7)
restaurant['price_eval'] = restaurant['price_eval'].replace('средние', 5)
restaurant.head()

Unnamed: 0,id,name,address,phone,categories,rating,amount_of_reviews,price_eval,working_hours,min_check,max_check
0,0,Подушечная,"Юнусабадский район, ул. Осиё, 17",+998 90 999 77 61,"['Ресторан', 'пиццерия', 'кафе']",4.86,434 отзыва,7.0,Открыто до 23:00,80000.0,120000.0
1,1,Nice Joy,"Юнусабадский район, ул. Осиё, 89/33",+998 90 999 77 62,"['Ресторан', 'суши-бар', 'кафе']",4.92,127 отзывов,7.0,Открыто до 23:00,80000.0,100000.0
2,2,Силк96,"ул. Кары-Ниязи, 68",+998 99 835 85 00,"['Ресторан', 'кафе', 'бар, паб']",4.44,80 отзывов,7.0,Закрыто до 15:00,80000.0,120000.0
3,3,Akmal Oltin Baliq,"Ташкентская область, Кибрайский район, улица У...",+998 97 145 49 95,['Кафе'],4.42,188 отзывов,,Открыто до 23:00,,
4,4,СМИ,"ул. Кары-Ниязи, 68",+998 99 835 85 00,"['Бар, паб', 'кафе']",4.16,111 отзывов,10.0,Закрыто до 20:00,30000.0,50000.0
