# Рынок заведений общественного питания Москвы

---
<a id='contens'></a> 
# Оглавление
1. [Цель проекта](#goal)
2. [Задачи проекта](#task)
3. [Описание данных](#data_name)
4. [Загрузка данных и изучение общей информации](#import)
5. [Предобработка данных](#preprocessing)\
    5.1 [Работа с пропусками](#pass)\
    5.2 [Изменение типа данных](#type_change)\
    5.3 [Проверка на наличие дубликатов](#check_dubl)\
    5.4 [Изменение данных в столбце chain](#change_chain)\
    5.5 [Добавление дополнительных столбцов](#add_columns)
6. [Анализ данных](#analysis)\
    6.1 [Распределение заведений по категориям](#category)\
    6.2 [Количество посадочных мест в заведениях по категориям](#category_seats)\
    6.3 [Соотношение сетевых и несетевых заведений](#chain)\
    6.4 [Распределение сетевых и чатсных заведений по категориям](#category_chain)\
    6.5 [Топ-15 популярных сетей в Москве](#top_chain)\
    6.6 [Распределение заведений общественного питания по районам Москвы](#distict)\
    6.7 [Распределение средних рейтингов по категорям заведений](#score_category)\
    6.8 [Фоновая картограмма (хороплет) со средним рейтингом заведений каждого района](#choropleth)\
    6.9 [Карта Москвы с заведениями общественного питания](#map)\
    6.10 [Топ-15 улиц Москвы по количеству заведений](#top_street)\
    6.11 [Улицы Москвы только с одним заведением общественного питания](#one_srteet)\
    6.12 [Разница в сумме среднего чека по районам Москвы](#middle_bill_district)\
    6.12 [Вывод](#conclusion)
7. [Исследование: открытие кофейни](#coffee)\
    7.1 [Общее количество кофеен в Москве](#coffee1)\
    7.2 [Распределение кофеен по городу](#coffee2)\
    7.3 [Рейтинг кофеен](#coffee3)\
    7.4 [Режим работы кофеен](#coffee4)\
    7.5 [Количество посадочных мест](#coffee5)\
    7.6 [Средняя стоимость чашки капучино в кофейнях](#coffee6)\
    7.7 [Средний чек в кофейнях](#coffee7)\
    7.8 [Вывод и рекомендации](#coffee8)
8. [Презентация](#presentation)

---
<a id='goal'></a> 
## Цель проекта
[Назад к оглавлению](#contens)

Провести исследование рынка заведений общественного питания г. Москвы с целью выявления особенностей данного рынка, которые помогут в выборе типа заведения, расположения, меню и цен для организации бизнеса в этой области.

---
<a id='task'></a> 
## Задачи проекта
[Назад к оглавлению](#contens)

1. Проанализировать категорий заведений общественного питания в г. Москве и их количество;
2. Исследовать средний рейтинг заведений по округам города;
3. Изучить средний чек по городу и стоимость чашки капучино;
4. Выявить топ-15 сетей и улиц города по количеству заведений;
5. Рассмотреть возможность открытия кофений в городе.

---
<a id='data_name'></a> 
## Описание данных
[Назад к оглавлению](#contens)

- name — название заведения;
- address — адрес заведения;
- category — категория заведения, например «кафе», «пиццерия» или «кофейня»;
- hours — информация о днях и часах работы;
- lat — широта географической точки, в которой находится заведение;
- lng — долгота географической точки, в которой находится заведение;
- rating — рейтинг заведения по оценкам пользователей в Яндекс Картах (высшая оценка — 5.0);
- price — категория цен в заведении, например «средние», «ниже среднего», «выше среднего» и так далее;
- avg_bill — строка, которая хранит среднюю стоимость заказа в виде диапазона, например: 
 - «Средний счёт: 1000–1500 ₽»;
 - «Цена чашки капучино: 130–220 ₽»;
 - «Цена бокала пива: 400–600 ₽». и так далее;
- middle_avg_bill — число с оценкой среднего чека, которое указано только для значений из столбца avg_bill, начинающихся с подстроки «Средний счёт»: 
 - Если в строке указан ценовой диапазон из двух значений, в столбец войдёт медиана этих двух значений.
 - Если в строке указано одно число — цена без диапазона, то в столбец войдёт это число.
 - Если значения нет или оно не начинается с подстроки «Средний счёт», то в столбец ничего не войдёт.
- middle_coffee_cup — число с оценкой одной чашки капучино, которое указано только для значений из столбца avg_bill, начинающихся с подстроки «Цена одной чашки капучино»: 
 - Если в строке указан ценовой диапазон из двух значений, в столбец войдёт медиана этих двух значений.
 - Если в строке указано одно число — цена без диапазона, то в столбец войдёт это число.
 - Если значения нет или оно не начинается с подстроки «Цена одной чашки капучино», то в столбец ничего не войдёт.
- chain — число, выраженное 0 или 1, которое показывает, является ли заведение сетевым (для маленьких сетей могут встречаться ошибки);
- district — административный район, в котором находится заведение, например Центральный административный округ;
- seats — количество посадочных мест.

---
<a id='import'></a> 
## Загрузка данных и изучение общей информации
[Назад к оглавлению](#contens)

In [4]:
# импортируем необходимые библиотеки
import pandas as pd
import seaborn as sns
import re
import matplotlib.pyplot as plt
import json
!pip install folium
from folium import Map, Choropleth
from folium import Marker, Map
from folium.plugins import MarkerCluster
from folium.features import CustomIcon
import plotly.express as px

# добавим опции для отображения таблиц
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)



In [5]:
# загружаем файл
df = pd.read_csv('/datasets/moscow_places.csv')

FileNotFoundError: [Errno 2] No such file or directory: '/datasets/moscow_places.csv'

In [None]:
# напишем функцию для изучения основных характеристик датафрейма
def df_study(df):
      
    # изучим начало и конец выборки
    display(df.head(10), df.tail(10))

    # изучим информацию о датафрейме
    display(df.info())
    
    # изучим статистические показатели
    display(df.describe())
    
    print('-'*50)
    # изучим количество строк и столбцов
    print('Количество строк и столбцов:', df.shape)   

    print('-'*50)
    # посчитаем количество явных дубликатов
    dubl = df.duplicated().sum()
    print('Количество явных дубликатов:' , dubl)
    
    # посчитаем долю дубликатов
    dubl_share = dubl/len(df)
    print(f'Доля явных дубликатов: {dubl_share:.2%}')
    
    print('-'*50)
    # посчитаем количество пропусков
    gap = df.isna().sum()
    print('Количество пропусков:', gap)
    
    # посчитаем долю пропусков
    gap_share = ((df.isnull().sum().sort_values(ascending=False)/df.shape[0])*100).round(2)
    print()
    print('Доля пропусков:')
    display(gap_share)
    
    # зададим масимальную ширину столбца
    pd.set_option('max_colwidth', 100) 

In [None]:
# изучим основную информацию
df_study(df)

В датафрейме 8406 записей. В столбцах с рейтингом и информации о принадлежности заведения к сети указаны верные диапазоны значений (от 0 до 5  и 0 или 1 соотвественно). \
Выявленные проблемы:
1. Наличие большого количества пропусков в столбцах с данными в следующих столбцах:
    - оценка стоимости одной чашки капучино (94% пропусков);
    - оценка суммы среднего чека (63% пропусков);
    - цена (61% пропусков);
    - средняя стоимость заказа (55% пропусков);
    - количество посадочных мест (43% пропусков).
2. Некорректный тип данных в стобце с количеством посадочных мест. 

Необходима предобработка данных.

---
<a id='preprocessing'></a> 
## Предобработка данных
[Назад к оглавлению](#contens)

---
<a id='pass'></a> 
### Работа с пропусками
[Назад к оглавлению](#contens)

In [None]:
# пропуски в столбцах заменим на -1
columns_fillna = ['hours', 'price', 'avg_bill', 'middle_avg_bill', 'middle_coffee_cup', 'seats']

for i in columns_fillna:
    df[i] = df[i].fillna(-1)
    
# проверим заполнение пропусков
df.isna().sum()

---
<a id='type_change'></a> 
### Изменение типа данных
[Назад к оглавлению](#contens)

Перед тем, как менять тип данных с количеством посадочных мест, проверим: все ли данные указаны верно, то есть отсутствуют ли доли.

In [None]:
# проверим значения и их количество
df['seats'].value_counts().sort_values()

In [None]:
# изменим тип данных в столбце с количеством посадочных мест на целочисленный
df['seats'] = df.loc[(df['seats'] != '-1'), 'seats'].astype(int)

# проверим изменение типа данных
df.info()

---
<a id='check_dubl'></a> 
### Проверка на наличие дубликатов
[Назад к оглавлению](#contens)

Первоначальная проверка показала отсутствие явных дубликатов. Приведем все данные в столбцах к нижнему регистру и проверим еще раз.

In [None]:
# приведем данных в этих столбцах к нижнему регистру
columns_lower = ['name', 'category', 'address', 'price', 'avg_bill']

for i in columns_lower:
    df[i] = df[i].str.lower()
    
# проверим наличие дубликатов после манипуляций
df.duplicated().sum()

Проверим наличие неявных дубликатов по названию, адресу и району размещения.

In [None]:
# подсчитаем количество дубликатов
print('Количество дубликатов:', df.duplicated(subset = ['name', 'address']).sum())

In [None]:
# посмотрим на дубликаты
df[df.duplicated(subset = ['name', 'address'], keep=False)]

In [None]:
# удалим дубликаты
df.drop_duplicates(subset=['name', 'address'], keep='first', inplace=True)

---
<a id='change_chain'></a> 
### Изменение данных в столбце chain
[Назад к оглавлению](#contens)

In [None]:
# для удобства анализа изменим числовые значения на текстовое отображение
df.loc[(df['chain'] == 0), 'chain'] = 'несетевое'
df.loc[(df['chain'] == 1), 'chain'] = 'сетевое'

---
<a id='add_columns'></a> 
### Добавление дополнительных 
[Назад к оглавлению](#contens)

Добавим столбец street с названиями улиц из столбца с адресом.

In [None]:
# перечислим существующие типы частей дороги
words = ['улица','ул','переулок','шоссе','проспект','площадь','проезд',
         'село','аллея','бульвар','набережная','тупик','линия']

# добавляем названия к типам
str_part = r".*,\s*\b([^,]*?(?:{})\b[^,]*)[,$]+".format("|".join(words))

# добавляем столбец
df['street'] = df['address'].str.extract(str_part, flags=re.I)

Создаем столбец is_24/7 с обозначением, что заведение работает ежедневно и круглосуточно (24/7).

In [None]:
# добавляем столбец
df['is_24/7'] = df['hours'].str.contains('ежедневно, круглосуточно')

In [None]:
# проверяем 
df.head()

---
<a id='analysis'></a> 
## Анализ данных
[Назад к оглавлению](#contens)

---
<a id='category'></a> 
### Распределение заведений по категориям
[Назад к оглавлению](#contens)

Изучим распределение заведений г. Москвы по категориям.

In [None]:
# подсчитаем общее количество заведений в Москве
print('Общее количество заведений общественного питания в Москве:', len(df))
# составим таблицу с категориями и количество заведений
temp = (df.pivot_table(index='category', values='name', aggfunc='count')
                    .sort_values(by='name', ascending=False)
                    .rename(columns={'name' : 'count'})
                    .reset_index())
display(temp)

# отобразим распределение на гистограмме
sns.set_style('dark')
custom_palette = ['#16537e', '#cfe2f3', '#9fc5e8', '#6fa8dc', '#3d85c6', '#0b5394', '#073763', '#62a7d7',
                 '#9dbbd5', '#7b95ac', '#697c8c', '#b1d5f5', '#246cac', '#204e77', '#76a5af']
sns.set_palette(custom_palette)
plt.figure(figsize=(12, 4)) 
ax = sns.barplot(x='category', y='count', data=temp)
ax.set_title('Распределение заведений по категориям', size=16, weight= 900)
ax.set_xlabel('Наименование категорий')
ax.set_ylabel('Количество заведений, шт.')
plt.show()

# отобразим распределение по долям на круговой диаграмме
temp.plot(y='count',
            kind='pie',
            labels=temp['category'],
            autopct='%.0f%%',
            title='Распределение заведений по категориям',
            figsize=(8, 8),
            legend=False)
plt.show()

В первую тройку категорий составляют кафе (28% от всех заведений), рестораны (24%) и кофейни (24%). На три эти категории приходятся практически 70% всех заведений. Далее по популярности: бары, пиццерии и заведения быстрого питания (9%, 8% и 7% соответственно). Аутсайдерами являются столовые (4%) и булочные (3%).

---
<a id='category_seats'></a> 
### Количество посадочных мест в заведениях по категориям
[Назад к оглавлению](#contens)

Изучим среднее количество посадочных мест в заведениях по категориям. Перед исследованием обращаем внимание на наличие большого количества пропусков в столбце с данными о посадочных местах, а именно 43% пропусков.

In [None]:
# составим таблицу 
temp = (df.query('seats != -1')
          .pivot_table(index='category', values='seats', aggfunc='median')
          .sort_values(by='seats', ascending=False)
          .rename(columns={'seats' : 'seats_median'})
          .reset_index())
display(temp)

# отобразим распределение на гистограмме
plt.figure(figsize=(12, 4)) 
ax = sns.barplot(x='category', y='seats_median', data=temp)
ax.set_title('Среднее медианное количество посадочных мест в заведениях по категориям', size=16, weight= 900)
ax.set_xlabel('Наименование категорий')
ax.set_ylabel('Среднее количество посадочных мест')
plt.show()

Посмотрим на количество посадочных мест по категориям на диаграмме рассеивания.

In [None]:
# делаем срез по посадочным местам
df_temp = df.query('seats != -1')

# строим диаграмму рассеивания
plt.figure(figsize=(12, 6))
ax = sns.stripplot(x='category', y='seats', data=df_temp)
ax.set_title('Количество посадочных мест в заведениях по категориям', size=16, weight= 900)
ax.set_xlabel('Наименование категорий')
ax.set_ylabel('Количество посадочных мест')
plt.show()

Среднее медианное количество посадочных по категориям заведений находится в переделах от 50 в булочных до 86 в ресторанах. Лидерами по количеству посадочных мест являются: рестораны (86 посадочных мест), бары/пабы (83 места) и кофейни (80 мест). Диаграмма рассеивания позвляет сделать вывод о том, что в ресторанах, кафе, барах и кофейнях чаще всего количество посадочных мест менее 200. В булочных и столовых показатель значительно ниже. В булочных чаще всего около 50 посадочных мест, в столовых - около 100. Практически для каждой категории заведений характерны аномально высокие значения (от 1000 и выше). Стоит обратить внимание на то, что почти половина данных отсутвует, поэтому сложно делать верные и корректные выводы о показателе. 

---
<a id='chain'></a> 
### Соотношение сетевых и несетевых заведений
[Назад к оглавлению](#contens)

Рассмотрим соотношение сетевых и несетевых заведений в датасете.

In [None]:
# составим таблицу с категориями и количество заведений
temp = (df.pivot_table(index='chain', values='name', aggfunc='count')
                    .sort_values(by='name', ascending=False)
                    .rename(columns={'name' : 'count'})
                    .reset_index())
                    
display(temp)

# отобразим распределение на гистограмме
temp.plot(y='count',
            kind='pie',
            labels=temp['chain'],
            autopct='%.0f%%',
            title='Соотношение сетевых и несетевых заведений',
            figsize=(8, 8),
            legend=False)
plt.show()

На рынке общественного питания г. Москвы большая часть заведений (62%) являются несетевыми. 

---
<a id='category_chain'></a> 
### Распределение сетевых и частных заведений по категориям
[Назад к оглавлению](#contens)

Исследуем, какие категории чаще остальных являются сетевыми.

In [None]:
# составим таблицу с категориями и количество заведений
temp = (df.pivot_table(index='category', values='name', columns='chain', aggfunc='count')
          .sort_values(by='несетевое', ascending=False))
temp['доля несетевых, %'] = ((temp['несетевое']/(temp['несетевое']+temp['сетевое']))*100).round(2)
temp['доля сетевых, %'] = ((temp['сетевое']/(temp['несетевое']+temp['сетевое']))*100).round(2)
temp['разница, %'] = temp['доля несетевых, %'] - temp['доля сетевых, %']
display(temp)

# отобразим распределение на гистограмме
plt.figure(figsize=(12, 4)) 
ax = sns.countplot(x='category', hue='chain', data=df)
ax.set_title('Распределение заведений по категориям', size=16, weight= 900)
ax.set_xlabel('Наименование категорий')
ax.set_ylabel('Количество заведений, шт.')
plt.show()

Для кафе, ресторанов, баров, заведений быстрого питания и столовых характерно преобладание несетевых заведений. Стоит отметить значительную разницу в соотношении у следующих категорий: кафе (на 34% несетевый заведений больше), рестораны (29%), бары (56%), заведения быстрого питания (23%) и столовые (44%). У заведений в остальных категориях сетевая принадленость преобладает. В кофейнях и пиццериях эта разница незначительна (примерно на 2% и 4% соответственно сетевых заведений больше). В булочных разница наиболее существенна (23%).

---
<a id='top_chain'></a> 
### Топ-15 популярных сетей в Москве
[Назад к оглавлению](#contens)

Исследуем топ-15 популярных сетей в Москве. Попробуем определить общий признак. Проанализируем категорию, к которой относятся заведения сети, определим общее количество заведений и количество заведений каждой категории по районам.

In [None]:
# составим таблицу топ-15 сетей в Москве с максимальным количеством заведений
temp = (df.pivot_table(index=['name', 'category'], values='address', aggfunc='count')
          .rename(columns={'address' : 'count'})
          .reset_index())
temp = temp.sort_values(by='count', ascending=False)
temp = temp.head(16)  
temp

На первом месте оказалась сеть 'кафе'. Предполагаю, что это не сеть, а наименование небольших заведений без названия, поэтому для более достоверного анализа не будет ее учитывать.

In [None]:
# итоговая таблица топ-15
temp = temp[1:]
display(temp)

# отразим данные на графике
plt.figure(figsize=(12, 6))
ax = sns.barplot(y='name', x='count', data=temp)
ax.set_title('Топ-15 сетей по количеству заведений общественного питания', size=16, weight= 900)
ax.set_ylabel('Наименование сети')
ax.set_xlabel('Количество заведений, шт.')
plt.show()

 Лидером в топ-листе является сеть кофеен "Шоколадница" (119 заведений). На следующих пяти местах расположились сети:
- Доминос пицца (77 заведений)
- Додо пицца (74 заведения)
- One price coffee (72 заведения)
- Яндекс лавка (69 заведений)
- Cofix (65 заведений).
Количество заведений у остальных сетей значительно ниже (от 49 и меньше).
\
\
Посмотрим к какой категории заведений относятся сети из топ-листа.

In [None]:
# составим таблицу
temp2 = (temp.pivot_table(index='category', values='count', aggfunc='sum')
             .sort_values(by='count', ascending=False)
             .rename(columns={'count' : 'count'})
             .reset_index())
display(temp2)

# отразим данные на графике
plt.figure(figsize=(12, 6))
ax = sns.barplot(x='category', y='count', data=temp2)
ax.set_title('Распределение заведений из топ-15 сетей по категориям', size=16, weight= 900)
ax.set_ylabel('Наименование категории')
ax.set_xlabel('Количество заведений, шт.')
plt.show()

# отобразим распределение по долям на круговой диаграмме
temp2.plot(y='count',
            kind='pie',
            labels=temp2['category'],
            autopct='%.0f%%',
            title='Распределение заведений из топ-15 сетей по категориям',
            figsize=(8, 8),
            legend=False)
plt.show()

Заведения из топ-листа популярных сетей в основном относятся к категории кофеен (42%), ресторанов (24%) и пиццерий (19%). 
\
\
Посмотрим, в каких районах г. Москвы расположены заведения сетей.

In [None]:
# для среза создадим список с наименованиями сетей из топ-листа
name_top_chain = temp['name'].tolist()

# формируем таблицу 
df_top_chain = df.query('name == @name_top_chain').sort_values(by='name')
temp3 = (df_top_chain.pivot_table(index='district', columns='name', values='address', aggfunc='count')
                     .fillna(0)
                     .reset_index())
temp3['всего заведений в районе'] = temp3.sum(axis=1)
temp3 = temp3.sort_values(by='всего заведений в районе', ascending=False)
temp3

In [None]:
# отобразим распределение по долям на круговой диаграмме
temp3.plot(y='всего заведений в районе',
            kind='pie',
            labels=temp3['district'],
            autopct='%.0f%%',
            title='Распределение заведений топ-15 сетей по районам г. Москвы',
            figsize=(8, 8),
            legend=False)
plt.show()

Большая часть заведений топ-листа расположена в Центральном районе (23%). Далее по популярности идет Севеный район (12%). На Западный,Северо-Восточный и Южный районы приходится по 11% заведений. Аутсайдером является Северо-Западный район (6%).
\
\
Посмотрим как расположились категории заведений из топ-листа по районам Москвы.

In [None]:
# формируем таблицу 
df_top_chain = df.query('name == @name_top_chain').sort_values(by='name')
temp4 = (df_top_chain.pivot_table(index='district', columns='category', values='address', aggfunc='count')
                     .fillna(0)
                     .reset_index())
temp4['всего заведений в районе'] = temp4.sum(axis=1)
temp4 = temp4.sort_values(by='всего заведений в районе', ascending=False)
display(temp4)

In [None]:
# формируем таблицу
temp4 = (df_top_chain.pivot_table(index=['district', 'category'], values='address', aggfunc='count')
                      .rename(columns={'address' : 'count'})
                      .sort_values(by='count', ascending=False)
                     .reset_index())

# отобразим распределение на графике
plt.figure(figsize=(16, 8)) 
fig = px.bar(temp4, x='district', y='count', color='category', 
             title='Распределение категорий заведений по районам г. Москвы', barmode='stack',
             labels={'district': 'Название района', 
                     'count': 'Количество заведений, шт.',
                    'category': 'Категория'})
fig.update_layout(
    height=600, width=900, 
    title_font_size=16, 
    plot_bgcolor='rgba(0,0,0,0.05)') 
fig.show()

В центральном районе расположена большая часть кофеен, ресторанов и кафе. В остальных районах лидерами среди категорий являются: кофейни, рестораны и пиццерии.

---
<a id='district'></a> 
### Распределение заведений общественного питания по районам г. Москвы
[Назад к оглавлению](#contens)

Посмотрим как распределены заведения общественного питания по городу.

In [None]:
# формируем таблицу 
temp = (df.pivot_table(index='district', values='name', aggfunc='count')
          .sort_values(by='name', ascending=False)
          .rename(columns={'name' : 'count'})
          .reset_index())
display(temp)

# отразим данные на графике
plt.figure(figsize=(12, 6))
ax = sns.barplot(y='district', x='count', data=temp)
ax.set_title('Распределение заведений по районам г. Москвы', size=16, weight= 900)
ax.set_ylabel('Наименование района')
ax.set_xlabel('Количество заведений, шт.')
plt.show()

# отобразим распределение по долям на круговой диаграмме
temp.plot(y='count',
            kind='pie',
            labels=temp['district'],
            autopct='%.0f%%',
            title='Распределение заведений по районам г. Москвы',
            figsize=(8, 8),
            legend=False)
plt.show()

Большая часть заведений (27%) расположена в Центральном районе. На Северный, Южный и Северо-Восточный районы приходится по 11% заведений. Меньше всего заведений расположено в Северо-Западном округе (5%).
\
\
Посмотрим как распределены категории заведений по районам города.

In [None]:
# формируем таблицу 
temp = (df.pivot_table(index='district', columns='category', values='name', aggfunc='count')
          .reset_index())
temp['всего заведений в районе'] = temp.sum(axis=1)
temp = temp.sort_values(by='всего заведений в районе', ascending=False)
display(temp)

# отобразим распределение на гистограмме
plt.figure(figsize=(16, 8)) 
ax = sns.countplot(x='district', hue='category', data=df)
ax.set_title('Распределение категорий заведений по районам г. Москвы', size=16, weight= 900)
ax.set_xlabel('Наименование районов')
ax.set_xticklabels(ax.get_xticklabels(),rotation = 90)
ax.set_ylabel('Количество заведений, шт.')
plt.show()

Основная доля ресторанов, кафе, баров и пиццерий расположена в Центальном районе. В остальных районах кафе являются наиболее популярными по сравнению с остальными категориями. Рестораны и кофейни тоже входят в тройку лидеров среди категорий.

---
<a id='score_category'></a> 
### Распределение средних рейтингов по категориям заведений 
[Назад к оглавлению](#contens)

Посмотрим как распределены средние оценки рейтингов по категориям заведений.

In [None]:
# формируем таблицу
temp = (df.pivot_table(index='category', values='rating', aggfunc='median')
          .sort_values(by='rating', ascending=False)
          .rename(columns={'rating' : 'median_rating'})
          .reset_index())
display(temp)

# изучим статистические показатели
print('Статистические показатели столбца rating')
display(df['rating'].describe())

# отразим данные на графике
plt.figure(figsize=(12, 4))
ax = sns.barplot(y='median_rating', x='category', data=temp)
ax.set_title('Средние (медианные) рейтинги заведений по категориям', size=16, weight= 900)
ax.set_xlabel('Наименование категории')
ax.set_ylabel('Медианный рейтинг')
plt.ylim([4, 4.5])
plt.show()

Средний (медианный) рейтинг по категория варьируется в пределах от 4.4 у баров/пабов до 4.2 у заведений быстрого питания и кафе. Для всех остальных категорий этот показатель равен 4.3.

---
<a id='choropleth'></a> 
### Фоновая картограмма (хороплет) со средним рейтингом заведений каждого района
[Назад к оглавлению](#contens)

Для каждого района посчитаем медианный рейтинг заведений, которые находятся на его территории.

In [None]:
# формируем таблицу 
rating_df = (df.groupby('district', as_index=False)['rating'].agg('median')
               .sort_values(by='rating', ascending=False))
display(rating_df)

Формируем хороплет.

In [None]:
# загружаем JSON-файл с границами районов Москвы
state_geo = '/datasets/admin_level_geomap.geojson'

# moscow_lat - широта центра Москвы, moscow_lng - долгота центра Москвы
moscow_lat, moscow_lng = 55.751244, 37.618423

# создаём карту Москвы
m = Map(location=[moscow_lat, moscow_lng], zoom_start=10)

# создаём хороплет с помощью конструктора Choropleth и добавляем его на карту
Choropleth(
    geo_data=state_geo,
    data=rating_df,
    columns=['district', 'rating'],
    key_on='feature.name',
    fill_color='Blues',
    fill_opacity=0.8,
    legend_name='Медианный рейтинг заведений по районам',
).add_to(m)

# выводим карту
m

По районам максимальный рейтинг (4.4) чаще всего встречается у заведений в Центральном районе. В Северо-Восточном и Юго-Восточном районах показатель минимальный (4.2). Для всех остальных районов средний (медианный) рейтинг равен 4.3. 

---
<a id='map'></a> 
### Карта Москвы с заведениями общественного питания
[Назад к оглавлению](#contens)

In [None]:
# создаём карту Москвы
moscow = Map(location=[moscow_lat, moscow_lng], zoom_start=10)

# создаём пустой кластер, добавляем его на карту
marker_cluster = MarkerCluster().add_to(moscow)

# пишем функцию, которая принимает строку датафрейма,
# создаёт маркер в текущей точке и добавляет его в кластер marker_cluster
def create_clusters(row):
    # сохраняем URL-адрес изображения со значком торгового центра с icons8,
    # это путь к файлу на сервере icons8
    icon_url = 'https://img.icons8.com/?size=512&id=9rCm9FIFH5qA&format=png'  
    # создаём объект с собственной иконкой размером 30x30
    icon = CustomIcon(icon_url, icon_size=(30, 30))
    
    # создаём маркер с иконкой icon и добавляем его в кластер
    Marker(
        [row['lat'], row['lng']],
        popup=f"{row['name']}{row['category']}{row['rating']}",
        icon=icon,
    ).add_to(marker_cluster)

# применяем функцию для создания кластеров к каждой строке датафрейма
df.apply(create_clusters, axis=1)

# выводим карту
moscow

Карта располагает данными о всех заведениях общественного питания Москвы. На карте можно отметить большое количество заведений в центре города, который отличается большей проходимостью и популярностью среди жителей и туристов города.

---
<a id='top_street'></a> 
### Топ-15 улиц Москвы по количеству заведений
[Назад к оглавлению](#contens)

Составим топ-лист улиц г. Моксвы по количеству заведений общественного питания. Посмотрим на распределение количества заведений и их категории по этим улицам. 

In [None]:
# формируем таблицу
temp = (df.pivot_table(index='street', values='address', aggfunc='count')
           .sort_values(by='address', ascending=False)
           .rename(columns={'address' : 'count'})
           .reset_index()
           .head(15))
display(temp)

# отразим данные на графике
plt.figure(figsize=(12, 6))
ax = sns.barplot(y='street', x='count', data=temp)
ax.set_title('Топ-15 улиц г. Москвы по количеству заведений общественного питания', size=16, weight= 900)
ax.set_ylabel('Наименование улицы')
ax.set_xlabel('Количество заведений, шт.')
plt.show()

Самой популярной улицей г. Москвы по количеству заведений общественного питания является проспект Мира, на которой расположены 184 заведения. В первую тройку также входят Профсоюзная улица (122 заведения) и проспект Вернадского (108 заведений). Ленинский проспект занимает 4-е место (107 заведений). 
\
\
Посмотрим, какие категории заведений расположились на этих улицах.

In [None]:
# для среза создадим список с наименованиями сетей из топ-листа
category_top_street= temp['street'].tolist()

# делам срез датафрейма
df_top_street= df.query('street == @category_top_street')

# формируем таблицу
temp2 = (df_top_street.pivot_table(index=['street', 'category'], values='address', aggfunc='count')
                      .rename(columns={'address' : 'count'})
                      .sort_values(by='count', ascending=False)
                      .reset_index())

# отобразим распределение на графике
plt.figure(figsize=(16, 8)) 
fig = px.bar(temp2, x='street', y='count', color='category', 
             title='Распределение категорий заведений по улицам г. Москвы', barmode='stack',
             labels={'street': 'Название улицы', 
                     'count': 'Количество заведений, шт.',
                    'category': 'Категория'})
fig.update_layout(
    height=600, width=900, 
    title_font_size=16, 
    plot_bgcolor='rgba(0,0,0,0.05)') 
fig.show()

Изучим процентное соотношение категорий заведений на этих улицах.

In [None]:
# составим таблицу
temp3 = (temp2.pivot_table(index='category', values='count', aggfunc='sum')
             .sort_values(by='count', ascending=False)
             .reset_index())
display(temp3)

# отобразим распределение по долям на круговой диаграмме
temp3.plot(y='count',
            kind='pie',
            labels=temp3['category'],
            autopct='%.0f%%',
            title='Распределение заведений из топ-15 улиц по категориям',
            figsize=(8, 8),
            legend=False)
plt.show()

71% всех заведений на улицах из топ-листа являются ресторанами (27%), кафе (26%) и кофейнями (18%). Меньше всего на данных улицах размещено булочных (2%) и столовых (3%).

---
<a id='one_street'></a> 
### Улицы Москвы только с одним заведением общественного питания
[Назад к оглавлению](#contens)

Исследуем улицы, на которых расположено только по одному заведению общественного питания.

In [None]:
# формируем таблицу
temp = (df.pivot_table(index='street', values='address', aggfunc='count')
           .sort_values(by='address')
           .rename(columns={'address' : 'count'})
           .reset_index())
temp = temp.query('count == 1')
print('Количество улиц, на которых расположено только одно заведение:', len(temp))    

На 414 улицах Москвы расположено всего по одному заведению общественного питания.
\
\
Посмотрим в каких районах расположены эти заведения и к каким категориям относятся.

In [None]:
# для среза создадим список с наименованиями улиц из топ-листа
street_one = temp['street'].tolist()

# делам срез датафрейма
df_one= df.query('street == @street_one')

# формируем таблицы по категориям (для анализа и графика)
temp2 = (df_one.pivot_table(index='category', values='address', aggfunc='count')
                      .rename(columns={'address' : 'count'})
                      .sort_values(by='count', ascending=False)
                     .reset_index())
display(temp2)

# отразим данные на графике
plt.figure(figsize=(12, 4))
ax = sns.barplot(x='count', y='category', data=temp2)
ax.set_title('Распределение заведений с улиц с одним объектом питания по категориям', size=16, weight= 900)
ax.set_ylabel('Категория')
ax.set_xlabel('Количество улиц')
plt.show()

# отобразим распределение по долям на круговой диаграмме
temp2.plot(y='count',
            kind='pie',
            labels=temp2['category'],
            autopct='%.0f%%',
            title='Распределение заведений с улиц с одним объектом питания по категориям',
            figsize=(8, 8),
            legend=False)
plt.show()

70% заведений с таких улиц являются кафе (25%), ресторанами (24%) и кофейнями (21%). Меньше всего встречаются булочные и столовые (по 3%).

In [None]:
# формируем таблицу по районам
temp3 = (df_one.pivot_table(index='district', values='address', aggfunc='count')
               .rename(columns={'address' : 'count'})
               .sort_values(by='count', ascending=False)
               .reset_index())
display(temp3)

# отразим данные на графике
plt.figure(figsize=(12, 4))
ax = sns.barplot(x='count', y='district', data=temp3)
ax.set_title('Распределение улиц с одним заведением по районам г. Москвы', size=16, weight= 900)
ax.set_ylabel('Наименование района')
ax.set_xlabel('Количество улиц')
plt.show()

# отобразим распределение по долям на круговой диаграмме
temp3.plot(y='count',
            kind='pie',
            labels=temp3['district'],
            autopct='%.0f%%',
            title='Распределение улиц с одним заведением по районам г. Москвы',
            figsize=(8, 8),
            legend=False)
plt.show()

26% улиц расположено в Центральном районе г. Москвы. Это может быть связано с наличием небольших улочек в центре города. На Северный, Западный и Южный районы прихрдится по 12% заведений. Аутсайдером по количеству улиц является Северо-Западный район.

---
<a id='middle_bill_district'></a> 
### Разница в сумме среднего чека по районам г. Москвы
[Назад к оглавлению](#contens)

Исследуем средние суммы чеков в заведениях, найдем медианные значения и проанализируем изменение показателя по районам Москвы. Напомним, что в столбце со значениями средних чеков большое количество пропусков (63%).

In [None]:
# формируем таблицу
avg_bill_for_district = (df.query('middle_avg_bill != -1')
                           .pivot_table(index='district', values='middle_avg_bill', aggfunc='median')
                           .rename(columns={'middle_avg_bill' : 'median_avg_bill'})
                           .sort_values(by='median_avg_bill', ascending=False)
                           .reset_index())
avg_bill_for_district

In [None]:
# загружаем JSON-файл с границами районов Москвы
state_geo = '/datasets/admin_level_geomap.geojson'

# moscow_lat - широта центра Москвы, moscow_lng - долгота центра Москвы
moscow_lat, moscow_lng = 55.751244, 37.618423

# создаём карту Москвы
m = Map(location=[moscow_lat, moscow_lng], zoom_start=10)

# создаём хороплет с помощью конструктора Choropleth и добавляем его на карту
Choropleth(
    geo_data=state_geo,
    data=avg_bill_for_district,
    columns=['district', 'median_avg_bill'],
    key_on='feature.name',
    fill_color='Blues',
    fill_opacity=0.8,
    legend_name='Медианный средний чек заведений по районам',
).add_to(m)

# выводим карту
m

Посмотрим на статистические показатели столбца в целом по датафрему.

In [None]:
temp = df.query('middle_avg_bill != -1')
temp['middle_avg_bill'].describe()

Сумма среднего чека находится в пределах от 450 руб. в Юго-Восточном районе до 1000 руб. в Центральном и Западном районе. Средняя сумма чека по городу - 958 руб, среднее медианное - 750 руб. Во всех районах кроме Центрального и Западного средний чек ниже среднего медианного. По карте можно сделать вывод, что удаленность от центра влияет на сумму среднего чека.

---
<a id='conclusion'></a> 
### Вывод
[Назад к оглавлению](#contens)

Проанализировав рынок заведений общественного питания г. Москвы, можно сделать следующие выводы:
- По состоянию на лето 2022 года общее количество заведений общественного питания в Москве: 8406.
- Основная доля заведений является кафе (28%), ресторанами (24%) и кофейнями (17%).
- Чаще всего заведения являются несетевыми (62% заведений). 
- Среднее количество посадочных мест находится в пределах от 50 в булочных до 86 в ресторанах.
- По количеству заведений лидирует Центральный район (27% всех заведений).
- Рейтинг заведений варьируется от 4.2 у кафе до 4.4 у баров/пабов. Также максимальный рейтинг (4.4) имеют заведения Центрального района Москвы, минимальный (4.2) – Юго-Восточный и Северо-Восточный районы.
- Средний чек находится в пределах от 450 руб. в Юго-Восточном районе до 1000 руб. в Центральном и Западном районах.
- Выделены топ-15 популярных сетей по количеству заведений. Со значительным отрывом лидирует сеть кофеен «Шоколадница» (119 заведений по городу).
- Составлен топ-15 улиц г. Москвы, лидером которого является проспект Мира (184 заведения).

---
<a id='coffee'></a> 
## Исследование: открытие кофейни 
[Назад к оглавлению](#contens)

Изучим вопрос успешности открытия кофейни в г. Москве. Проанализируем данные об уже открытых кофейнях.
Дадим ответы на следующие вопросы:
- Сколько всего кофеен в датасете? 
- В каких районах их больше всего, каковы особенности их расположения?
- Есть ли круглосуточные кофейни?
- Какие у кофеен рейтинги? Как они распределяются по районам?
- На какую стоимость чашки капучино стоит ориентироваться при открытии и почему?
- Какое количество посадочных мест в кофейнях?
- Какой средний чек по районам?

---
<a id='coffee1'></a> 
### Общее количество кофеен в городе
[Назад к оглавлению](#contens)

In [None]:
# сделаем срез в исходном датафрейме 
df_coffee = df.query('category == "кофейня"')
share_coffee = len(df_coffee)/len(df)
print('Всего кофеен в Москве:', len(df_coffee))
print(f'Доля кофеен в Москве: {share_coffee:.2%}')

Всего в Москве 1413 кофеен, что составляет 16.81% от всех заведений общественного питания. Данная категория расположена на 3-м месте среди всех категорий.

---
<a id='coffee2'></a> 
### Распределение кофеен по городу
[Назад к оглавлению](#contens)

Посмотрим в каких районах расположены кофейни.

In [None]:
# формируем таблицу по районам
coffee_district = (df_coffee.groupby('district', as_index=False)['address'].agg('count')
                           .sort_values(by='address', ascending=False)
                           .rename(columns={'address' : 'count'}))
display(coffee_district)

# отразим данные на графике
plt.figure(figsize=(12, 6))
ax = sns.barplot(y='district', x='count', data=coffee_district)
ax.set_title('Распределение кофеен по районам г. Москвы', size=16, weight= 900)
ax.set_ylabel('Наименование района')
ax.set_xlabel('Количество заведений, шт.')
plt.show()

# отобразим распределение по долям на круговой диаграмме
coffee_district.plot(y='count',
            kind='pie',
            labels=coffee_district['district'],
            autopct='%.0f%%',
            title='Распределение кофеен по районам г. Москвы',
            figsize=(8, 8),
            legend=False)
plt.show()

30% всех кофеен города расположена в Центральном районе города.Также популярными районами являются Северный (14%), Северо-Восточный и Западный (по 11%). Меньше всего кофеен в Северо-Западном районе (4%).

Отобразим кофейни на карте Москвы.

In [None]:
# создаём карту Москвы
moscow_coffee = Map(location=[moscow_lat, moscow_lng], zoom_start=10)

# создаём пустой кластер, добавляем его на карту
marker_cluster = MarkerCluster().add_to(moscow_coffee)

# пишем функцию, которая принимает строку датафрейма,
# создаёт маркер в текущей точке и добавляет его в кластер marker_cluster
def create_clusters(row):
    # сохраняем URL-адрес изображения со значком торгового центра с icons8,
    # это путь к файлу на сервере icons8
    icon_url = 'https://img.icons8.com/?size=512&id=b4ZGhlJP5MOk&format=png'  
    # создаём объект с собственной иконкой размером 30x30
    icon = CustomIcon(icon_url, icon_size=(30, 30))
    
    # создаём маркер с иконкой icon и добавляем его в кластер
    Marker(
        [row['lat'], row['lng']],
        popup=f"{row['name']}{row['rating']}",
        icon=icon,
    ).add_to(marker_cluster)

# применяем функцию для создания кластеров к каждой строке датафрейма
df_coffee.apply(create_clusters, axis=1)

# выводим карту
moscow_coffee

---
<a id='coffee3'></a> 
### Рейтинг кофеен в городе
[Назад к оглавлению](#contens)

Посмотрим какие рейтинги у кофеен и как они распределены по районам.

In [None]:
# формируем таблицу по районам
coffee_rating = (df_coffee.groupby('district', as_index=False)['rating'].agg('median')
                           .sort_values(by='rating', ascending=False)
                           .rename(columns={'rating' : 'median_rating'}))
display(coffee_rating)

# отразим данные на графике
plt.figure(figsize=(12, 6))
ax = sns.barplot(y='district', x='median_rating', data=coffee_rating)
ax.set_title('Средний рейтинг кофеен по районам г. Москвы', size=16, weight= 900)
ax.set_ylabel('Наименование района')
ax.set_xlabel('Медианный рейтинг')
plt.xlim([4, 4.5])
plt.show()

Рейтинг кофеен по всем районам составляет 4.3. По данному показателю отличается только Западный район с рейтингом кофеен 4.2.

---
<a id='coffee4'></a> 
### Режим работы кофеен
[Назад к оглавлению](#contens)

Изучим режимы работы кофеен.

In [None]:
# посмотрим на режимы работы всех кофеен
temp = (df_coffee.query('hours != -1')
                 .pivot_table(index='hours', values='address', aggfunc='count')
                 .sort_values(by='address', ascending=False)
                 .rename(columns={'address' : 'count'}))
temp.loc['other'] = temp.iloc[10:].sum()[0]
table_for_pie = temp.head(10)
table_for_pie=table_for_pie.append(temp.loc['other'])
table_for_pie = table_for_pie.reset_index()
table_for_pie['share'] = ((table_for_pie['count']/table_for_pie['count'].sum())*100).round(2)
display(table_for_pie)

10% всех кофеен работает ежедневно с 10 до 22 часов. По 4% кофеен работают ежедневно с 8 до 22, с 9 до 22 или круглосуточно.

---
<a id='coffee5'></a> 
### Количество посадочных мест в кофейнях
[Назад к оглавлению](#contens)

In [None]:
# посмотрим на количество посадочных мест в кофейнях
temp = df_coffee.query('seats != -1')
temp['seats'].describe()

In [None]:
# отобразим распределение посадочных мест на графике
plt.figure(figsize=(12, 6))
ax = sns.histplot(temp['seats'], bins=20)
ax.set_title('Распределение количества посадочных мест в кофейнях', size=16, weight= 900)
ax.set_ylabel('Наименование района')
ax.set_xlabel('Медианный рейтинг')
plt.show()

Количество посадочных мест находится в пределах от 0 до 1288. Верхний и нижний предел вероятно являются аномальными для данной категории заведений. Среднее количество мест - 111, среднее медианное - 80. 

---
<a id='coffee6'></a> 
### Средняя стоимость чашки капучино в кофейнях
[Назад к оглавлению](#contens)

Изучим среднюю стоимость одной чашки капучино в кофейнях. 

In [None]:
# изучим датафрейм, удалив пропуски в столбце
df_cup = df_coffee.query('middle_coffee_cup != -1')
share_cup = len(df_cup)/len(df_coffee)
print('Всего кофеен, по которым есть данные о средней цене чашки капучино:', len(df_cup))
print(f'Доля таких кофеен: {share_cup:.2%}')

Пропусков в данной столбце достаточно много. Поэтому будем делать выводы только по 37% данных. Посмотрим на статистические показатели столбца с ценой, рассчитаем медианную стоимость по всему городу и районам.

In [None]:
# изучим статистические показатели
display(df_cup['middle_coffee_cup'].describe())

# посчитаем среднюю медианную цену по городу
median_bill = df_cup['middle_coffee_cup'].median()
print('Медианная цена одной чашки капучино по г. Москве:', median_bill)

# посчитаем данный показатель по районам Москвы
median_bill_dist = (df_cup.groupby('district', as_index=False)['middle_coffee_cup'].agg('median')
                           .sort_values(by='middle_coffee_cup', ascending=False))
display(median_bill_dist)

# отразим данные на графике
plt.figure(figsize=(12, 6))
ax = sns.barplot(y='district', x='middle_coffee_cup', data=median_bill_dist)
ax.set_title('Средняя (медианная) цена одной чашки капучино в районах Москвы', size=16, weight= 900)
ax.set_ylabel('Наименование района')
ax.set_xlabel('Медианная цена, руб.')
plt.xlim([120, 200])
plt.show()

Средняя стоимость чашки капучино в кофейнях по городу - 175 руб., медианная цена - 170 руб. По районам самая высокая стоимость 198 руб. в Юго-Западном районе. Также в первую тройку лидеров входят Центральный и Западный районы (190 и 189 руб. соответственно). Для остальных районов цена ниже среднего значения. Минимальная цена характерна для Восточного района (135 руб.)

---
<a id='coffee7'></a> 
### Средний чек в кофейнях
[Назад к оглавлению](#contens)

Изучим сумму среднего чека в кофейнях в целом по городу и по кофейням.

In [None]:
# изучим датафрейм, удалив пропуски в столбце
df_middle_bill = df_coffee.query('middle_avg_bill != -1')
share_middle_bill= len(df_middle_bill)/len(df_coffee)
print('Всего кофеен, по которым есть данные о среднем чеке:', len(df_middle_bill))
print(f'Доля таких кофеен: {share_middle_bill:.2%}')

Информации по среднему чеку в кофейнях крайне мало, но изучим то, что есть.

In [None]:
# посчитаем среднюю медианную сумму чека по городу
median_middle_bill = df_middle_bill['middle_avg_bill'].median()
print('Средняя (медианная) сумма чека по г. Москве:', median_middle_bill)

# посчитаем данный показатель по районам Москвы
median_middle_bill_dist = (df_middle_bill.groupby('district', as_index=False)['middle_avg_bill'].agg('median')
                           .sort_values(by='middle_avg_bill', ascending=False))
display(median_middle_bill_dist)

# отразим данные на графике
plt.figure(figsize=(12, 6))
ax = sns.barplot(y='district', x='middle_avg_bill', data=median_middle_bill_dist)
ax.set_title('Средняя (медианная) сумма чека в кофейням по районам Москвы', size=16, weight= 900)
ax.set_ylabel('Наименование района')
ax.set_xlabel('Медианная сумма чека, руб.')
plt.xlim([200, 600])
plt.show()

Средний (медианный) чек по городу составляет 400 руб. Максимальный чек характерен для Западного района (600 руб.), минимальный (250 руб.) для Юго-Восточного района. Большая часть районов имеет средний чек ниже медианного по городу.

---
<a id='coffee8'></a> 
### Вывод и рекомендации
[Назад к оглавлению](#contens)

Для выводов сформируем сводную таблицу по районам.

In [None]:
# формируем таблицу
coffee_district['median_rating'] = coffee_rating['median_rating']
coffee_district['middle_coffee_cup'] = median_bill_dist['middle_coffee_cup']
coffee_district['middle_avg_bill'] = median_middle_bill_dist['middle_avg_bill']
coffee_district

Самым популярным районом с кофейнями является Центральный район, который лидирует по средней стоимости чашки капучино и чека. Это вполне логично, так как этот район является событийным и туристическим центром. Стоит отметить Западный район, в котором кофеен в 3 раза меньше, чем в Центральном, но средняя цена чашки капучино и чек тажке велики (189 руб. и 600 руб.). В Северо-Западном и Юго-Восточном районах минимальное количество заведений, что может обеспечить малую конкурентность, но в то же время это может быть связано с малой плотностью населения в этих районах.

Режим работы большинства кофеен ежедневный с 10 до 22 часов. Круглосутоных кофеен значительно меньше, что также можно рассмотреть как потенциальное свойство своего заведения.

\
*Проанализировав данные по кофейням г. Москвы, могу дать следующие рекомендации.*
\
Учитывая наличие большого количества кофеен создаваемое заведение должно быть привлекательным и запоминающимся, отличаться от существующих заведений. Это может быть панорамное заведение с красивым видом из окон, редкие сорта кофе и необычные блюда, интересный способ подачи блюд, цифровое меню и т.д. В качестве района для размещения можно рассмотреть Центральный район как наиболее популярный среди жителей и туристов. Для снижения влияния конкурентов можно выбрать Северо-Западный или Юго-Восточный районы, но также нужно чем-то особенным привлекать клиентов. 
\
Рекомендуемый режим работы: ежедневно с 10 до 22 часов. Если кофейня будет размещена возле офисных центров, то лучше пересести открытие на более раннее время и добавить функцию еды навынос. При открытии заведения в центре можно рассмореть круглосуточный режим работы.
\
Рейтинг кофеен по городу довольно высокий (4.2 и выше), поэтому важно обеспечить высокое качество блюд, написткв и сервиса в заведении.
\
При формировании цен рекомендую отталкиваться от средних цен по району. При этом наличие уникальной "фишки" заведения позволит определить цену выше среднего.
\
Важно учитывать, что анализ проведен на основе неполных представленных данных и их необходимо корректировать и уточнять в бизнес-плане для конкретной бизнес-идее.

---
<a id='presentation'></a> 
## Презентация
[Назад к оглавлению](#contens)

Ссылка для просмотра презентации: https://drive.google.com/file/d/1emvWOIh7Q2GhXfkgpnsEHepevaUMUeWm/view?usp=drive_link