# Проект анализ перелетов

### Задачи проекта:
- импортировать файлы;
- изучить данные в них;
- проверить типы данных на корректность;
- выбрать топ-10 городов по количеству рейсов;
- построить графики:
    - модели самолетов и количество рейсов
    - города и количество рейсов
    - топ-10 городов и количество рейсов;
- сделать выводы по каждому из графиков, пояснить результат.


In [1]:
#все импорты, отключение предупреждений, максимальная шириша колонок в таблице, а также смена отображения таблиц
import pandas as pd
import matplotlib.pyplot as plt
import warnings
import plotly.express as px
from IPython.display import display, HTML
pd.options.mode.chained_assignment = None
pd.set_option('display.max_columns', 40)
warnings.filterwarnings("ignore")

CSS = """
.output {
    flex-direction: row;
}
"""
HTML('<style>{}</style>'.format(CSS))

In [2]:
#Чтобы не было проблем совместимости
!pip install plotly --upgrade --user



In [3]:
#откроем датасеты и сделаем первоначальный осмотр данных
try: #local
    data_mf = pd.read_csv('data/query_1.csv') #data_mf сокращенно от model flights
    data_cf = pd.read_csv('data/query_3.csv') #data_mf сокращенно от city flights
except: #yandex practicum
    data_mf = pd.read_csv('/datasets/query_1.csv') #data_mf сокращенно от model flights
    data_cf = pd.read_csv('/datasets/query_3.csv') #data_mf сокращенно от city flights

FileNotFoundError: [Errno 2] No such file or directory: '/datasets/query_1.csv'

In [None]:
data_cf.info()

In [None]:
data_mf.info()

In [None]:
display(data_mf.describe())
display(data_cf.describe())


In [None]:
# выбросы в data_cf
out_cf = data_cf[data_cf['average_flights'] > 17]
display(out_cf)

#Выбор топ 10 городов по количеству рейсов.
top_10_city = data_cf.sort_values(by='average_flights', ascending=False).head(10)
display(top_10_city)

In [None]:
plt.boxplot(data_mf['flights_amount'], labels = ['flights_amount'])
plt.show()
plt.boxplot(data_cf['average_flights'], labels = ['average_flights'])
plt.show()

# Первичные выводы после изучения данных
1. Пропусков в данных нет.
2. Все типы данных в обоих датасетах приемлемые для анализа, и их можно не менять.
3. Дата сет с количеством полетов по моделям самолета, на графике ящика с усами, показывает что медиана находится на отметке чуть ниже 1000 рейсов, за усами коробки нет выбросов - а значит нет значений выбивающихся из общей динамики.
4. Ящик с усами для средних значений по городам в августе 2018, имеет три выброса за набором данных это город Новосибирск, Москва и Питер, не удивительно это крупные города и очень загруженные международные аэропорты.
5. Выбраны топ 10 городов для анализа

# Построение графиков и анализ
### Построить графики:
- модели самолетов и количество рейсов
- города и количество рейсов
- топ-10 городов и количество рейсов

In [None]:
display(px.bar(data_mf, x = 'model', y = 'flights_amount', color = 'model', 
               title = 'Количество рейсов по моделям самолета'))

In [None]:
display(px.bar(data_cf.sort_values(by='average_flights', ascending=False),
               x = 'city',y = 'average_flights' , color = 'city',
              title = 'Количество перелетов по городам назначения'))

In [None]:
display(px.bar(top_10_city, x = 'city', y = 'average_flights',
               color = 'average_flights',
              title = ''))


<img src="https://i.ibb.co/Y8HWpH3/newplot-45.png">
<img src="https://i.ibb.co/rdnh93K/newplot-44.png">
<img src="https://i.ibb.co/svXL4yX/newplot-43.png">



*«F9» — это российская авиакомпания, выполняющая внутренние пассажирские авиаперевозки. Сотни перелётов каждый день. Важно понять предпочтения пользователей, покупающих билеты на те или иные направления.
Вам предстоит изучить базу данных и проанализировать спрос пассажиров на рейсы в города, где проходят крупнейшие фестивали.*

# Общие выводы
1. Топ 3 моделей самолетов, используемых для перелетов это Cessna 208 Caravan, Bobmardier CRJ-200, Sukhoi SuperJet -100. Остальные модели самолетов отстают на тысячи рейсов.
2. Все дороги ведут в Москву, что ж это не удивительно, как мы помним из предущего анализа баз данных, в москве 3 аэропорта, что создает дополнительные места для прилетов и вылетов, а также Москва международный аэропорт.
3. Топ 10 городов на графике это: 
        1. Москва	129.774194
        2. Санкт-Петербург	31.161290
        3. Новосибирск	17.322581
        4. Красноярск	11.580645
        5. Екатеринбург	11.322581
        6. Ростов-на-Дону	10.193548
        7. Пермь	10.129032
        8. Брянск	10.000000
        9. Сочи	9.612903
        10. Ульяновск	9.580645
   Москва лидириует с огромным отрывом от всех отсальных городов. Это столица России и главные аэропорты страны, все регионы летят в Москву за лучшей жизнью или просто прогуляться по красной площади. Санкт-Петербург не менее привлекательный город в стране для туризма. Новосибирск это путь на восток, если вы хотите путешествовать в восточную часть страны то вам в Новосибирск однозначно.

**Отвечая на главный вопрос исследования, можно сказать что спрос на авиабилеты не сильно изменился на рейсы в города где проходят фестивали. Москва это главный аэропорт в стране вне каких то сомнений. Если посмотреть население городов в России то Москва займет первое место, Питер второе, Новосибирск третье, затем Екатеринбург, затем Красноярск - можно очень смело предположить что количество рейсов в города зависит от их населения, в Топе 4 из 10 города миллионики России. Ростов и Сочи это Юг, а у нас данные за август-сентябрь - "бархатный сезон на югах" :)**