### Описание проекта

##### Аналитика средствами Python
У нас есть файлы, в которых содержатся результаты SQL-запросов из предыдущих заданий.

**_<span style="color:blue">query_1.csv</span>_** — результат первого запроса. В нём содержится информация о: model — модели самолета flights_amount — количество рейсов для каждой модели самолетов model в сентябре 2018 года

**_<span style="color:blue">query_3.csv</span>_** — результат третьего запроса. В нём содержится информация о: city — городах average_flights — среднем количестве рейсов, прибывающих в город city за день в сентябре 2018 года

##### Для этих двух наборов данных нужно:
- импортировать файлы;
- изучить данные в них;
- проверить типы данных на корректность;
- выбрать топ-10 городов по количеству рейсов

##### Построить графики и сделать выводы по каждому из графиков:
- модели самолетов и количество рейсов,
- город и количество рейсов,
- топ-10 городов и количество рейсов.

Импортируем библиотеки:

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

In [2]:
model_flights = pd.read_csv('/datasets/query_1.csv')
city_flights = pd.read_csv('/datasets/query_3.csv')

###### Смотрим данные по количеству совершенных полетов по каждой модели самолета:

In [3]:
(model_flights
             .style.set_caption('Данные по количеству совершенных полетов по каждой модели самолета')
)

Unnamed: 0,model,flights_amount
0,Airbus A319-100,607
1,Airbus A321-200,960
2,Boeing 737-300,630
3,Boeing 767-300,600
4,Boeing 777-300,300
5,Bombardier CRJ-200,4446
6,Cessna 208 Caravan,4557
7,Sukhoi SuperJet-100,4185


In [4]:
model_flights.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 8 entries, 0 to 7
Data columns (total 2 columns):
model             8 non-null object
flights_amount    8 non-null int64
dtypes: int64(1), object(1)
memory usage: 256.0+ bytes


Типы данных корректны. Пропуски отсутствуют.
Данные имею подходящий формат.

###### Строим график: модели самолётов и количество совершённых полётов.

In [5]:
(model_flights.sort_values(by='flights_amount', ascending=False).reset_index(drop=True).style
                                        .bar(subset=['flights_amount'], color='#497df5', vmin=0, width=100)
                                        .set_caption('Количество совершенных полетов по каждой модели самолета')
)

Unnamed: 0,model,flights_amount
0,Cessna 208 Caravan,4557
1,Bombardier CRJ-200,4446
2,Sukhoi SuperJet-100,4185
3,Airbus A321-200,960
4,Boeing 737-300,630
5,Airbus A319-100,607
6,Boeing 767-300,600
7,Boeing 777-300,300


Смотрим данные по среднему количеству рейсов в день по городам:

In [6]:
city_flights.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 101 entries, 0 to 100
Data columns (total 2 columns):
city               101 non-null object
average_flights    101 non-null float64
dtypes: float64(1), object(1)
memory usage: 1.7+ KB


Типы данных корректны. Пропуски отсутствуют.
Данные имею подходящий формат.

In [7]:
(city_flights
             .style.set_caption('Данные по среднему количеству рейсов в день по городам')
)

Unnamed: 0,city,average_flights
0,Абакан,3.87097
1,Анадырь,1.0
2,Анапа,2.16129
3,Архангельск,5.35484
4,Астрахань,2.45161
5,Барнаул,2.6129
6,Белгород,6.0
7,Белоярский,2.0
8,Благовещенск,1.0
9,Братск,1.0


###### Посмотрим на барплот по среднему количеству вылетов в каждом из городов. Здесть же выделим топ-10 (красным цветом):

In [8]:
city_flights = city_flights.sort_values(by='average_flights', ascending=False).reset_index(drop=True)
top10_subset = pd.IndexSlice[city_flights.iloc[:10,1].index, 'average_flights']
(city_flights.style.bar(subset=['average_flights'], color = '#f5f549')
                   .bar(subset=top10_subset, color='#ff5050', vmin=0)
                   .set_caption('Данные по среднему количеству рейсов в день по городам')
)

Unnamed: 0,city,average_flights
0,Москва,129.774
1,Санкт-Петербург,31.1613
2,Новосибирск,17.3226
3,Красноярск,11.5806
4,Екатеринбург,11.3226
5,Ростов-на-Дону,10.1935
6,Пермь,10.129
7,Брянск,10.0
8,Сочи,9.6129
9,Ульяновск,9.58065


### Итого имеем:  
###### 1. С большим отрывом лидируют 3 модели воздушных судов: Цессна 208, Бомбардье 200 и Сухой 100. Неожиданностью явилось то, что на первом месте Цессна, ведь она используется на перелётах малой дальности.

###### 2. Ожидаемо, что на первом месте Москва  — это загруженный транспортный узел. Питер и Новосибирск занимают 2 и 3 места соответственно. Остальные города примерно на одном уровне..