# ✈️ Анализ цен на авиабилеты
Расширенный аналитический проект: исследуем маршруты, классы, пересадки и создаём новые метрики.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')

df = pd.read_csv('flight_prices_sample.csv')
df['RouteName'] = df['Source'] + ' → ' + df['Destination']
df.head()

In [None]:
avg_prices = df.groupby('RouteName')['Price'].mean().sort_values(ascending=False)
avg_prices.plot(kind='bar', figsize=(10, 4), title='Средняя цена по маршрутам')
plt.ylabel('Цена')
plt.xticks(rotation=45)
plt.grid(True)
plt.tight_layout()
plt.show()

In [None]:
sns.barplot(data=df, x='Class', y='Price')
plt.title('Средняя цена по классам обслуживания')
plt.grid(True)
plt.show()

In [None]:
top_routes = avg_prices.head(5)
top_routes.plot(kind='bar', color='tomato', title='Топ-5 дорогих маршрутов')
plt.ylabel('Цена')
plt.xticks(rotation=45)
plt.grid(True)
plt.tight_layout()
plt.show()

In [None]:
df.groupby('Airline')['Price'].mean().sort_values(ascending=False)

In [None]:
df['RouteName'].value_counts().head(10)

In [None]:
df.groupby('Total_Stops')['Price'].mean().sort_values()

In [None]:
df.groupby('Class')['Price'].max()

In [None]:
# Перевод длительности в минуты
def duration_to_minutes(s):
    h, m = 0, 0
    if 'h' in s:
        h = int(s.split('h')[0].strip())
    if 'm' in s:
        m = int(s.split('h')[-1].replace('m', '').strip()) if 'm' in s else 0
    return h * 60 + m

df['Duration_Minutes'] = df['Duration'].apply(duration_to_minutes)
df['Price_Per_Minute'] = df['Price'] / df['Duration_Minutes']
df[['RouteName', 'Price', 'Duration', 'Price_Per_Minute']]

## 💡 Выводы
- У маршрутов разная средняя цена, даже при одинаковом расстоянии
- Класс обслуживания и количество пересадок сильно влияют на стоимость
- Метрика 'цена за минуту' помогает сравнивать эффективность
- Проект можно расширить анализом по авиакомпаниям, времени и дате