In [None]:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Загрузка данных
df = pd.read_csv('kicksharing.csv')

# Предобработка
df['book_start_dttm'] = pd.to_datetime(df['book_start_dttm'])
df['book_end_dttm'] = pd.to_datetime(df['book_end_dttm'])
df['ride_duration_min'] = (df['book_end_dttm'] - df['book_start_dttm']).dt.total_seconds() / 60
df['hour'] = df['book_start_dttm'].dt.hour
df['month'] = df['book_start_dttm'].dt.month
df['weekday'] = df['book_start_dttm'].dt.dayofweek


In [None]:

# Распределение длительности поездок
sns.histplot(df['ride_duration_min'], bins=50, kde=True)
plt.title('Распределение длительности поездок (мин)')
plt.xlabel('Минуты')
plt.ylabel('Количество поездок')
plt.show()


In [None]:

# Поездки по времени суток
sns.countplot(x='hour', data=df)
plt.title('Поездки по времени суток')
plt.xlabel('Час')
plt.ylabel('Количество поездок')
plt.show()


In [None]:

# Стоимость от расстояния
sns.scatterplot(x='distance_km', y='nominal_price_rub_amt', data=df, alpha=0.5)
plt.title('Стоимость поездки в зависимости от расстояния')
plt.xlabel('Расстояние (км)')
plt.ylabel('Стоимость (руб.)')
plt.show()


In [None]:

# География поездок
top_regions = df['lvn_state_nm'].value_counts().head(10)
sns.barplot(x=top_regions.values, y=top_regions.index)
plt.title('Топ-10 регионов по количеству поездок')
plt.xlabel('Количество поездок')
plt.ylabel('Регион')
plt.show()
