In [None]:
%matplotlib inline
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as dates
from IPython.display import display

try:
    df = pd.read_csv("comptagevelo2013.csv", delimiter = ",", encoding = "utf-8", index_col = "Date", parse_dates = ["Date"])
    print(f"{"Bike path usage in 2013":^145}")
except FileNotFoundError:
    print("File \"comptagevelo2013.csv\" not found!")
except:
    print("Error with file \"comptagevelo2013.csv\"!")

# Коригування даних - заповнення пропущених значень нулями та конвертація у цілочислений формат 
df = df.fillna(0).astype(int)
display(df)

# Перевірка основних характеристик датафрейму
pd.set_option("display.width", 1000)
print(f"Main characteristics of DataFrame:\nFirst lines (df.head()):\n{"Bike path usage in 2013":^145}\n{df.head()}\n")
print(f"Technical information (df.info()):")
print(df.info())
print(f"\nStatistical analysis (df.describe()):\n{df.describe()}")

# Побудова графіка завантаженості усіх велодоріжок за рік
plt.style.use("ggplot")
plt.rcParams["figure.figsize"] = (20, 8)
ax = df.plot()

plt.title("Chart of all bike path usage for 2013", fontsize = 15, color = "#400099")
plt.xlabel("Date", color = "#1BB549", fontsize = 12)
plt.ylabel("Number of people", color = "#18A743", fontsize = 12)

ax.xaxis.set_major_locator(dates.MonthLocator(interval = 1))
ax.xaxis.set_major_formatter(dates.DateFormatter("%b"))
plt.show()

# Визначення загальної кількості велосипедистів за рік на усіх/кожній велодоріжці, найбільш популярні місяці на трьох велодоріжок
print(f"Total number of cyclists per year on all cycle paths: {int(df.sum().sum())}")
print(f"\nTotal number of cyclists per year on each cycle path: \n{df.sum()}")

print(f"\nThe month most popular with cyclists on three bike paths: ")
for path in df.columns[5:8]:
    month = df[path].groupby(df.index.month).sum().idxmax()
    monthname = pd.to_datetime(f'2023-{month}-01').month_name()
    print(f"{path} - {monthname}")

# Побудова графіка завантаженості однієї велодоріжки по місяцям 
plt.style.use("ggplot")
plt.rcParams["figure.figsize"] = (20, 8)
path = df.columns[2]

plt.title(f"Monthly traffic on {path} bike path", fontsize = 15, color = "#3A0287")
plt.xlabel("Date", color = "#1B84B5", fontsize = 12)
plt.ylabel("Number of people", color = "#1870A7", fontsize = 12)

ax = df[path].plot(color = "#1D18A7")
ax.xaxis.set_major_locator(dates.MonthLocator(interval = 1))
ax.xaxis.set_major_formatter(dates.DateFormatter("%b"))
plt.legend()