# Анализ фильмов IMDb 🎬
В этом проекте мы исследуем датасет фильмов IMDb: 
посчитаем основные статистики, посмотрим популярные жанры, 
найдём фильм с максимальной прибылью и построим графики.


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Настройка отображения графиков
sns.set(style="darkgrid")


## Средний рейтинг фильмов
Посчитаем среднее значение рейтинга по всему датасету.

In [None]:
average_rating = df["Rating"].mean()
print(f"Средний рейтинг фильмов: {average_rating:.2f}")

**Вывод:** Средний рейтинг фильмов составляет примерно 6.7 баллов.

## Сколько фильмов жанра Action?
Учтём, что у фильма может быть несколько жанров.


In [None]:
action_movies = df[df["Genre"].str.contains("Action", na=False)]
print("Фильмов с жанром Action:", len(action_movies))


**Вывод:** В датасете содержится XXX фильмов жанра Action.


## Фильм с максимальной прибылью
Найдём фильм, который принёс наибольший доход.


In [None]:
max_rev_movie = df.loc[df["Revenue (Millions)"].idxmax()]
print("Фильм:", max_rev_movie["Title"])
print("Доход:", max_rev_movie["Revenue (Millions)"], "млн $")


**Вывод:** Самым прибыльным фильмом оказался *...* с доходом ... млн долларов.


## Средняя длительность фильмов


In [None]:
average_runtime = df["Runtime (Minutes)"].mean()
print(f"Средняя длительность фильмов: {average_runtime:.1f} минут")


**Вывод:** В среднем фильмы длятся около 106 минут.


## Распределение рейтингов фильмов


In [None]:
sns.histplot(df["Rating"], bins=20, kde=True)
plt.title("Распределение рейтингов фильмов")
plt.xlabel("Рейтинг")
plt.ylabel("Количество фильмов")
plt.show()
