In [None]:
import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv('disney_movies.csv')

In [None]:
# 2. Ver informações básicas
print("Colunas disponíveis:", df.columns)
print("\nTotal de registros:", len(df))
print("\nResumo do dataset:")
print(df.info())

In [None]:
# 3. Verificar valores faltantes (mas sem remover nada)
print("\nValores faltantes por coluna:")
print(df.isnull().sum())

In [None]:
# Remover símbolos e converter para número
df['inflation_adjusted_gross'] = (
    df['inflation_adjusted_gross']
    .replace('[\$,]', '', regex=True)   # remove $ e vírgulas
    .astype(float)                      # converte para float
)

In [None]:
# 4. Gráfico 1 — Distribuição da bilheteria ajustada pela inflação
plt.figure(figsize=(8,5))
plt.hist(df['inflation_adjusted_gross'].dropna(), bins=20, color='skyblue', edgecolor='black')
plt.title('Distribuição da Bilheteria Ajustada (Disney)')
plt.xlabel('Bilheteria Ajustada ($)')
plt.ylabel('Quantidade de Filmes')
plt.show()


In [None]:
# 5. Gráfico 2 — Top 10 filmes da Disney com maior bilheteria ajustada
top10 = df.sort_values(by='inflation_adjusted_gross', ascending=False).head(10)

plt.figure(figsize=(10,6))
plt.barh(top10['movie_title'], top10['inflation_adjusted_gross'], color='lightgreen')
plt.title('Top 10 Filmes da Disney por Bilheteria Ajustada')
plt.xlabel('Bilheteria Ajustada ($)')
plt.ylabel('Filme')
plt.gca().invert_yaxis()
plt.show()


In [None]:
# 6. Gráfico 3 — Gêneros mais frequentes
plt.figure(figsize=(10,5))
df['genre'].value_counts().head(10).plot(kind='bar', color='salmon')
plt.title('Top 10 Gêneros Mais Frequentes (Disney)')
plt.xlabel('Gênero')
plt.ylabel('Quantidade de Filmes')
plt.show()


In [None]:
# 7. (Opcional) Gráfico 4 — Quantidade de filmes lançados por ano
# Primeiro, extrair o ano da coluna de data, se possível
df['year'] = pd.to_datetime(df['release_date'], errors='coerce').dt.year

plt.figure(figsize=(10,5))
df['year'].value_counts().sort_index().plot(kind='line', marker='o', color='mediumpurple')
plt.title('Quantidade de Filmes Lançados por Ano (Disney)')
plt.xlabel('Ano')
plt.ylabel('Quantidade de Filmes')
plt.grid(True)
plt.show()

In [None]:
print(df['year'].unique())
print(df['year'].value_counts())
