In [None]:
# Pergunta-1: Analise a distribuição dos casos confirmados de coronavírus por faixa 
etária e sexo no estado do Rio de Janeiro. Quais faixas etárias apresentam maior 
incidência de casos confirmados? Há diferenças significativas entre homens e mulheres 
em relação à faixa etária mais afetada? 

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Importar o dataset
df = pd.read_csv('coronavirus_rj.csv')  # Verifique o nome do arquivo correto

# Agrupar os casos confirmados por faixa etária e sexo
faixa_etaria_sexo = df.groupby(['faixa_etaria', 'sexo'])['casos_confirmados'].sum().reset_index()

# Gráfico de distribuição
plt.figure(figsize=(12, 6))
sns.barplot(x='faixa_etaria', y='casos_confirmados', hue='sexo', data=faixa_etaria_sexo)
plt.title('Distribuição dos Casos Confirmados por Faixa Etária e Sexo')
plt.xlabel('Faixa Etária')
plt.ylabel('Casos Confirmados')
plt.xticks(rotation=45)
plt.legend(title='Sexo')
plt.tight_layout()
plt.show()

# Exibir faixa etária com maior incidência
maior_incidencia = faixa_etaria_sexo.groupby('faixa_etaria')['casos_confirmados'].sum().idxmax()
print(f'A faixa etária com maior incidência de casos confirmados é: {maior_incidencia}')



# Pergunta-2: Em quais bairros do Rio de Janeiro há maior taxa de hospitalizações e 
internações em UTI entre os casos confirmados de COVID-19? Existem bairros onde 
essas taxas são mais altas, independentemente da faixa etária ou sexo?


In [None]:
import pandas as pd
import matplotlib.pyplot as plt

# Importar o dataset
df = pd.read_csv('coronavirus_rj.csv')

# Calcular a taxa de hospitalizações e UTI por bairro
df['taxa_hospitalizacao'] = (df['hospitalizacoes'] / df['casos_confirmados']) * 100
df['taxa_uti'] = (df['internacoes_uti'] / df['casos_confirmados']) * 100

bairros_hospitalizacao = df.groupby('bairro')[['taxa_hospitalizacao', 'taxa_uti']].mean().sort_values(by='taxa_hospitalizacao', ascending=False)

# Gráfico dos bairros com maior taxa de hospitalização
bairros_hospitalizacao.head(10).plot(kind='bar', stacked=True, figsize=(12, 6))
plt.title('Bairros com Maior Taxa de Hospitalizações e Internações em UTI')
plt.xlabel('Bairro')
plt.ylabel('Taxa (%)')
plt.legend(['Hospitalizações', 'UTI'])
plt.tight_layout()
plt.show()

# Exibir os 5 bairros com maior taxa
print("Top 5 bairros com maior taxa de hospitalizações:")
print(bairros_hospitalizacao.head(5))


# Pergunta-3: Compare a média de idade e a taxa de óbitos em diferentes bairros do Rio 
de Janeiro. Há bairros com uma média de idade mais alta que apresentam maior taxa 
de mortalidade? Qual seria a explicação para essas diferenças?


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Importar o dataset
df = pd.read_csv('coronavirus_rj.csv')

# Calcular a média de idade e a taxa de óbitos por bairro
df['taxa_obitos'] = (df['obitos'] / df['casos_confirmados']) * 100
bairros_idade_obitos = df.groupby('bairro')[['idade_media', 'taxa_obitos']].mean()

# Gráfico da média de idade e taxa de óbitos por bairro
plt.figure(figsize=(12, 6))
sns.scatterplot(x='idade_media', y='taxa_obitos', data=bairros_idade_obitos)
plt.title('Média de Idade vs Taxa de Óbitos por Bairro')
plt.xlabel('Média de Idade')
plt.ylabel('Taxa de Óbitos (%)')
plt.tight_layout()
plt.show()

# Exibir os 5 bairros com maior taxa de óbitos
print("Top 5 bairros com maior taxa de óbitos:")
print(bairros_idade_obitos.sort_values(by='taxa_obitos', ascending=False).head(5)) 
