In [21]:
import requests
import gzip
import pandas as pd


# URL do arquivo CSV.gz
url = "https://data.brasil.io/dataset/covid19/caso_full.csv.gz"

# Caminho do arquivo descompactado
caminho_arquivo = "caso_full.csv"


# Baixar o arquivo da URL
response = requests.get(url)

# Salvar o arquivo em disco
with open("caso_full.csv.gz", "wb") as f:
    f.write(response.content)


# Descompactar o arquivo
with gzip.open("caso_full.csv.gz", "rb") as f_in:
    with open(caminho_arquivo, "wb") as f_out:
        f_out.write(f_in.read())


# Ler o arquivo CSV utilizando o Pandas
df = pd.read_csv(caminho_arquivo)


# Filtrar os estados desejados
regiao_norte = ['AC', 'AM', 'RR', 'PA', 'AP','RO','TO']
regiao_nordeste = ['MA', 'PI', 'CE', 'RN', 'PB', 'PE', 'AL', 'SE', 'BA']
regiao_centro_oeste = ['MT', 'GO', 'DF', 'MS']
regiao_sudeste = ['MG', 'SP', 'RJ', 'ES']
regiao_sul = ['PR', 'SC', 'RS']

df_norte = df[df['state'].isin(regiao_norte)]
df_nordeste = df[df['state'].isin(regiao_nordeste)]
df_centro_oeste = df[df['state'].isin(regiao_centro_oeste)]
df_sudeste = df[df['state'].isin(regiao_sudeste)]
df_sul = df[df['state'].isin(regiao_sul)]


# Introdução
introducao = """
Introdução:
Este documento analisa os dados do COVID-19 disponíveis no link https://data.brasil.io/dataset/covid19/caso_full.csv.gz.
Os dados fornecidos contêm informações sobre casos confirmados, óbitos e recuperados em diferentes regiões do Brasil.
"""

# Objetivo
objetivo = """
Objetivo:
O objetivo deste estudo é analisar os dados do COVID-19 e identificar tendências, padrões e insights relevantes para entender a evolução da pandemia no Brasil e nas regiões Norte, Nordeste, Centro Oeste, Sudeste e Sul.
"""

# Metodologia
metodologia = """
Metodologia:
1. Carregar os dados utilizando o Pandas.
2. Realizar tratamento dos dados separando as regiões do Brasil.
3. Explorar os dados e extrair informações relevantes.
4. Aplicar técnicas de análise de dados para identificar tendências e padrões.
5. Visualizar os resultados por meio de gráficos e tabelas.
"""
# Resultados
# Exemplo: contar o número total de casos confirmados, óbitos e recuperados

#Regiao Norte
total_casos_confirmados_norte = df_norte['last_available_confirmed'].sum()
total_obitos_norte = df_norte['last_available_deaths'].sum()
total_recuperados_norte = total_casos_confirmados_norte - total_obitos_norte 

#Regiao Nordeste
total_casos_confirmados_nordeste = df_nordeste['last_available_confirmed'].sum()
total_obitos_nordeste = df_nordeste['last_available_deaths'].sum()
total_recuperados_nordeste = total_casos_confirmados_nordeste - total_obitos_nordeste 

#Regiao Centro Oeste
total_casos_confirmados_centro_oeste = df_centro_oeste['last_available_confirmed'].sum()
total_obitos_centro_oeste = df_centro_oeste['last_available_deaths'].sum()
total_recuperados_centro_oeste = total_casos_confirmados_centro_oeste - total_obitos_centro_oeste 

#Regiao Sudeste
total_casos_confirmados_sudeste = df_sudeste['last_available_confirmed'].sum()
total_obitos_sudeste = df_sudeste['last_available_deaths'].sum()
total_recuperados_sudeste = total_casos_confirmados_sudeste - total_obitos_sudeste 

#Regiao Sul
total_casos_confirmados_sul = df_sul['last_available_confirmed'].sum()
total_obitos_sul = df_sul['last_available_deaths'].sum()
total_recuperados_sul = total_casos_confirmados_sul - total_obitos_sul

#Brasil
total_casos_confirmados = df['last_available_confirmed'].sum()
total_obitos = df['last_available_deaths'].sum()
total_recuperados = total_casos_confirmados - total_obitos 

resultados = f"""
Resultados Região Norte:
- Total de casos confirmados: {total_casos_confirmados_norte:,.2f}
- Total de óbitos: {total_obitos_norte:,.2f}
- Total de recuperados: {total_recuperados_norte:,.2f}

Resultados Região Nordeste:
- Total de casos confirmados: {total_casos_confirmados_nordeste:,.2f}
- Total de óbitos: {total_obitos_nordeste:,.2f}
- Total de recuperados: {total_recuperados_nordeste:,.2f}

Resultados Região Centro Oeste:
- Total de casos confirmados: {total_casos_confirmados_centro_oeste:,.2f}
- Total de óbitos: {total_obitos_centro_oeste:,.2f}
- Total de recuperados: {total_recuperados_centro_oeste:,.2f}

Resultados Região Sudeste:
- Total de casos confirmados: {total_casos_confirmados_sudeste:,.2f}
- Total de óbitos: {total_obitos_sudeste:,.2f}
- Total de recuperados: {total_recuperados_sudeste:,.2f}

Resultados Região Sul:
- Total de casos confirmados: {total_casos_confirmados_sul:,.2f}
- Total de óbitos: {total_obitos_sul:,.2f}
- Total de recuperados: {total_recuperados_sul:,.2f}

Resultados Brasil:
- Total de casos confirmados: {total_casos_confirmados:,.2f}
- Total de óbitos: {total_obitos:,.2f}
- Total de recuperados: {total_recuperados:,.2f}
"""

# Conclusão
conclusao = """
Conclusão:
Com base na análise dos dados do COVID-19, podemos observar o impacto significativo da pandemia no Brasil. O número total de casos confirmados, óbitos e recuperados indica a gravidade da situação. É essencial continuar seguindo as medidas de prevenção, como o distanciamento social, uso de máscaras e higienização regular das mãos, para controlar a propagação do vírus e reduzir o número de casos.
"""

# Imprimir a documentação
print(introducao)
print(objetivo)
print(metodologia)
print(resultados)
print(conclusao)



Introdução:
Este documento analisa os dados do COVID-19 disponíveis no link https://data.brasil.io/dataset/covid19/caso_full.csv.gz.
Os dados fornecidos contêm informações sobre casos confirmados, óbitos e recuperados em diferentes regiões do Brasil.


Objetivo:
O objetivo deste estudo é analisar os dados do COVID-19 e identificar tendências, padrões e insights relevantes para entender a evolução da pandemia no Brasil e nas regiões Norte, Nordeste, Centro Oeste, Sudeste e Sul.


Metodologia:
1. Carregar os dados utilizando o Pandas.
2. Realizar tratamento dos dados separando as regiões do Brasil.
3. Explorar os dados e extrair informações relevantes.
4. Aplicar técnicas de análise de dados para identificar tendências e padrões.
5. Visualizar os resultados por meio de gráficos e tabelas.


Resultados Região Norte:
- Total de casos confirmados: 1,753,895,921.00
- Total de óbitos: 42,925,471.00
- Total de recuperados: 1,710,970,450.00

Resultados Região Nordeste:
- Total de casos confirm