# Análise de Dados da COVID-19 e Relação com Métricas de Felicidade

------------------------------------------

### 1. Importação de Módulos e Configuração Inicial


# 1.1 Importação de Módulos Necessários


In [None]:
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

print('Módulos importados com sucesso.')

## 2. Importação e Preparação dos Dados da COVID-19


### 2.1 Importação dos Datasets de Casos e Mortes

importing "Covid19_Confirmed_dataset.csv" from "./Dataset" folder. 


In [None]:
# Importando os datasets de casos confirmados e mortes por COVID-19
corona_dataset = pd.read_csv("./Dataset/Covid19_Confirmed_dataset.csv")
deaths_dataset = pd.read_csv("covid19_deaths_dataset.csv")

#### Let's check the shape of the dataframe

### 2.2 Verificação da Estrutura dos Datasets


In [None]:
print("Formato do Dataset de Casos Confirmados:")
print(corona_dataset.shape)
print("Formato do Dataset de Mortes:")
print(deaths_dataset.shape)

### 2.3 Remoção de Colunas Desnecessárias


In [None]:
# Removendo colunas de latitude e longitude, que não são necessárias para a análise
corona_dataset.drop(columns=["Lat", "Long"], inplace=True)
deaths_dataset.drop(columns=["Lat", "Long"], inplace=True)

print("Cabeçalho do Dataset de Casos Confirmados:")
print(corona_dataset.head().to_markdown(numalign="left", stralign="left"))
print("Cabeçalho do Dataset de Mortes:")
print(deaths_dataset.head().to_markdown(numalign="left", stralign="left"))

###  2.4 Agregação dos Dados por País

In [None]:
# Agrupando os dados por país e somando os valores
corona_dataset_aggregated = corona_dataset.groupby("Country/Region").sum()
deaths_dataset_aggregated = deaths_dataset.groupby("Country/Region").sum()

print("Dataset de Casos Confirmados Agregado:")
print(corona_dataset_aggregated.head().to_markdown(numalign="left", stralign="left"))
print("Dataset de Mortes Agregado:")
print(deaths_dataset_aggregated.head().to_markdown(numalign="left", stralign="left"))

### Task 2.5: Visualizing data related to a country for example China
visualization always helps for better understanding of our data.

In [None]:
# Visualizando a evolução dos casos de COVID-19 na China
corona_dataset_aggregated.loc['China'].plot()
plt.title("Casos de COVID-19 ao Longo do Tempo na China")
plt.xlabel("Dias")
plt.ylabel("Número de Casos")
plt.show()

### Task3: 3. Cálculo de Métricas Relevantes

precisamos encontrar uma boa medida representada como um número, descrevendo a disseminação do vírus em um país. 

### task 3.1:Cálculo da Taxa de Infecção Diária (Primeira Derivada)

In [None]:
# Calculando a taxa de infecção diária (diferença entre os dias)
corona_dataset_aggregated_diff = corona_dataset_aggregated.diff(axis=1)
deaths_dataset_aggregated_diff = deaths_dataset.diff(axis=1)

print("Dataset de Casos Confirmados com Diferença Diária:")
print(corona_dataset_aggregated_diff.head().to_markdown(numalign="left", stralign="left"))
print("Dataset de Mortes com Diferença Diária:")
print(deaths_dataset_aggregated_diff.head().to_markdown(numalign="left", stralign="left"))

### task 3.2: Identificação da Taxa Máxima de Infecção e Mortes por País

In [None]:
# Calculando a taxa de infecção diária (diferença entre os dias)
corona_dataset_aggregated_diff = corona_dataset_aggregated.diff(axis=1)
deaths_dataset_aggregated_diff = deaths_dataset.diff(axis=1)

print("Dataset de Casos Confirmados com Diferença Diária:")
print(corona_dataset_aggregated_diff.head().to_markdown(numalign="left", stralign="left"))
print("Dataset de Mortes com Diferença Diária:")
print(deaths_dataset_aggregated_diff.head().to_markdown(numalign="left", stralign="left"))

### Task 3.3: Criação de DataFrames com as Taxas Máximas

In [None]:
# Criando DataFrames separados para as taxas máximas de infecção e mortes
max_infection_rates_df = pd.DataFrame(max_infection_rates, columns=["Max Infection Rate"])
max_death_rates_df = pd.DataFrame(max_death_rates, columns=["Max Death Rate"])

print("DataFrame de Taxas Máximas de Infecção:")
print(max_infection_rates_df.head().to_markdown(numalign="left", stralign="left"))
print("DataFrame de Taxas Máximas de Mortes:")
print(max_death_rates_df.head().to_markdown(numalign="left", stralign="left"))

### Task 3.4: create a new dataframe with only needed column 

In [None]:
# Criando DataFrames separados para as taxas máximas de infecção e mortes
max_infection_rates_df = pd.DataFrame(max_infection_rates, columns=["Max Infection Rate"])
max_death_rates_df = pd.DataFrame(max_death_rates, columns=["Max Death Rate"])

print("DataFrame de Taxas Máximas de Infecção:")
print(max_infection_rates_df.head().to_markdown(numalign="left", stralign="left"))
print("DataFrame de Taxas Máximas de Mortes:")
print(max_death_rates_df.head().to_markdown(numalign="left", stralign="left"))

### Task4: Importação e Preparação do Dataset de Felicidade Global
- Importando o dataset WorldHappinessReport.csv  
- Selecionando as colunas necessárias para nossa análise  
- Unindo os datasets  
- Calculando as correlações como resultado da nossa análise  

### Task 4.1 : Importação do Dataset de Felicidade

In [None]:
# Importando o dataset de felicidade global
happiness_report = pd.read_csv("./Dataset/worldwide_happiness_report.csv")

print("Cabeçalho do Dataset de Felicidade:")
print(happiness_report.head().to_markdown(numalign="left", stralign="left"))

### Task 4.2: Limpeza e Seleção de Colunas Relevantes

In [None]:
# Mantendo apenas as colunas relevantes para a análise
happiness_report_cleaned = happiness_report[["Country or region", "Score", "GDP per capita",
                                             "Social support", "Healthy life expectancy",
                                             "Freedom to make life choices"]]

print("Dataset de Felicidade Limpo:")
print(happiness_report_cleaned.head().to_markdown(numalign="left", stralign="left"))

### Task 4.3: Ajuste dos Índices do DataFrame

In [None]:
# Definindo a coluna "Country or region" como índice
happiness_report_cleaned.set_index("Country or region", inplace=True)

print("Dataset de Felicidade com Índice Ajustado:")
print(happiness_report_cleaned.head().to_markdown(numalign="left", stralign="left"))

### Task4.4: now let's join two dataset we have prepared  

#### Corona Dataset :

#### wolrd happiness report Dataset :

### Task 4.5: correlation matrix 

### Task 5: Visualization of the results
our Analysis is not finished unless we visualize the results in terms figures and graphs so that everyone can understand what you get out of our analysis

### Task 5.1: Plotting GDP vs maximum Infection rate

### Task 5.2: Plotting Social support vs maximum Infection rate

### Task 5.3: Plotting Healthy life expectancy vs maximum Infection rate

### Task 5.4: Plotting Freedom to make life choices vs maximum Infection rate