
# **Projeto Final para a Disciplina de Introdução a Programação em Python**

### Informática Biomédica

### Universidade Federal de Ciências da Saúde de Porto Alegre - UFCSPA


*   Luis Fernando Braga



# Enunciado
O arquivo "*owid-covid-data.csv*" contém dados de diversos países coletados entre janeiro de 2020 e junho de 2021, referentes à pandemia de COVID-19. Esse arquivo está disponível em: https://www.kaggle.com/datasets/fedesoriano/coronavirus-covid19-vaccinations-data, onde pode-se encontrar sua descrição completa.

1) Selecione **pelo menos dois países** e **pelo menos cinco variáveis.**. Faça uma **análise comparativa dessas variáveis entre os países escolhidos.** Utilize o *Matplotlib* para demonstrar as suas análises (você deve apresentar **pelo menos cinco gráficos, um para cada variável analisada).** Você é livre para escolher as variáveis e tipos de gráficos que quer utilizar, portanto seja criativo! Fundamente sua análise em reportagens (de um meio de comunicação confiável) ou artigos científicos. Neste caso, coloque a fonte utilizada. Abaixo, um exemplo:

In [None]:
from google.colab import drive
drive.mount('/content/gdrive')

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches

In [None]:
DF = pd.read_csv("/content/gdrive/MyDrive/Python/owid-covid-data.csv", delimiter=',')

#**1 - Comparação entre número de casos nos Estados Unidos e Brasil em 2020 e 2021. (total_cases_per_million)**

*Nos últimos meses, os EUA enfrentaram uma escalada de novos casos diários de Covid-19 por conta da variante Delta. No início de julho, eram 40 casos por dia a cada 1 milhão de habitantes. Hoje, são 490 casos — um aumento de mais de 10 vezes.*

*Já o Brasil fez o caminho inverso: saiu de 360 novos casos por dia a cada 1 milhão de habitantes para 102 casos diários na mesma proporção.*

Fonte: https://www.cnnbrasil.com.br/saude/brasil-e-eua-vivem-momentos-diferentes-da-pandemia-com-temor-de-variante-delta/

In [None]:
brazil = [DF[(DF["location"] == "Brazil")]]
DF_BRA = pd.concat(brazil, axis=1)
DF_DATE_BRA = pd.to_datetime(DF_BRA["date"])

eua = [DF[(DF["location"] == "United States")]]
DF_EUA = pd.concat(eua, axis=1)
DF_DATE_EUA = pd.to_datetime(DF_EUA["date"])

plt.figure(figsize=(15,5))

plt.plot(DF_DATE_BRA, DF_BRA["total_cases_per_million"], 'm--', DF_DATE_EUA, DF_EUA["total_cases_per_million"], 'g--')
plt.legend(['Brasil',"Estados Unidos"],fontsize=15,loc=0)
plt.xlabel("Período de ocorrência",fontsize=10)
plt.ylabel("Casos por milhão de habitantes",fontsize=10)

plt.tight_layout()

#**2 - Análise de mortes por Covid-19 no Mundo (total_deaths)**

*Mais de 5 milhões de pessoas já morreram de Covid-19 em todo o mundo desde o início da pandemia. A marca foi atingida nesta segunda-feira (1º), 117 dias depois do registro de 4 milhões de vítimas, segundo dados da Universidade Johns Hopkins.*

*Na última semana, os óbitos voltaram a subir 5% globalmente, segundo o mais recente relatório da Organização Mundial de Saúde (OMS). As piores situações são na Europa, que teve 14% mais mortes do que na semana anterior, e na Ásia, com um aumento de 13% no mesmo período.*

*Outro fator preocupante é o caso da Rússia, que diariamente tem batido recordes de casos e mortes. Já no Brasil, a situação neste momento é bem melhor do que quando o mundo tinha 4 milhões de mortes pela doença.*

*Na época, o país tinha a pior média mundial de óbitos, posição que hoje cabe à Romênia. Hoje, o Brasil é o 40º nesse mesmo ranking, segundo o site "Our World in Data".*

Fonte: https://g1.globo.com/mundo/noticia/2021/11/01/mundo-passa-dos-5-milhoes-de-mortes-por-covid.ghtml

In [None]:
eua = [DF[(DF["location"] == "United States")]]
DF_EUA = pd.concat(eua, axis=1)
DF_EUA['date'] = pd.to_datetime(DF_EUA['date'])
DEATHS_EUA = DF_EUA[DF_EUA['date'] == '2021-06-28']['total_deaths'].sum()

brazil = [DF[(DF["location"] == "Brazil")]]
DF_BRA = pd.concat(brazil, axis=1)
DF_BRA['date'] = pd.to_datetime(DF_BRA['date'])
DEATHS_BRA = DF_BRA[DF_BRA['date'] == '2021-06-28']['total_deaths'].sum()

india = [DF[(DF["location"] == "India")]]
DF_IN = pd.concat(india, axis=1)
DF_IN['date'] = pd.to_datetime(DF_IN['date'])
DEATHS_IN = DF_IN[DF_IN['date'] == '2021-06-28']['total_deaths'].sum()

russia = [DF[(DF["location"] == "Russia")]]
DF_RU = pd.concat(russia, axis=1)
DF_RU['date'] = pd.to_datetime(DF_RU['date'])
DEATHS_RU = DF_RU[DF_RU['date'] == '2021-06-28']['total_deaths'].sum()

romania = [DF[(DF["location"] == "Romania")]]
DF_RO = pd.concat(romania, axis=1)
DF_RO['date'] = pd.to_datetime(DF_RO['date'])
DEATHS_RO = DF_RO[DF_RO['date'] == '2021-06-28']['total_deaths'].sum()

EUA = mpatches.Patch(color='C', label='Estados Unidos')
BR = mpatches.Patch(color='G', label='Brasil')
IN = mpatches.Patch(color='Y', label='Índia')
RU = mpatches.Patch(color='R', label='Rússia')
RO = mpatches.Patch(color='B', label='Romênia')

x = np.arange(5)
width = 0.6

plt.figure(figsize=(15,5));
plt.bar(x,[DEATHS_EUA,DEATHS_BRA,DEATHS_IN,DEATHS_RU,DEATHS_RO],color=['C','G','Y','R','B']);
plt.xticks(x,[DEATHS_EUA,DEATHS_BRA,DEATHS_IN,DEATHS_RU,DEATHS_RO]);
plt.grid();

plt.legend(handles=[EUA, BR, IN, RU, RO])
plt.title('Comparação de mortes pela Covid-19 sobre alguns países citados no artigo');

plt.tight_layout()

# **3 - Comparação de número de mortes por milhão da Argentina com Peru no mês de Junho de 2021 (*totaldeathsper_million*)**
De acordo com a reportagem do portal Poder360, em Junho de 2021 a Argentina se tornou o 13º país no ranking de mortes por milhão de habitantes com por volta de 2000 mortes por milhão e o Peru aparece como primeira posição no ranking com aproximadamente 5000.

Fonte: https://www.poder360.com.br/internacional/covid-no-mundo-argentina-vai-ao-13o-lugar-do-ranking-de-mortes-por-milhao/


In [None]:
argentina = [DF[(DF["location"] == "Argentina") & (DF["date"] >= '2021-06-01')]] #Por não possuir registros após o mês de Junho de 2021 não é necessário fazer a limitação superior
DF_ARG = pd.concat(argentina, axis=1)

DF_ARG['date'] = pd.to_datetime(DF_ARG['date'])

peru = [DF[(DF["location"] == "Peru") & (DF["date"] >= '2021-06-01')]]
DF_PER = pd.concat(peru, axis=1)

DF_PER['date'] = pd.to_datetime(DF_PER['date'])


plt.figure(figsize=(15,5))

plt.plot(DF_PER['date'], DF_PER["total_deaths_per_million"], 'ko-', DF_ARG['date'], DF_ARG["total_deaths_per_million"], 'bo-')
plt.legend(['Peru',"Argentina"],fontsize=15,loc=0)
plt.xlabel("Data",fontsize=10)
plt.ylabel("Mortes por milhão de habitantes",fontsize=10)

plt.tight_layout()


# **4 - Imunização Brasil x EUA (new_vaccinations)**

"*O Brasil já tem mais de 25 milhões de doses de vacinas contra a Covid-19 administradas. O país ultrapassou a marca nas últimas 24 horas e até agora aplicou 25.293.644 injeções contra a doença. O número equivale a 19.762.485 de pessoas que receberam a primeira dose em todo o território nacional e as 5.531.159 restantes, à administração da segunda dose.*"

"*Isso significa que 9,4% dos brasileiros já receberam ao menos uma dose da vacina contra a Covid-19. Ao considerar aqueles totalmente imunizados, a taxa cai para 2,6%.*"


Fonte: https://veja.abril.com.br/saude/brasil-supera-a-marca-de-25-milhoes-de-doses-contra-covid-19-aplicadas/

In [None]:
brazil = [DF[(DF["location"] == "Brazil")]]
DF_BRA = pd.concat(brazil, axis=1)
DF_BRA['date'] = pd.to_datetime(DF_BRA['date'])


BRA_vacined = ((DF_BRA[(DF_BRA['date'] >= '2020-01-01') & (DF_BRA['date'] <= '2021-04-06')]['new_vaccinations'].sum()) / DF_BRA[DF_BRA['date'] == '2020-04-06']['population']) *100
EUA_vacined = ((DF_EUA[(DF_EUA['date'] >= '2020-01-01') & (DF_EUA['date'] <= '2021-04-06')]['new_vaccinations'].sum()) / DF_EUA[DF_EUA['date'] == '2020-04-06']['population']) *100

labels1 = 'Vacinados Brasil', 'Não-Vacinados Brasil'
sizes1 = [BRA_vacined, (100-BRA_vacined)]

labels2 = 'Vacinados Estados Unidos', 'Não-Vacinados Estados Unidos'
sizes2 = [EUA_vacined, (100-EUA_vacined)]

explode = [0.2, 0]

colors = ['#D0E1D4','#71697a']


fig1, ax1 = plt.subplots()
ax1.pie(sizes1, explode=explode, colors=colors, labels=labels1, autopct='%1.2f%%', shadow=True, startangle=90)
ax1.axis('equal')

fig1, ax2 = plt.subplots()
ax2.pie(sizes2, explode=explode, colors=colors, labels=labels2, autopct='%1.2f%%', shadow=True, startangle=90)
ax2.axis('equal')
plt.show

# **5 - Número total de casos de COVID-19 até 07 de Julho de 2020 no Brasil vs Estados Unidos (total_cases)**

"*A Organização Mundial da Saúde (OMS) registrou um novo recorde no número de casos confirmados de coronavírus em um período de 24 horas, superando 230 mil.*"

"*No Brasil, o número de casos confirmados ultrapassou 1.864.000 neste domingo (12) e deve ultrapassar 2 milhões ainda nesta semana, segundo indica uma projeção feita à pedido da BBC News Brasil.*"

Utilizamos os dados disponibilizados para conferir se a projeção feita à pedido da BBC News Brasil estava correta e realmente ao fim da semana do dia 12 de Julho, o total de casos no Brasil já estava em 2 milhões e setenta e quatro mil. 



Fonte: https://www.bbc.com/portuguese/internacional-53392413