In [None]:
import pandas as pd
import numpy as np
import datetime
from datetime import datetime,timedelta
from sklearn.metrics import mean_squared_error
from scipy.optimize import curve_fit
from scipy.optimize import fsolve
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
# faz a leitura do ficheiro de dados localizado no github

url = 'https://raw.githubusercontent.com/Miguel-Salgado/covid-19/master/casos-confirmados-de-cov.csv'
df = pd.read_csv(url,error_bad_lines=False)
df.head(40)


In [None]:
# define a função usada no modelo

def logistic_model(x,a,b,c):
    return c/(np.exp((b-x)/a)+1)

In [None]:
# utiliza curve.fit para fazer o ajuste dos dados, calculando os parâmetros a,b,c

x = list(df.iloc[:,0])
y = list(df.iloc[:,1])

fit = curve_fit(logistic_model,x,y,p0=[3,80,2100])

param_a = fit[0][0]
param_b = fit[0][1]
param_c = fit[0][2]

print("a = % 5.2f; b = % 5.2f; c = % 5.2f" %(param_a, param_b, param_c))

In [None]:
# calcula o erro associado ao ajuste efetuado 

errors = [np.sqrt(fit[1][i][i]) for i in [0,1,2]]
y_pred_logistic = [logistic_model(i,fit[0][0],fit[0][1],fit[0][2]) for i in x]

In [None]:
# calcula a data final da infeção resolvendo a equação associada ao modelo

sol = int(fsolve(lambda x : logistic_model(x,param_a,param_b,param_c) - int(param_c),param_b))
end_date = datetime(2020, 1, 1) + timedelta(days=sol)

In [None]:
# constrói o gráfico e mostra os resultados das predições

pred_x = list(range(max(x),sol))
plt.rcParams['figure.figsize'] = [7, 7]
plt.rc('font', size=14)

# Real data
plt.scatter(x,y,label="Casos confirmados",color="red")

# Predicted logistic curve
plt.plot(x+pred_x, [logistic_model(i,fit[0][0],fit[0][1],fit[0][2]) for i in x+pred_x], label="Previsão" )
plt.legend()
plt.xlabel("Dias desde 1 Janeiro 2020")
plt.ylabel("Total de infetados")
plt.ylim((min(y)*0.9,param_c*1.1))
plt.show()

# print previsões
print("Previsão de casos confirmados para amanhã: %d indivíduos" %(logistic_model(max(x)+1,fit[0][0],fit[0][1],fit[0][2])))
print("Previsão do número total de infetados: %2d +/- %2d indivíduos" %(param_c, errors[2]))
print("Previsão do final da infeção: %d/%d/%d" %(end_date.day, end_date.month, end_date.year))
print("Erro quadrado médio do ajuste: %1d" %mean_squared_error(y,y_pred_logistic))
