In [None]:
from urllib.request import Request, urlopen
import pandas as pd
import io
#import matplotlib.pyplot as plt
import gzip
import plotly.express as px
import chart_studio.plotly as py
from datetime import datetime
#pd.set_option("max_rows", None)

In [None]:
# Baixar a base de dados caso_full.csv em  https://brasil.io/dataset/covid19/files/

# Código retirado de https://gist.github.com/turicas/3e3621d61415e3453cd03a1997f7473f#file-brasil_io-py

def get_database():

    class BrasilIO:

        base_url = "https://api.brasil.io/v1/"

        def __init__(self, user_agent=None, auth_token=None):
            """
            Caso queria fazer uma requisição na API, passe os parâmetros user_agent e auth_token.
            Para fazer somente o download do arquivo completo, não é necessário passar nenhum parâmetro.
            """
            self.__user_agent = user_agent
            self.__auth_token = auth_token

        def headers(self, api=True):
            if api:
                return {
                    "User-Agent": f"{self.__user_agent}",
                    "Authorization": f"Token {self.__auth_token}"
                }
            else:
                return {
                    "User-Agent": "python-urllib/brasilio-client-0.1.0",
                }


        def api_request(self, path, query_string=None):
            url = urljoin(self.base_url, path)

            if query_string:
                url += "?" + query_string

            request = Request(url, headers=self.headers(api=True))

            response = urlopen(request)
            return json.load(response)

        def data(self, dataset_slug, table_name, filters=None):
            url = f"dataset/{dataset_slug}/{table_name}/data/"
            filters = filters or {}
            filters["page"] = 1

            finished = False
            while not finished:
                query_string = "&".join([f"{k}={v}" for k, v in filters.items()])
                response = self.api_request(url, query_string)
                next_page = response.get("next", None)
                for row in response["results"]:
                    yield row
                filters = {}
                url = next_page
                finished = next_page is None

        def download(self, dataset, table_name):
            url = f"https://data.brasil.io/dataset/{dataset}/{table_name}.csv.gz"
            request = Request(url, headers=self.headers(api=False))
            response = urlopen(request)
            return response


    if __name__ == "__main__":
        # Caso não tenha, cadastre-se no Brasil.io e gere seu Token
        # Para mais instruções: https://blog.brasil.io/2020/10/10/como-acessar-os-dados-do-brasil-io/
        user_agent = "bwalter"
        auth_token = "a569653206b56d7f8f0aa7ebee6871cafe1835dc"

        api = BrasilIO(user_agent, auth_token)

        dataset_slug = "covid19"
        table_name = "caso_full"


         # Caso queira percorrer o CSV em memória:
        response = api.download(dataset_slug, table_name)
        fobj = io.TextIOWrapper(gzip.GzipFile(fileobj=response), encoding="utf-8")

        df = pd.read_csv(fobj)
    return df


In [None]:
# Carregar base de dados atualizadas
df = get_database()

In [None]:
# Selecionar apenas cidade de Colombo
df = df.loc[df["city"] == "Colombo"]
df = df[['date','order_for_place','new_confirmed','estimated_population']]
df = df.set_index('date')

In [None]:
df

In [None]:
# O número total de novos casos por 100.000 pessoas nos últimos 7 dias é calculado 
# adicionando o número de novos casos nos últimos 7 dias dividido pela população e
# multiplicando por 100.000.
populacao = df['estimated_population']
# Acumulativo dos últimos 7 dias
rolling = df.rolling(window=7).sum()
rolling['MEDIA_MOVEL_7_DIAS'] = (rolling['new_confirmed']/populacao)*100000
rolling

In [None]:
# Deixando apenas os ultimos 365 dias e apenas colunas de interesse
rolling = rolling.reset_index()
rolling = rolling[['date','MEDIA_MOVEL_7_DIAS']]
rolling= rolling.tail(365).reset_index(drop=True)


In [None]:
# Salvar CSV
today = datetime.today()
d = today.strftime("%Y%m%d")
data_atual = str(d)
rolling.to_csv(f'./dados/csv/fator1-preprocessado-{data_atual}', sep=';', index=False)

In [None]:
hoje = today.strftime("%d-%m-%Y")

fig = px.line(rolling, x="date", y="MEDIA_MOVEL_7_DIAS", title=f'Número de novos casos confirmados por 100 mil/hab nos últimos 7 dias - Atualizado em {hoje}', log_y=True, labels=dict(MEDIA_MOVEL_7_DIAS="Casos (escala logarítmica)",date="" ))


fig.add_hrect(y0=50, y1=1400, line_width=0, fillcolor="red", opacity=0.2)
fig.add_hrect(y0=10, y1=50, line_width=0, fillcolor="yellow", opacity=0.2)
fig.add_hrect(y0=0, y1=10, line_width=0, fillcolor="green", opacity=0.2)


fig.update_yaxes(range=[0,3.15], tickmode="linear", fixedrange= True) # linear range
fig.update_xaxes(fixedrange= True)

fig.show()
fig.write_html("indicador-1.html")

py.sign_in(usuario, senha)
plot_url = py.plot(fig)