<h1>Projeto Júlia</h1>
<h3>Autor:</h3>
<h6>
    Antônio Ricardo Coelho Alcântara Junior
</h6>
<h3>Tema:</h3>
<h6>
    "Enfrentando a COVID-19 com o uso de Business Analytics"
</h6>
<h3>Introdução:</h3>
<h6>
As superlotações dos hospitais é um dos principais problemas causados pela COVID-19. O elevado número de pessoas que precisam de internação com o novo coronavírus em UTIs é um dos fatores cruciais que os governos levam em consideração quando há uma proposta de relaxamento do isolamento social. 
</h6>
<h3>Objetivo:</h3>
<h6>
Diante dessa perspectiva, nasceu a ideia de criar a Júlia. Essa assistente virtual tem como objetivo diminuir as superlotações das unidades de saúde do estado do Ceará, melhorando a distribuição de ocupação de hospitais do Ceará. O cidadão, muitas vezes, não sabe qual é o melhor hospital para se consultar, assim, pode piorar mais ainda a situação de um hospital ou, até mesmo, não ser atendido. O indivíduo poderá interagir com a Júlia por meio do aplicativo Telegram, inicialmente. O usuário informará seu endereço e a Júlia retornará os endereços das melhores unidades de saúde para aquele indivíduo, em um raio de 10 km. Destarte, nós conseguiremos diminuir a superlotação dos hospitais, melhorar a qualidade do atendimento e de vida dos cidadãos.  
</h6>
<h3>Metodologia:</h3>
<h6>
O Bot Júlia foi todo desenvolvido em linguagem Python, exceto a parte de WebCrawler, que foi desenvolvida em NodeJs. Usamos várias técnicas para conseguir desenvolver essa assistente virtual, como: WebCrawler, Geolocalização, Engenharia de Features etc. Primeiro, nós recebemos o endereço do usuário, para sabermos as coordenadas geográficas. Segundo, fazemos uma consulta de todas os hospitais e as informações listadas na plataforma do IntegraSus e guardamos elas. Assim, podemos pegar as coordenadas geográficas e os endereços de todos as unidades de saúde disponível. Por fim, retornaremos para os usuários os endereços das melhores unidades de sáude, mais perto e mais vagas.
</h6>
<h6>Palavras-chaves: Hospitais; Super-Lotação; COVID19; Python; Bot</h6>

In [19]:
#Bibliotecas que foram necessárias serem instaladas
!pip install js2py
!pip install Naked
!pip install -U googlemaps

Requirement already up-to-date: googlemaps in c:\programdata\miniconda3\lib\site-packages (4.4.2)


In [25]:
#importação das bibliotecas necessárias
import requests
import sys
from Naked.toolshed.shell import muterun_js
import json
from ast import literal_eval
import googlemaps
from datetime import datetime
from geopy import distance
import pandas as pd

In [26]:
'''
Essa função é responsável por retorna as coordenadas geográficas do usuário,
latitude e longitude, a partir do endereço informado.
'''
def local_user():
    '''
    Estou usando a API feita pela empresa Here Developer. Essa API serve para retornar informações geográficas, a partir
    de algum endereço informado. Essa API, de forma gratuita, pode fazer 250 mil requisições por mês.
    '''
    URL = "https://geocode.search.hereapi.com/v1/geocode"
    location = input("Informe seu endereço:\nEx: bairro, rua\n")
    api_key = ''
    PARAMS = {'apikey':api_key,'q':location} 
    r = requests.get(url = URL, params = PARAMS) 
    data = r.json()
    '''
    Eu vou querer só os resultados que apontam para o estado do Ceará, pois é de onde temos informações. Se vier uma 
    informação diferente, pediremos que o usuário informe de novo seu endereço.
    '''
    if data['items'] != []:
        if data['items'][0]['address']['state'] == "Ceará" and data['items'][0]['scoring']['queryScore'] >= 0.9:
            latitude = data['items'][0]['position']['lat']
            longitude = data['items'][0]['position']['lng']
            return (latitude, longitude)
        else:
            print('Tente novamente!')
            return 0
    else:
        print('Tente novamente!')
        return 0
    

In [56]:
'''
Essa função vai retornar as melhores Unidades de Saúde perto do usuário, em um raio de 10km. 
Vamos classificar as unidades em 3 níveis, vago, intermediário e crítico. 
Representações:
-Vago: Taxa de ocupação dos leitos da enfermaria e da uti <= 50%
-Intermediário: Taxa de ocupação dos leitos da enfermaria e da uti <= 70%
-Crítico: Taxa de ocupação dos leitos da enfermaria e da uti <= 85%
'''
def hospitais_user(coord_user):
    #
    latitude = coord_user[0]
    longitude = coord_user[1] 
    '''
Eu desenvolvi esse escript,que foi feito em nodejs, para fazer scraping no site do integrasus, na parte Histórico de 
Internações por COVID-19. Ele vai retornar os dados mais utuais das unidades de saúde que estão no site. Vai trazer a 
unidade, Leitos ativos UTI, Leitos ocupados UTI,Taxa ocupação UTI,Leitos ativos Enfermaria,Leitos ocupados Enfermaria,
Taxa ocupação Enfermaria.
    '''
    response = muterun_js('./teste.js')
    if response.exitcode == 0:
      testando = response.stdout
    else:
      sys.stderr.write(response.stderr)
    hospitais = testando.decode("utf-8")
    
    #Essa parte faz o pré-processamento dos dados que foram obtidos a partir do scraping.
    hospitais = hospitais.replace('unidade',"'unidade")
    hospitais = hospitais.replace('qntd',"'qntd")
    hospitais = hospitais.replace('taxa',"'taxa")
    hospitais = hospitais.replace('data',"'data")
    hospitais = hospitais.replace(":","':")
    hospitais = hospitais.replace("'",'"')
    hospitais = hospitais.replace("UNID ",'UNIDADE ')
    hospitais = hospitais.replace("HOSP ",'HOSPITAL ')
    d = json.loads(hospitais)
    elevations = json.dumps(d)
    dataframe = pd.read_json(elevations)
    dataframe['qntd_leitos_ativos'] = dataframe['qntd_leitos_ativos'].astype('float')
    dataframe['qntd_leitos_ocupados'] = dataframe['qntd_leitos_ocupados'].astype('float')
    dataframe['qntd_leitos_ativos_enfermaria'] = dataframe['qntd_leitos_ativos_enfermaria'].astype('float')
    dataframe['qntd_leitos_ocupados_enfermaria'] = dataframe['qntd_leitos_ocupados_enfermaria'].astype('float')
    dataframe['taxa_de_ocupacao'] = dataframe['taxa_de_ocupacao'].replace('%', ' ', regex=True).astype('float')
    dataframe['taxa_de_ocupacao_enfermaria'] = dataframe['taxa_de_ocupacao_enfermaria'].replace('%', ' ', regex=True).astype('float')
    
    '''
Nessa parte, iremos usar mais uma API de geolocalização, porém um pouco mais poderosa. API fornecida pela
empresa Google. Ele vai servir para retornar as coordenadas das unidades de saúde e o endereço. 
    '''
    lista = list(dataframe['unidade'])
    gmaps = googlemaps.Client(key='')
    lista_unidades = []
    lat_unidade = []
    lng_unidade = []
    address_uniadde = []
    for i in lista:
        address = "{}, Ceará".format(i)
        geocode_result = gmaps.geocode(address)
        if geocode_result != []:
            lista_unidades.append(i)
            lat_unidade.append(geocode_result[0]['geometry']['location']['lat'])
            lng_unidade.append(geocode_result[0]['geometry']['location']['lng'])
            address_uniadde.append(geocode_result[0]['formatted_address'])
#Adicionando os novos dados obtidos das unidades de saúde no nosso dataframe            
    dataframe['latitude'] = 'NaN'
    dataframe['longitude'] = 'NaN' 
    dataframe['endereco'] = 'NaN' 
    dataframe['distancia_user'] = 'NaN' 
    dataframe['status_unidade'] = 'NaN' 
    for i in range(len(lista_unidades)):
        dataframe.loc[dataframe.loc[(dataframe['unidade']) == lista_unidades[i]].index, 'latitude'] = lat_unidade[i]
        dataframe.loc[dataframe.loc[(dataframe['unidade']) == lista_unidades[i]].index, 'longitude'] = lng_unidade[i]
        dataframe.loc[dataframe.loc[(dataframe['unidade']) == lista_unidades[i]].index, 'endereco'] = address_uniadde[i]
        coords_1 = (latitude, longitude)
        coords_2 = (lat_unidade[i], lng_unidade[i])
        dataframe.loc[dataframe.loc[(dataframe['unidade']) == lista_unidades[i]].index, 'distancia_user'] = distance.distance(coords_1, coords_2).km
        
    dataframe['distancia_user'] = dataframe['distancia_user'].astype('float')
    df_teste = dataframe.sort_values(by='distancia_user')
    
    #Selecionando as unidades de saúde que estão no nível 1, Vago
    colunas = ['taxa_de_ocupacao', 'taxa_de_ocupacao_enfermaria', "distancia_user", 'qntd_leitos_ativos', 'qntd_leitos_ativos_enfermaria']
    select = "{} <= 50.0 & {} <= 50.0 & {} >= 0.0 & {} >= 0.0 & {} <= 10 & {} > 0.0 &  {} > 0.0".format(colunas[0], colunas[1], colunas[0], colunas[1], colunas[2], colunas[3], colunas[4])
    df50 = pd.DataFrame(df_teste.query(select))
    df50['status_unidade'] = 'Vago' 
    
    #Selecionando as unidades de saúde que estão no nível 2, Intermediário
    select2 = "{} <= 70.0 & {} <= 70.0 & {} > 50.0 & {} > 50.0 & {} <= 10 & {} > 0.0 &  {} > 0.0".format(colunas[0], colunas[1], colunas[0], colunas[1], colunas[2], colunas[3], colunas[4])
    df70 = pd.DataFrame(df_teste.query(select2))
    df70['status_unidade'] = 'Intermediario' 
    
    ##Selecionando as unidades de saúde que estão no nível 3, Crítico
    select3 = "{} <= 85.0 & {} <= 85.0 & {} > 70.0 & {} > 70.0 & {} <= 10 & {} > 0.0 &  {} > 0.0".format(colunas[0], colunas[1], colunas[0], colunas[1], colunas[2], colunas[3], colunas[4])
    df85 = pd.DataFrame(df_teste.query(select3))
    df85['status_unidade'] = 'Critico' 
    
    #Juntando os resultados obtidos dos 3 níveis.
    frames = [df50, df70, df85]
    result = pd.concat(frames)
    #Formantado a mensagem final para o usuário
    #Mensagem para o status 1 - VAGO
    uni1 = []
    end1 = []
    st1 = []
    dist1 = []
    mensagem = ""
    sel1 = result[result['status_unidade'] == "Vago"]
    for i in sel1['unidade']:
        uni1.append(i)
    for i in sel1['endereco']:
        end1.append(i)
    for i in sel1['status_unidade']:
        st1.append(i)
    for i in sel1['distancia_user']:
        dist1.append(i)
    for i in range(len(uni1)):
        mensagem += "Unidade:{}\nEndereço:{}({:0.2f} km de distância)\nStatus de Ocupação:{}\n".format(uni1[i], end1[i], dist1[i], st1[i])
    
    #Mensagem para o status 2 - Intermediario
    uni1 = []
    end1 = []
    st1 = []
    dist1 = []
    sel2 = result[result['status_unidade'] == "Intermediario"]
    for i in sel2['unidade']:
        uni1.append(i)
    for i in sel2['endereco']:
        end1.append(i)
    for i in sel2['status_unidade']:
        st1.append(i)
    for i in sel2['distancia_user']:
        dist1.append(i)
    for i in range(len(uni1)):
        mensagem += "Unidade:{}\nEndereço:{}({:0.2f} km de distância)\nStatus de Ocupação:{}\n".format(uni1[i], end1[i], dist1[i], st1[i])
    
    #Mensagem para o status 3 - Critico
    uni1 = []
    end1 = []
    st1 = []
    dist1 = []
    sel3 = result[result['status_unidade'] == "Critico"]
    for i in sel3['unidade']:
        uni1.append(i)
    for i in sel3['endereco']:
        end1.append(i)
    for i in sel3['status_unidade']:
        st1.append(i)
    for i in sel3['distancia_user']:
        dist1.append(i)
    for i in range(len(uni1)):
        mensagem += "Unidade:{}\nEndereço:{}({:0.2f} km de distância)\nStatus de Ocupação:{}\n".format(uni1[i], end1[i], dist1[i], st1[i])
    
    return mensagem

In [57]:
def main():
    location_user = local_user()
    analyze = hospitais_user(location_user)
    print(analyze)

<h1>Exemplo de como o bot vai responder</h1>

In [58]:
main()

Informe seu endereço:
Ex: bairro, rua
rua julio lima, cidade dos funcionários
Unidade: HOSPITAL DO CORACAO 
Endereço:Av. Frei Cirilo, 3480 - Messejana, Fortaleza - CE, 60846-190, Brazil(2.25 km de distância)
Status de Ocupação:Vago
Unidade: MATERNIDADE EUGENIA PINHEIRO 
Endereço:Av. Heráclito Graça, 500 - Centro, Fortaleza - CE, 60140-060, Brazil(7.06 km de distância)
Status de Ocupação:Vago
Unidade: HOSPITAL LUIZ FRANCA 
Endereço:Av. Heráclito Graça, 60 - Centro, Fortaleza - CE, 60140-060, Brazil(7.36 km de distância)
Status de Ocupação:Vago
Unidade: HOSPITAL OTOCLINICA 
Endereço:Av. Antônio Sales, 990 - Joaquim Távora (Fortaleza), Fortaleza - CE, 60135-100, Brazil(6.06 km de distância)
Status de Ocupação:Intermediario



<h1>Integração do bot</h1>

In [None]:
!pip install pyTelegramBotAPI
!pip install python-telegram-bot

In [None]:
from telegram.ext import CommandHandler, Filters, MessageHandler, Updater
token = ''
url_base = f'https://api.telegram.org/bot{token}/getUpdates'

In [None]:
import json
from telegram import Bot, Update
from telegram.ext import CommandHandler, Dispatcher, Filters, MessageHandler

def start(update, context):
    context.bot.send_message(
        chat_id = update.effective_chat.id, 
        text = "Oi, eu sou a Júlia. Tudo bem? Eu vou te mostrar as melhores unidades hospitalares mais próximas, onde não há superlotação, para você ir.\nMe informe seu endereço, bairro e rua, para eu achar as melhores unidades médicas para você.\nIsso pode levar alguns segundos"
    )

def unknown(update, context):
    context.bot.send_message(
        chat_id = update.effective_chat.id,
        text = "Não sei o que fazer com esse comando"
    )
def echo(update, context):
    location_user = local_user(update.message.text)
    if(location_user !=0):
        analyze = hospitais_user(location_user)
        if analyze != '':
            context.bot.send_message(
                chat_id = update.effective_chat.id,
                text = analyze
            )
        else:
            context.bot.send_message(
                chat_id = update.effective_chat.id,
                text = "Não consegui achar nenhum hospital vago perto de você :("
            )
    else:
        context.bot.send_message(
            chat_id = update.effective_chat.id,
            text = "Endereço invalido. Tente novamente!"
        )

updater = Updater(token=token)
dispatcher = updater.dispatcher
dispatcher.add_handler(CommandHandler("start", start))
dispatcher.add_handler(MessageHandler(Filters.text & (~Filters.command), echo))
dispatcher.add_handler(MessageHandler(Filters.command, unknown))
updater.start_polling()
updater.idle()


<h1>Análise Gráfica</h1>

In [41]:
!pip install folium

Collecting folium
  Downloading folium-0.11.0-py2.py3-none-any.whl (93 kB)
Collecting branca>=0.3.0
  Downloading branca-0.4.1-py3-none-any.whl (24 kB)
Installing collected packages: branca, folium
Successfully installed branca-0.4.1 folium-0.11.0


In [42]:
import folium

In [50]:
from folium import plugins

In [96]:
response = muterun_js('./teste.js')
if response.exitcode == 0:
    testando = response.stdout
else:
    sys.stderr.write(response.stderr)
hospitais = testando.decode("utf-8")    
#Essa parte faz o pré-processamento dos dados que foram obtidos a partir do scraping.
hospitais = hospitais.replace('unidade',"'unidade")
hospitais = hospitais.replace('qntd',"'qntd")
hospitais = hospitais.replace('taxa',"'taxa")
hospitais = hospitais.replace('data',"'data")
hospitais = hospitais.replace(":","':")
hospitais = hospitais.replace("'",'"')
hospitais = hospitais.replace("UNID ",'UNIDADE ')
hospitais = hospitais.replace("HOSP ",'HOSPITAL ')
d = json.loads(hospitais)
elevations = json.dumps(d)
dataframe = pd.read_json(elevations)
dataframe['qntd_leitos_ativos'] = dataframe['qntd_leitos_ativos'].astype('float')
dataframe['qntd_leitos_ocupados'] = dataframe['qntd_leitos_ocupados'].astype('float')
dataframe['qntd_leitos_ativos_enfermaria'] = dataframe['qntd_leitos_ativos_enfermaria'].astype('float')
dataframe['qntd_leitos_ocupados_enfermaria'] = dataframe['qntd_leitos_ocupados_enfermaria'].astype('float')
dataframe['taxa_de_ocupacao'] = dataframe['taxa_de_ocupacao'].replace('%', ' ', regex=True).astype('float')
dataframe['taxa_de_ocupacao_enfermaria'] = dataframe['taxa_de_ocupacao_enfermaria'].replace('%', ' ', regex=True).astype('float')    
lista = list(dataframe['unidade'])
gmaps = googlemaps.Client(key='AIzaSyAfsXnCHrGrlUgv0dZzuQGdk44J9Stiti8')
lista_unidades = []
lat_unidade = []
lng_unidade = []
address_uniadde = []
for i in lista:
    address = "{}, Ceará".format(i)
    geocode_result = gmaps.geocode(address)
    if geocode_result != []:
        lista_unidades.append(i)
        lat_unidade.append(geocode_result[0]['geometry']['location']['lat'])
        lng_unidade.append(geocode_result[0]['geometry']['location']['lng'])
        
dataframe['latitude'] = 'NaN'
dataframe['longitude'] = 'NaN' 

for i in range(len(lista_unidades)):
    dataframe.loc[dataframe.loc[(dataframe['unidade']) == lista_unidades[i]].index, 'latitude'] = lat_unidade[i]
    dataframe.loc[dataframe.loc[(dataframe['unidade']) == lista_unidades[i]].index, 'longitude'] = lng_unidade[i]

<h3>Mapa de Calor da Taxa de Ocupação UTI - 04/12</h3>

In [97]:
coordenadas=[]
aux = 0
for lat,lng in zip(dataframe.latitude.values,dataframe.longitude.values):
    val = int(dataframe.taxa_de_ocupacao[aux])
    for i in range(0,val+1):
        coordenadas.append([lat,lng])
    aux += 1
    #print(lat, lng)

In [98]:
mapa = folium.Map([-5.3171574,-41.5823248],zoom_start=6,tiles='Stamen Toner')

In [99]:
mapa.add_child(plugins.HeatMap(coordenadas))        
mapa

<h3>Mapa de Calor da Taxa de Ocupação Enfermaria - 04/12</h3>

In [100]:
coordenadas=[]
aux = 0
for lat,lng in zip(dataframe.latitude.values,dataframe.longitude.values):
    val = int(dataframe.taxa_de_ocupacao_enfermaria[aux])
    for i in range(0,val+1):
        coordenadas.append([lat,lng])
    aux += 1
    #print(lat, lng)

In [101]:
mapa = folium.Map([-5.3171574,-41.5823248],zoom_start=6,tiles='Stamen Toner')

In [102]:
mapa.add_child(plugins.HeatMap(coordenadas))        
mapa

<h3>Pela análise dos mapas de calor, vimos que há uma má distribuição na ocupação dos hospitiais. O objetivo da júlia é esse, melhorar a distribuição das pessoas na ocupação dos hospitais. Destarte, diminuir as superlotações e melhorar a qualidade de vida dos indivíduos</h3>