# Bem vindo ao teste para bolsista de iniciação científica em desenvolvimento de software do Laboratório Analítico de Competências Moleculares e Epidemiológicas (ACME Labs) da Fiocruz Ceará.

Para realizar este teste, será necessário você ler o problema e resolvê-lo através da criação de um simples e funcional algoritmo.

NOTA: Todos os dados usados neste teste são fictícios, portanto, está de acordo com a Lei Geral de Proteção de Dados.

## Problema

Após você conseguir ingressar em um laboratório de renome da Fiocruz, você agora participa de uma pesquisa que já estava em andamento.

Essa pesquisa possui um vasto banco de dados relacional desenvolvido em em PostgreSQL.

Além disso, a equipe de desenvolvimento criou uma API simples, com alguns endpoints, para que os desenvolvedores e analistas possam ter acesso aos dados, sem comprometer a segurança.

Essa pesquisa em questão, coletou alguns dados dos participantes, incluindo nome, email e telefone de contato. Além disso, a pesquisa possui um número de telefone para que os participantes possam enviar sms e, assim, entrar em contato.

Foi solicitado a sua pessoa que disponibilizasse uma LISTA com o email dos participantes que enviaram sms para a pesquisa a partir de 1 de novembro de 2022.


### Resumo do problema

* Desenvolver um algoritmo que retorne uma lista com os emails de contato dos participantes que enviaram sms a partir de 1 de novembro de 2022.

### Informações úteis

* Nem todas as pessoas que enviaram SMS para a pesquisa são participantes. É possível, inclusive, que nenhum participante tenha enviado SMS no período informado.

* Endpoint para resgatar as informações dos participantes da pesquisa: https://profound-yew-370516.ue.r.appspot.com/participantes (key = 'estoutentandosairdazonadeconforto')
   
* Endpoint para resgatar as informações dos participantes que enviaram SMS para a pesquisa: https://profound-yew-370516.ue.r.appspot.com/sms/recebidos (key = 'eunaotenhoideiadoquemeesperanafiocruz')

* As requisições às endpoints devem utilizar o método post e incluir o parametro key com a chave em questão.

* Os números de telefones dos participantes podem não estar formatados igualmente nos dois endpoints

* É possível utilizar a biblioteca pandas, do python, para ler os retornos das requisições e transformá-los em dataframes. Também é possível realizar JOINs entre dataframes no pandas.



#### Referências

* https://docs.python.org/3/tutorial/datastructures.html
* https://requests.readthedocs.io/en/latest/
* https://pandas.pydata.org/docs/reference/api/pandas.read_json.html
* https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.join.html
* https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.replace.html
* https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.removeprefix.html

In [2]:
import pandas as pd
import requests

# Início do código

In [3]:
from re import search
import json

req_participantes = requests.post('https://profound-yew-370516.ue.r.appspot.com/participantes?key=estoutentandosairdazonadeconforto')
req_sms = requests.post(' https://profound-yew-370516.ue.r.appspot.com/sms/recebidos?key=eunaotenhoideiadoquemeesperanafiocruz')
dfp = req_participantes.json()
dfs = req_sms.json()

dfp_json = json.dumps(dfp, indent = True)
dfs_json = json.dumps(dfs, indent = True)

#Criando arquivos e inserindo os dados das requisições
with open('participantes.json', 'w+') as file:
    file.write(dfp_json)

with open('participantes.json') as arquivo_json:
    objeto_json = json.load(arquivo_json)

with open('sms.json', 'w+') as f:
    f.write(dfs_json)

with open('sms.json') as arq_json:
    obj_json = json.load(arq_json)

parti_df = pd.json_normalize(objeto_json, record_path=['data'])
sms_df = pd.json_normalize(obj_json, record_path=['data'])

parti_df = parti_df.rename(columns={'participant_phone_number': 'phone_number'})

#concatenei as tabelas para vincular os números aos usuários correspondentes
parti_df = parti_df.merge(sms_df)

def get_lista_de_emails():
    #Procurando só por sms enviados a partir de novembro
    for ind in parti_df.index:
        if search('Nov', parti_df['message_date'][ind]):
            lista_datas_nov = (parti_df['participant_name'][ind], parti_df['participant_email'][ind], parti_df['phone_number'][ind], parti_df['message_date'][ind])
            lista_de_emails = list(lista_datas_nov)
            print(lista_de_emails)
    for ind in parti_df.index:
        if search('Dec', parti_df['message_date'][ind]):
            lista_datas_dec = (parti_df['participant_name'][ind], parti_df['participant_email'][ind], parti_df['phone_number'][ind], parti_df['message_date'][ind])
            lista_de_emails = list(lista_datas_dec)
            print(lista_de_emails)
    return lista_de_emails

# Resposta do Teste

In [4]:
print(type(get_lista_de_emails()) == list)
print(get_lista_de_emails())

['Athena', 'Athena@hotmail.com', '42996317597', 'Tue, 22 Nov 2022 00:52:59 GMT']
['JASMINE', 'JASMINE@gmail.com', '85995321512', 'Mon, 14 Nov 2022 08:25:14 GMT']
['Rebecca', 'Rebecca@hotmail.com', '33994554695', 'Thu, 03 Nov 2022 06:43:23 GMT']
['Emilia', 'Emilia@hotmail.com', '79993535576', 'Tue, 15 Nov 2022 14:25:11 GMT']
['KAILEY', 'KAILEY@ig.com.br', '34998032273', 'Wed, 16 Nov 2022 12:20:38 GMT']
['Caroline', 'Caroline@yahoo.com.br', '93990436998', 'Fri, 09 Dec 2022 12:01:56 GMT']
['Mya', 'Mya@hotmail.com', '98995633894', 'Thu, 01 Dec 2022 13:23:23 GMT']
True
['Athena', 'Athena@hotmail.com', '42996317597', 'Tue, 22 Nov 2022 00:52:59 GMT']
['JASMINE', 'JASMINE@gmail.com', '85995321512', 'Mon, 14 Nov 2022 08:25:14 GMT']
['Rebecca', 'Rebecca@hotmail.com', '33994554695', 'Thu, 03 Nov 2022 06:43:23 GMT']
['Emilia', 'Emilia@hotmail.com', '79993535576', 'Tue, 15 Nov 2022 14:25:11 GMT']
['KAILEY', 'KAILEY@ig.com.br', '34998032273', 'Wed, 16 Nov 2022 12:20:38 GMT']
['Caroline', 'Caroline@y