#Projeto Lógica de programação II

## Monte o Google Drive caso esteja utilizando o Colab:

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


##Imports

In [None]:
import csv  # Leitura do arquivo
from textwrap import wrap # Manipulação das Strings
from datetime import datetime, date # Transformação do tipo da data, e do padrão utilizado (EN-PT)
import json # Conversão de dicinário para json

##Funções

In [None]:
def abre_arquivo_faz_listas(path):
    """
  Abre um arquivo csv e transforma os dados de cada coluna em uma lista

  Args:
    path::str  caminho do arquivo csv a ser convertido

  Returns:
    data:list
    tweet:list
    assunto:list
    usuario:list
      """
    link:list
    data = []
    tweet = []
    assunto = []
    usuario = []
    link = []
    with open(path , 'r', encoding='utf-8') as arquivo:
      leitor_csv = csv.reader(arquivo)
      for linha in leitor_csv:
        data.append(linha[0])
        link.append(linha[1])
        usuario.append(linha[2])
        tweet.append(linha[3])
        assunto.append(linha[4])
    arquivo.close()
    return data, tweet, assunto, usuario, link


def trata_dados(data, tweet, assunto, usuario, link):
  """
  Trata os dados das listas geradas pela função abre_arquivo_faz_listas(path):
    * Remove a label da coluna da lista através de string slicing.
    * Separa a data dos horários.
    * Converte as datas para o formato dd/mm/aaaa.
    * Converte as strings das listas tweets e assunto para lowercase.
    * Transforma os dados tratados em uma lista de dicionários

  args:
    data:list
    tweet:list
    assunto:list
    usuario:list
    link:list

  return:
    tabela_final:list
  """
  data = data[1:]
  link = link[1:]
  usuario = usuario[1:]
  tweet = tweet[1:]
  assunto = assunto[1:]
  so_data = []
  so_horarios = []
  for d in data:
    so_data.append(d[:10])
  for d in data:
    so_horarios.append(d[11:19])
  data_arrumada = []

  for data in so_data:
    date = datetime.strptime(data, '%Y-%m-%d').date()
    data_em_texto = "{}/{}/{}".format(date.day, date.month,
    date.year)
    data_arrumada.append(data_em_texto)
    tweet_lower = [twt.lower() for twt in tweet]
    assunto = [ast.lower() for ast in assunto]

  tabela_final = []
  dados = {
    "data": data_arrumada,
    "horario": so_horarios,
    "link": link,
    "usuario": usuario,
    "tweet_lower": tweet_lower,
    "tweet_original" : tweet,
    "assunto": assunto
}
  tabela_final.append(dados)
  return tabela_final

def titulo(mensagem, tam, espaco):
  """
  Printa uma mensagem entre duas linhas de '='

  args:
    mensagem:str mensagem do título
    espaco:int espaço entre os lados da mensagem
    tam:int tamanho da linha de '='
  """
  print("="*tam)
  print(f" "*espaco,mensagem," "*espaco)
  print("="*tam)


#printa o menu de opções
def gera_menu(lista, mensagem, tam, espaco, start_ind):

  """
  Printa o menu com as opções:

  args:
    lista:list lista com as opções do menu
    mensagem:str mensagem do título do menu
    tam:int tamanho da linha de '='
    espaco:int espaço entre os lados da mensagem
    start_ind:int index de inicio para as opções

  """

  titulo(mensagem, espaco, tam)
  i = start_ind
  for index, item in enumerate(lista):
    print(f"  {lista[index]:<50}{i:>7}")
    i += 1
  print("="*62)

def busca_data(busca, tabela_final):

  """
  Faz a busca na lista usando a data como filtro. Retorna os dicionarios cuja data aparece.

  args:
    busca: str data a ser buscada ( no formato dd/mm/aaaa)
    tabela_final:list lista de dicionarios com os dados tratados
  return:
    resultados_data:list lista com os dicionarios cuja data seja idêntica a busca.

  """

  busca = busca.lower()
  resultados_data = []

  for dados in tabela_final:
      for i, tweet in enumerate(dados["data"]):
          if busca in tweet:
              resultados_data.append({
                  "data": dados["data"][i],
                  "horario": dados["horario"][i],
                  "link": dados["link"][i],
                  "usuario": dados["usuario"][i],
                  "tweet_lower": tweet,
                  "tweet_original": dados["tweet_original"][i],
                  "assunto": dados["assunto"][i]
              })
  return resultados_data

def busca_assunto(busca, tabela_final):

  """
  Faz a busca na lista usando o assunto como filtro. Retorna os dicionarios cujo assunto aparece.

  args:
    busca: str assunto a ser buscado
    tabela_final:list lista de dicionarios com os dados tratados
  return:
    resultados_data:list lista com os dicionarios cujo assunto seja idêntico a busca.

  """

  busca = busca.lower()
  resultados_tweet = []

  for dados in tabela_final:
      for i, tweet in enumerate(dados["assunto"]):
          if busca in tweet:
              resultados_tweet.append({
                  "data": dados["data"][i],
                  "horario": dados["horario"][i],
                  "link": dados["link"][i],
                  "usuario": dados["usuario"][i],
                  "tweet_lower": tweet,
                  "tweet_original": dados["tweet_original"][i],
                  "assunto": dados["assunto"][i]
              })
  return resultados_tweet

def busca_termo(busca, tabela_final):
  """
  Faz a busca na lista usando um termo como filtro. Retorna os dicionarios cujo termo aparece entre as palavras dos tweets.

  args:
    busca: str termo a ser buscado
    tabela_final:list lista de dicionarios com os dados tratados
  return:
    resultados_data:list lista com os dicionarios cuja busca esteja exista no texto tweets

  """
  busca = busca.lower()
  resultados_termo = []

  for dados in tabela_final:
      for i, tweet in enumerate(dados["tweet_lower"]):
          if busca in tweet:
              resultados_termo.append({
                  "data": dados["data"][i],
                  "horario": dados["horario"][i],
                  "link": dados["link"][i],
                  "usuario": dados["usuario"][i],
                  "tweet_lower": tweet,
                  "tweet_original": dados["tweet_original"][i],
                  "assunto": dados["assunto"][i]
              })
  return resultados_termo

def exibe_tweet(lista):
    """
  Printa na tela o resultado das buscas
  args:
    lista:list lista com os resultados

    """


    esp = " "
    print("-"*135)
    print(f"  Data: {lista['data']}{esp:<95} Horário: {lista['horario']}")
    print(f"  Usuário: @{lista['usuario']}")
    print(f"  Assunto: {lista['assunto']}")

    print(" ")
    print(f"  Tweet: {lista['link']}")
    for line in wrap("".join(lista['tweet_original']), width=130):
      print(f"  {line}")
    print("-"*135)
    print("\n")

def importa_json(dados, caminho):
  """
  Importa os resultados das buscas para o formato json

  args:
    dados:list lista com os resultados das pesquisas
    caminho:str caminho à ser salvo o json
  """
  with open(caminho, 'w', encoding='utf-8') as arquivo_json:
    json.dump(dados, arquivo_json, ensure_ascii=False, indent=4)

##Main

<p>OBS: Não esqueça de trocar o path dos dados</p>

In [None]:
path =  #Aqui vai o caminho do arquivo csv
data, tweet, assunto, usuario, link = abre_arquivo_faz_listas(path)
tabela_final = trata_dados(data, tweet, assunto, usuario, link)

In [None]:
# Os labels abaixo são para os dois menu's utilizados o primeiro "labels" é para o menu principal, e o "labels_assunto" é para o case 3, onde facilitamos o acesso aos assuntos abordados.
labels = ["Buscar tweets por data", "Buscar tweets por termo", "Buscar tweets por assunto", "Salvar resultado da busca", "Sair" ]
labels_assunto = ["covid-19","ciência de dados", "copa do mundo", "eleições"]
labels_json = ["Salvar pesquisa por data", "Salvar pesquisa por termo", "Salvar pesquisa por assunto", "Salvar todas as pesquisas"]

# Aqui é definido a busca (todos os inputs feitos pelo usuario fora do menu principal é salva na variável busca).
# Iniciamos a variável como falsa para evitar que o usuario tente salvar no formato json um arquivo vazio.
busca = False
# A variável abaixo é onde é salva todas as pesquisas feitas pelo usuário.
json_total = []

# Inicio do loop do programa
while True:
  # Menu principal, toda vez que uma ação for encerrada ele irá aparecer novamente
  gera_menu(labels, "Boas vindas ao nosso sistema", 15, 62,  1)
  while True:
    # Uso do try except para fazer com que o usuário digite um número inteiro.
    try:
      opcao = int(input("  Digite a opção:"))
      break

    except ValueError:
      print("  Opção inválida, você deve digitar um número inteiro.")
  # Funções exercidas a partir do menu.
  match opcao:
    # Busca dos tweets a partir de uma data expecifica.
    case 1:
      busca = input("  Digite uma data (dd/mm/aaaa) para encontrar os tweets: ")
      try:
        # Verificação da data, caso ela não seja digitada no formato correto será pedido ao usuário para digitar novamente.
        data_formatada = datetime.strptime(busca, "%d/%m/%Y")
        # Caso a data seja fornecida corretamente porém fora do escopo da tabela será pedido novamente uma data.
        if datetime(2018, 2, 2) <= data_formatada >= datetime(2022, 12, 10):
          print(datetime)
          titulo(mensagem="A data desejada está fora do escopo.", tam=62, espaco=15)
        # Se a data for digitada corretamente e dentro do escopo então será printada na tela do usuário
        # O print é feito pela função exibe_tweet. A função foi criada para uma melhor vizualização.
        else:
            resultado_data = busca_data(busca, tabela_final)
            titulo("RESULTADOS DA BUSCA", 125, 54)
            # Para salvar em json quando entra nesse case já é salva uma variavel para o uso.
            # Os outros dois case seguem a mesma linha.
            data_json = 'resultados_data.json'
            for resultado in resultado_data:
                exibe_tweet(resultado)
                json_total.append(resultado)
      except ValueError:
        titulo(mensagem="Por favor digite a data no padrão 'dia/mês/ano ", tam=62, espaco=8)
    case 2:
      # Busca dos tweets a partir de um termo presente em qualquer tweet.
      busca = input("  Digite um termo para encontrar os tweets: ")
      resultado_termo = busca_termo(busca, tabela_final)
      termo_json = 'resultados_termo.json'
      titulo("RESULTADOS DA BUSCA", 125, 54)
      for resultado in resultado_termo:
        exibe_tweet(resultado)
        json_total.append(resultado)
        continue
    case 3:
      # Busca dos tweets a partir de um assunto expecífico.
      assunto_json = 'resultados_assunto.json'
      # Na linha a seguir é feito um novo menu interativo com o usuário.
      gera_menu(labels_assunto, "Digite o assunto escolhido ou o numero correspondente", 5, 62,  1)
      busca = input("  Digite um assunto para encontrar os tweets: ")
      # Dentro desse if else daremos a opção para o usuário digitar tanto de forma extensa o assunto desejado quanto a partir da sua numeração no menu.
      if busca == "1" or busca == "covid-19":
        busca = "covid-19"
        resultado_assunto = busca_assunto(busca, tabela_final)
        titulo("RESULTADOS DA BUSCA", 125, 54)
        for resultado in resultado_assunto:
          exibe_tweet(resultado)
          json_total.append(resultado)
      elif busca == "2" or busca == "ciência de dados":
        busca = "ciência de dados"
        resultado_assunto = busca_assunto(busca, tabela_final)
        titulo("RESULTADOS DA BUSCA", 125, 54)
        for resultado in resultado_assunto:
          exibe_tweet(resultado)
          json_total.append(resultado)
      elif busca == "3" or busca == "copa do mundo":
        busca = "copa do mundo"
        resultado_assunto = busca_assunto(busca, tabela_final)
        titulo("RESULTADOS DA BUSCA", 125, 54)
        for resultado in resultado_assunto:
          exibe_tweet(resultado)
          json_total.append(resultado)
      elif busca == "4" or busca == "eleições":
        busca = "eleições"
        resultado_assunto = busca_assunto(busca, tabela_final)
        titulo("RESULTADOS DA BUSCA", 125, 54)
        for resultado in resultado_assunto:
          exibe_tweet(resultado)
          json_total.append(resultado)
      else:
        print("  Não foi encontrado dentro da tabela o assunto desejado")
      continue
    case 4:
      total_json = 'total_json.json'
      # Aqui é feita uma verificação se já foi realizada alguma busca pelo usuário, caso não, não será feito o salvamento em json
      if busca == False:
        print("  Para salvar a busca você deve primeiro realiza-la")
      # Abaixo será feito o salvamento das buscas realizadas pelo usuário.
      else:
        gera_menu(labels_json, "Qual pesquisa você deseja salvar?", 15, 62,  1)
        try:
          input_json = int(input("Digite a sua opção: "))
        except:
          print("  Aceitamos apenas valores inteiros no menu. Tente novamente,")
          continue
        if input_json == 1:
          try:
            importa_json(resultado_data, data_json)
            print("  Seu arquivo Json referente a data foi baixado!")
          except:
            print("  Você não fez buscas para essa opção, sua busca não foi salva.")
        elif input_json ==2:
          try:
            importa_json(resultado_termo, termo_json)
            print("  Seu arquivo Json referente ao termo foi baixado!")
          except:
            print("  Você não fez buscas para essa opção, sua busca não foi salva.")
        elif input_json ==3:
          try:
            importa_json(resultado_assunto, assunto_json)
            print("  Seu arquivo Json referente ao termo foi baixado!")
          except:
            print("  Você não fez buscas para essa opção, sua busca não foi salva.")
        elif input_json == 4:
          importa_json(json_total, total_json)
          print("  Todos suas pesquisas foram baixadas!")
        else:
          print("  Não foi possível entender seu comando.")
          continue
        continue
    case 5:
      break
    case _:
      print("  Opção inválida, tente novamente")
      continue