In [None]:
import pandas as pd
import numpy as np
import datetime
import matplotlib.pyplot as plt

# O código desse notebook esta no github: https://github.com/Russel-Servicos/automacao-mkt-chat

In [None]:
caminho_do_arquivo = "/content/Tabela_SalesIQ_07_10.csv"
data = "07/10/2024"

df = pd.read_csv(caminho_do_arquivo)

In [None]:
## Remove linhas com NaN ou vazia
df.dropna(how="all",inplace=True)

In [None]:
## Remove linhas duplicadas
df = df.drop_duplicates(subset = ["Name"])

## Remove colunas
df = df.drop(columns = ['Visitor ID', 'Initiated Time', 'IP', 'Mode'], axis = 1)

In [None]:
## Muda os tipos de dados das colunas
columns_to_type_conversions={
    'Page': 'str',
    'Question':'str',
    'Source': 'str',
    'Campaign Name': 'str',
  }
df = df.astype(columns_to_type_conversions)

clear_column_nan_value = lambda column_name: np.where(df[column_name] == 'nan', '', df[column_name])

df['Page'] = clear_column_nan_value('Page')
df['Question'] = clear_column_nan_value('Question')
df['Source'] = clear_column_nan_value('Source')
df['Campaign Name'] = clear_column_nan_value('Campaign Name')

In [None]:
## Filtra as linhas a coluna Page (Página de Aterrissagem)
query_is_russelvagas = "not (Page.str.contains('russelvagas.com'))"
df = df.query(query_is_russelvagas)

In [None]:
## Renomeia colunas
columns = {
    "Name": "ID do Visitante",
    "Page": "Página de Aterrissagem",
    "Campaign Medium": "Meio",
    "Campaign Name": "Campanha",
    "Campaign Source": "Origem",
    "State": "Estado",
    "Source": "Canal"
}
df = df.rename(columns=columns)

In [None]:
# Cria novas colunas
df['Data'] = data
df['Qualificação'] = ''
df['Contagem'] = ''
df['Taxa de Conversão'] = ''

In [None]:
## Reorganiza colunas
df = df.reindex(['Data','ID do Visitante','Canal','Página de Aterrissagem','Question','Origem','Meio','Campanha','Estado','Keyword','Qualificação','Contagem','Taxa de Conversão'], axis = 1)

In [None]:
## Atribui as linhas, o valor "Emprego"
query_is_emprego = "(Question.str.contains('Emprego', case=False))"
df_is_emprego = df.query(query_is_emprego)
df_is_emprego.loc[:, "Qualificação"] = "Emprego"

query_is_not_emprego = f"not {query_is_emprego}"
df_not_is_emprego = df.query(query_is_not_emprego)

df = pd.concat([df_is_emprego, df_not_is_emprego])

In [None]:
## Deletar linhas da coluna 'Página de Aterrissagem' que conter 'russelvagas'
df = df.drop(columns = ['Question'], axis = 1)

In [None]:
# Exportar como CSV
now = datetime.datetime.now()
now = now.strftime("%Y_%m_%d_%H_%M")
df.to_csv(f'./planilha_chat_estagio_1de2_{now}.csv', index=False)

In [None]:
#plt.bar()