# ETL dos dados dos tickets da Vammo 

### **Extraindo os dados**

In [1]:
import pandas as pd
import json
import os

### Criando um Excel sheet from a JSON file

In [14]:
# Caminho para os arquivos do projeto

# Obtém o diretório atual
output_path = os.getcwd()

# Dirertorio de tabelas auxiliares
aux_file_path = os.path.join(output_path, 'tabelas_auxiliares') 

# Obtém o diretório atual
root_path = os.path.dirname(os.getcwd())

# Volta uma pasta no diretório atual
input_path = os.path.join(root_path, 'Dados') 

# Concatena o diretório com o arquivo de input
input_file_path = os.path.join(input_path, 'atendimento_last2m.json') 


print("Caminho completo do arquivo de entrada:", input_file_path )

Caminho completo do arquivo de entrada: c:\Users\User\Documents\GitHub\vammo\Dados\atendimento_last2m.json


In [13]:
# Ler o arquivo JSON
with open(input_file_path, 'r', encoding='utf-8') as file:
    data = json.load(file)

# Normalizar os dados aninhados
df_original = pd.json_normalize(data)

# Concatena o diretório com o arquivo de output
output_file_path = os.path.join(aux_file_path, 'atendimento_last2m_orig.xlsx')

# Salvar o DataFrame em um arquivo Excel
df_original.to_excel(output_file_path, index=False)

print(f'Dados convertidos e salvos em {output_file_path}')

Dados convertidos e salvos em c:\Users\User\Documents\GitHub\vammo\Projeto\tabelas_auxiliares\atendimento_last2m_orig.xlsx


In [15]:
df = pd.DataFrame(df_original)
print(f'O DataFrame dos atendimentos possui {df.shape[0]} linhas e {df.shape[1]} colunas')
df

O DataFrame dos atendimentos possui 4119 linhas e 251 colunas


Unnamed: 0,type,id,attributes.name,attributes.preview,attributes.channels,attributes.status,attributes.snooze.status,attributes.snooze.statusAt,attributes.snooze.time,attributes.open.statusAt,...,attributes.lastMessageIn.meta.cc,attributes.lastMessageIn.meta.recipient.email,attributes.firstDone.messageCountByChannel.email,attributes.lastDone.messageCountByChannel.email,attributes.firstMessageIn.meta.recipient.mailboxHash,attributes.lastMessageIn.meta.recipient.mailboxHash,attributes.lastMessageIn.meta.inReplyTo,attributes.firstDone.outboundMessageCountByChannel.email,attributes.lastDone.outboundMessageCountByChannel.email,attributes.firstDone.messageCountByChannel
0,conversation,66e3d869357feab8bd8ebd7e,💲Pagamentos,Paulo fico feliz que deu tudo certo. Estou enc...,[whatsapp],done,canceled,2024-09-13T11:27:35.393Z,2024-09-13T12:27:22.227Z,2024-09-13T11:27:35.393Z,...,,,,,,,,,,
1,conversation,66e3b1777a97f33644bf5c11,⏳ Prorrogar data de vencimento,Marcos fico feliz que deu tudo certo. Estou en...,[whatsapp],done,canceled,2024-09-13T11:23:15.025Z,2024-09-13T12:22:39.843Z,2024-09-13T11:23:15.025Z,...,,,,,,,,,,
2,conversation,66e39d67357feab8bd8e6413,🔋Suporte - Estações de bateria,Muito obrigado pelo seu contato.\n\nUma ótima ...,[whatsapp],done,canceled,2024-09-13T02:22:47.941Z,2024-09-13T05:18:16.727Z,2024-09-13T02:15:23.104Z,...,,,,,,,,,,
3,conversation,66e398be58dc05c1831e6260,🏍️Suporte - Moto,Ainda bem que deu tudo certo então.\n\nRoniele...,[whatsapp],done,canceled,2024-09-13T01:56:03.395Z,2024-09-13T02:47:58.116Z,2024-09-13T01:43:27.174Z,...,,,,,,,,,,
4,conversation,66e39589357feab8bd8e49ae,📉 Renegociação,Muito obrigado!\n\nUma ótima noite para ti tbm...,[whatsapp],done,canceled,2024-09-13T01:49:59.099Z,2024-09-13T04:45:19.886Z,2024-09-13T01:49:59.099Z,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
4114,conversation,668e89928d41f3a604a716d6,🚦Multas,"Luís estou encerrando seu atendimento, mas não...",[whatsapp],done,canceled,2024-07-10T20:19:13.822Z,2024-07-10T21:14:08.881Z,2024-07-10T20:09:54.977Z,...,,,,,,,,,,
4115,conversation,668e898fa31a0e61a1d304dc,🚦Multas,"Salve, Ryan\n\nComo não tivemos retorno sobre ...",[whatsapp],done,canceled,2024-07-16T21:12:12.845Z,3023-07-16T16:08:54.976Z,2024-07-16T16:08:51.058Z,...,,,,,,,,,,
4116,conversation,668e898d9276cb40044acb63,📆Agendamentos,"Saulo, por falta de retorno este chamado será ...",[whatsapp],done,canceled,2024-07-10T18:19:39.399Z,2024-07-10T18:20:36.614Z,2024-07-10T15:18:17.553Z,...,,,,,,,,,,
4117,conversation,668d2551cdf8a99fdd9fce1d,❓Dúvidas |,Fernando fico feliz que deu tudo certo. Estou ...,[whatsapp],done,canceled,2024-07-09T12:12:27.168Z,2024-07-09T13:11:23.901Z,2024-07-09T12:12:27.168Z,...,,,,,,,,,,


### **Preparando os dados**

Identificar as colunas que serão relevantes para a análise

**Remover colunas vazias**

In [16]:
# Contar colunas completamente vazias
num_empty_columns = df.isna().all().sum()

print(f"Número de colunas vazias: {num_empty_columns}")
df.dropna(axis=1, how='all', inplace=True)

print(f"Número de colunas total: {df.shape[1]}")

Número de colunas vazias: 7
Número de colunas total: 244


**Analisando a cronologia das colunas de timestamp**

O objetivo é criar um funil de atendimento para medir performance no atendimento

In [17]:
# Função para processar uma linha específica e criar um novo DataFrame
def process_row_to_df(row):
    # Filtrar colunas que terminam com "At" ou contêm "time"
    time_columns = [col for col in df.columns if col.endswith('At') or 'time' in col]
    
    # Verificar se as colunas de tempo foram encontradas
    if not time_columns:
        raise ValueError("Nenhuma coluna de tempo encontrada.")
    
    # Extrair os valores das colunas de tempo
    time_values = row[time_columns].dropna()
    
    # Verificar se há valores de tempo na linha
    if time_values.empty:
        raise ValueError("Nenhum valor de tempo encontrado na linha especificada.")
    
    # Converter os valores para datetime
    time_values = pd.to_datetime(time_values, errors='coerce').dropna()
    
    # Verificar se a conversão para datetime foi bem-sucedida
    if time_values.empty:
        raise ValueError("Falha ao converter valores de tempo para datetime.")
    
    # Ordenar os valores cronologicamente
    time_values = time_values.sort_values()
    
    # Calcular a diferença de tempo entre os valores
    time_diffs = time_values.diff()
    
    # Criar um novo DataFrame com as colunas desejadas
    result_df = pd.DataFrame({
        'time_columns': time_values.index,
        'time_values': time_values.values,
        'time_diffs': time_diffs.values
    })
    
    return result_df

In [18]:
# Selecionar uma linha específica (por exemplo, a primeira linha)
row = df.iloc[500]

# Processar a linha e obter o novo DataFrame
result_df = process_row_to_df(row)

# Exportar o DataFrame para um arquivo CSV
result_df.to_csv('time_data.csv', index=False)

# Exportar o DataFrame para um arquivo Excel
output_file_path = os.path.join(aux_file_path, 'analysis_time_stamp.xlsx')
result_df.to_excel(output_file_path, index=False)

# Exibir o DataFrame resultante
result_df

Unnamed: 0,time_columns,time_values,time_diffs
0,attributes.createdAt,2024-09-07 18:31:26.241,NaT
1,attributes.modificationHistory.channelAt,2024-09-07 18:31:26.241,0 days 00:00:00
2,attributes.modificationHistory.priorityAt,2024-09-07 18:31:26.241,0 days 00:00:00
3,attributes.firstMessageIn.sentAt,2024-09-07 18:31:26.307,0 days 00:00:00.066000
4,attributes.firstMessageIn.createdAt,2024-09-07 18:31:26.943,0 days 00:00:00.636000
5,attributes.modificationHistory.assignedUsersAt,2024-09-07 18:31:31.527,0 days 00:00:04.584000
6,attributes.modificationHistory.assignedTeamsAt,2024-09-07 18:31:31.972,0 days 00:00:00.445000
7,attributes.assistant.transferredAt,2024-09-07 18:31:46.351,0 days 00:00:14.379000
8,attributes.firstResponseSinceLastDone.sentAt,2024-09-07 18:31:54.568,0 days 00:00:08.217000
9,attributes.firstResponse.sentAt,2024-09-07 18:31:54.568,0 days 00:00:00


**Removendo colunas de timestamp que não são relevantes**

Ao observar os dados, notamos que vários timestamps estão redundantes, o que sugere que o software de atendimento pode não estar sendo utilizado em sua totalidade. Precisamos identificar os principais timestamps para rastrear o funil de atendimento.



In [19]:
# Lista de colunas que devem ser mantidas
keep_columns = [
    'attributes.createdAt',
    'attributes.modificationHistory.assignedUsersAt',
    'attributes.endedAt'
]

# Filtrar colunas que terminam com "At" ou contêm "time", exceto as colunas a serem mantidas
columns_to_drop = [
    col for col in df.columns 
    if (col.endswith('At') or 'time' in col) and col not in keep_columns
]

# Remover as colunas do DataFrame
df = df.drop(columns=columns_to_drop)

# Dicionário de renomeação
rename_dict = {
    'attributes.createdAt': 'createdAt',
    'attributes.modificationHistory.assignedUsersAt': 'assignedUsersAt',
    'attributes.endedAt': 'endedAt'
}

# Renomear as colunas
df = df.rename(columns=rename_dict)

print(f"Número de colunas removidas: {len(columns_to_drop)}")
print(f"Número de colunas total: {df.shape[1]}")

Número de colunas removidas: 49
Número de colunas total: 195


**Verificando colunas messageCount**

Essas colunas podem trazer insights sobre a complexidade do ticket. Precisamos entender qual coluna devemos considerar como a fonte da verdade

In [22]:
# Filtrar colunas que contêm "MessageCount" ou "messageCount" no título
message_count_columns = [col for col in df.columns if 'MessageCount' in col or 'messageCount' in col]

# Criar um novo DataFrame com essas colunas
message_count_df = df[message_count_columns]

# Exportar o novo DataFrame para um arquivo Excel
output_file_path = os.path.join(aux_file_path, 'analysis_message_count.xlsx')
message_count_df.to_excel(output_file_path, index=False)

No arquivo gerado verificamos que a coluna attributes.messageCount trás o total de mensagem trocadas com o cliente e não fica claro como aprofundar a direção dessas mensagens.


In [23]:
# Lista de colunas a serem removidas
columns_to_remove = [
    'attributes.firstDone.messageCount',
    'attributes.firstDone.messageCountByChannel.whatsapp',
    'attributes.firstDone.outboundMessageCount',
    'attributes.firstDone.outboundMessageCountByChannel.whatsapp',
    'attributes.lastDone.messageCount',
    'attributes.lastDone.messageCountByChannel.whatsapp',
    'attributes.lastDone.outboundMessageCount',
    'attributes.lastDone.outboundMessageCountByChannel.whatsapp',
    'attributes.outboundMessageCount',
    'attributes.inboundMessageCount',
    'attributes.firstDone.messageCountByChannel.email',
    'attributes.lastDone.messageCountByChannel.email',
    'attributes.firstDone.outboundMessageCountByChannel.email',
    'attributes.lastDone.outboundMessageCountByChannel.email'
]

# Remover as colunas do DataFrame
df.drop(columns=columns_to_remove, inplace=True)

print(f"Quantidade de colunas removidas: {len(columns_to_remove)}")
print(f"Número de colunas total: {df.shape[1]}")

Quantidade de colunas removidas: 14
Número de colunas total: 181


**Verificando colunas channel**

Essas colunas podem trazer insights sobre qual plataforma foi utilizada no atendiamento

In [24]:
# Filtrar as colunas que contêm a palavra "channel" no nome
channel_columns = df.filter(like='channel')

# Exportar o DataFrame resultante para um arquivo Excel
output_file_path = os.path.join(aux_file_path, 'analysis_channel.xlsx')
channel_columns.to_excel(output_file_path, index=False)

# Lista de colunas a serem removidas
columns_to_remove = [
    'attributes.firstMessageOut.channel',
    'attributes.lastMessageIn.channel',
    'attributes.assistant.channel',
    'attributes.replyChannel'
]

# Remover as colunas do DataFrame
df.drop(columns=columns_to_remove, inplace=True)

print(f"Quantidade de colunas removidas: {len(columns_to_remove)}")
print(f"Número de colunas total: {df.shape[1]}")

Quantidade de colunas removidas: 4
Número de colunas total: 177


**Verificando colunas responseTime**

Essas colunas podem trazer insights sobre tempo de atendimento

In [25]:
# Filtrar as colunas que contêm a palavra "responseTime" no nome
response_time_columns = df.filter(like='responseTime')

# Exportar o DataFrame resultante para um arquivo Excel
output_file_path = os.path.join(aux_file_path, 'analysis_response_time.xlsx')
response_time_columns.to_excel(output_file_path, index=False)

# Lista de colunas a serem removidas
columns_to_remove = [
    'attributes.firstResponseSinceLastDone.responseTime'
]

# Remover as colunas do DataFrame
df.drop(columns=columns_to_remove, inplace=True)

print(f"Quantidade de colunas removidas: {len(columns_to_remove)}")
print(f"Número de colunas total: {df.shape[1]}")

Quantidade de colunas removidas: 1
Número de colunas total: 176


In [26]:
# Reorganizar as colunas colocando 'createdAt', 'assignedUsersAt' e 'endedAt' lado a lado
colunas = list(df.columns)
colunas_reordenadas = ['createdAt', 'assignedUsersAt', 'endedAt'] + [col for col in colunas if col not in ['createdAt', 'assignedUsersAt', 'endedAt']]
df = df[colunas_reordenadas]

**Verificando colunas attributes.custom**

Essa coluna pode trazer insights sobre o assunto do atendimento

In [27]:
# Filtrar as colunas que contêm a palavra "attributes.custom." no nome
custom_attributes_columns = df.filter(like='attributes.custom.')

# Renomear as colunas removendo "attributes.custom."
custom_attributes_columns = custom_attributes_columns.rename(columns=lambda x: x.replace('attributes.custom.', ''))

# Exportar o DataFrame resultante para um arquivo Excel
output_file_path = os.path.join(aux_file_path, 'analysis_custom_attributes.xlsx')
custom_attributes_columns.to_excel(output_file_path, index=False)

In [28]:
# Renomear a coluna 'attributes.custom.motivoDoContatoStr' para 'motivo_contato_pri'
df = df.rename(columns={'attributes.custom.motivoDoContatoStr': 'motivo_contato_pri'})

# Definir as colunas para unificação
sec_columns = [
    'attributes.custom.qualAssuntoSobrePagamentosStr', 
    'attributes.custom.qualTipoDeSuporteStr', 
    'attributes.custom.qualTipoDeAgendamentoStr', 
    'attributes.custom.qualTipoDeComunicadoStr', 
    'attributes.custom.qualTipoDeAcidenteStr', 
    'attributes.custom.qualAssuntoSobreOPlanoStr', 
    'attributes.custom.categoriaStr'
]

terc_columns = [
    'attributes.custom.qualTipoDeRenegociacaoStr',
    'attributes.custom.qualProblemaComAEstacaoStr',
    'attributes.custom.qualProblemaComAMotoStr',
    'attributes.custom.qualProblemaComOAppStr',
    'attributes.custom.qualAlteracaoDePlanoStr'
]

# Unificar as colunas em 'motivo_contato_sec' e 'motivo_contato_terc' utilizando o conceito de coalesce
df['motivo_contato_sec'] = df[sec_columns].bfill(axis=1).iloc[:, 0]
df['motivo_contato_terc'] = df[terc_columns].bfill(axis=1).iloc[:, 0]

# Remover as colunas que foram unificadas
df.drop(columns=sec_columns + terc_columns, inplace=True)

print(f"Quantidade de colunas removidas: {len(sec_columns + terc_columns)}")
print(f"Número de colunas total: {df.shape[1]}")

Quantidade de colunas removidas: 12
Número de colunas total: 166


**Analisando demais colunas**

as tabelas também conseguimos elimando alguns tipos de colunas que não apresentaram valores interpretáveis ou relevantes

In [29]:
# Remover colunas que contêm as palavras "Teams", "businessTime" e "snooze"
initial_columns = df.columns.tolist() 
df = df.loc[:, ~df.columns.str.contains('Teams|businessTime|snooze|meta')]

# Armazenar as colunas após a remoção
final_columns = df.columns.tolist()

# Calcular as colunas removidas
removed_columns = list(set(initial_columns) - set(final_columns))

# Exibir as colunas removidas e a quantidade
print(f"Quantidade de colunas removidas: {len(removed_columns)}")
print(f"Número de colunas total: {df.shape[1]}")

Quantidade de colunas removidas: 41
Número de colunas total: 125


In [30]:
# Lista de colunas específicas a serem removidas
removed_columns = [
    'type', 'attributes.name', 'attributes.preview', 'attributes.channels', 'attributes.noteCount',
    'attributes.satisfaction', 'attributes.satisfactionLevel.formResponse', 'attributes.satisfactionLevel.form',
    'attributes.satisfactionLevel.channel', 'attributes.satisfactionLevel.scheduledFor', 'attributes.satisfactionLevel.answers',
    'attributes.satisfactionLevel.sentByTeams', 'attributes.spam', 'attributes.endedReason', 'attributes.endedByType',
    'attributes.tags', 'attributes.suggestedTags', 'attributes.predictions', 'attributes.suggestedShortcuts',
    'attributes.firstMessageIn.id', 'attributes.firstMessageIn.directionType', 'attributes.firstMessageIn.meta.payload',
    'attributes.firstMessageOut.id', 'attributes.firstMessageOut.directionType', 'attributes.firstMessageOut.createdBy',
    'attributes.firstMessageOut.createdByTeams', 'attributes.lastMessageIn.id', 'attributes.lastMessageIn.meta.to',
    'attributes.lastMessageIn.meta.payload', 'attributes.lastMessageOut.id', 'attributes.assignedTeams', 'attributes.firstResponse.id',
    'attributes.firstResponse.createdBy', 'attributes.firstResponse.createdByTeams', 'attributes.firstResponse.assignedTeams',
    'attributes.firstResponse.assignedUsers', 'attributes.firstResponseSinceLastDone.id', 'attributes.firstResponseSinceLastDone.createdByTeams',
    'attributes.firstResponseSinceLastDone.assignedTeams', 'attributes.lastResponse.createdByTeams', 'attributes.lastResponse.assignedTeams',
    'attributes.firstDone.noteCount', 'relationships.messages.links.self', 'relationships.modifiedBy.links.self',
    'relationships.modifiedBy.data.id', 'relationships.customer.data.id', 'relationships.customer.links.self',
    'relationships.endedBy.data.id', 'relationships.endedBy.links.self', 'relationships.queue.data.id', 'relationships.queue.links.self',
    'links.self', 'attributes.snooze.status', 'attributes.firstMessageIn.meta.to', 'attributes.lastDone.messageCountByChannel.whatsapp',
    'attributes.lastDone.outboundMessageCountByChannel.whatsapp', 'attributes.lastDone.lastMessageDirection','attributes.roleGroupVersions', 'attributes.accessOverride', 'attributes.assistant.fac.reasons',
    'attributes.assistant.fac.exclusions', 'attributes.assistant.assistantId', 'attributes.assistant.status',
    'attributes.assistant.type', 'attributes.assistant.app', 'attributes.phase', 'attributes.matchedTimeBasedRules',
    'relationships.modifiedBy.data.type', 'relationships.org.links.self', 'relationships.org.data.type',
    'relationships.org.data.id', 'relationships.customer.data.type', 'relationships.endedBy.data.type',
    'relationships.queue.data.type', 'relationships.brand.data.type', 'relationships.brand.data.id',
    'relationships.brand.links.self','attributes.ended', 'attributes.lastMessageOut.createdBy', 'attributes.firstResponseSinceLastDone.createdBy',
    'attributes.firstResponseSinceLastDone.assignedUsers','attributes.locale','attributes.defaultLang',
    'relationships.createdBy.data.type','relationships.createdBy.data.id','attributes.lastMessageUnrespondedTo.id',
    'attributes.lastMessageUnrespondedToSinceLastDone.id','attributes.lastResponse.createdBy',
    'attributes.firstDone.createdBy','attributes.firstDone.assignedUsers',
    'attributes.lastDone.createdBy','attributes.lastDone.assignedUsers','attributes.lastDone.noteCount',
    'attributes.direction','attributes.firstDone.source','attributes.lastDone.source','attributes.custom.qualSeuEmailStr',
    'attributes.custom.temTerceiroEnvolvidoBool','attributes.custom.chatbotAssociadoStr', 
    'attributes.custom.novoDiaDeVencimentoTree','attributes.custom.qualAPlacaDoTerceiroStr',
    'attributes.custom.localDoIncidenteStr','status','attributes.rev','attributes.reopenCount',
    'attributes.custom.motivoDoContatoTree','attributes.mergedTarget','attributes.linkedConversations',
    'attributes.reopenFromDoneCount','relationships.createdBy.links.self','attributes.satisfactionLevel.score',
    'attributes.lastDone.lastMessageDirectionType','attributes.lastMessageDirection','attributes.firstDone.lastMessageDirectionType',
    'attributes.firstDone.lastMessageDirection','attributes.lastResponse.id','attributes.satisfactionLevel.sentBy',
    'attributes.lastResponse.assignedUsers'
]

# Dicionário de mapeamento para renomear as colunas
colunas_a_renomear = {
    'attributes.status': 'status',
    'attributes.messageCount': 'messageCount',
    'attributes.firstMessageIn.channel': 'channel',
    'attributes.satisfactionLevel.status': 'satisfaction_status',
    'attributes.priority': 'priority',
    'attributes.assignedUsers': 'atendente',
    'attributes.firstResponse.responseTime': 'responseTime',
    'attributes.custom.churnRetidoBool': 'churnRetidoBool',
    'attributes.satisfactionLevel.rating': 'satisfaction_rating',
    'attributes.satisfactionLevel.firstAnswer': 'satisfaction_Answer',
    'attributes.custom.descrevaOProblemaTxt': 'descrevaOProblemaTxt',
    'attributes.custom.sugestaoTxt': 'sugestaoTxt',
    'attributes.custom.guichoAcionadoBool': 'guichoAcionadoBool',
    'attributes.custom.resgateDeBateriaBool': 'resgateDeBateriaBool',
}

# Renomear as colunas
df.rename(columns=colunas_a_renomear, inplace=True)

# Exibir as colunas removidas e a quantidade
print(f"Quantidade de colunas removidas: {len(removed_columns)}")

# Remover colunas específicas
df.drop(columns=removed_columns, inplace=True, errors='ignore')
print(f"Número de colunas total: {df.shape[1]}")

Quantidade de colunas removidas: 118
Número de colunas total: 23


### **Organizando os dados**


**Reorganizar as colunas** colocando as colunas que começam com 'satisfaction' após as colunas 'motivo_contato_pri', 'motivo_contato_sec' e 'motivo_contato_terc'


In [None]:
colunas = list(df.columns)
colunas_motivo = ['motivo_contato_pri', 'motivo_contato_sec', 'motivo_contato_terc']
colunas_satisfaction = [col for col in colunas if col.startswith('satisfaction')]
colunas_outras = [col for col in colunas if col not in colunas_motivo + colunas_satisfaction]

colunas_reordenadas = colunas_motivo + colunas_satisfaction + colunas_outras
df = df[colunas_reordenadas]

# Converter o dtype da coluna 'atendente' para string
df['atendente'] = df['atendente'].astype(str)

**Gerar nomes genérico para os atendentes**

In [33]:
# Valores distintos fornecidos
valores_distintos = [valor for valor in df['atendente'].unique() if valor not in ([], '')]

# Filtrar valores válidos (excluindo listas vazias e strings vazias)
valores_distintos = [valor for valor in valores_distintos if valor not in ("[]", "")]

# Criar um dicionário de mapeamento para substituir os valores
mapeamento = {valor: f'Atendente {i+1}' for i, valor in enumerate(valores_distintos)}
mapeamento["[]"] = 'Não Identificado'
mapeamento[""] = 'Não Identificado'

# Substituir os valores na coluna 'atendente' usando o dicionário de mapeamento
df['atendente'] = df['atendente'].apply(lambda x: mapeamento.get(x, 'Não Identificado') if x in ("[]", "") else mapeamento.get(x, x))

## **Carregar os dados**

In [34]:
# Exportar o DataFrame para um arquivo Excel

output_file_path = os.path.join(aux_file_path, 'atendimento_last2m_tratado.xlsx')
df.to_excel(output_file_path, index=False)

print(f'O DataFrame tratado dos atendimentos possui {df.shape[0]} linhas e {df.shape[1]} colunas')
df

O DataFrame tratado dos atendimentos possui 4119 linhas e 23 colunas


Unnamed: 0,motivo_contato_pri,motivo_contato_sec,motivo_contato_terc,satisfaction_status,satisfaction_rating,satisfaction_Answer,createdAt,assignedUsersAt,endedAt,id,...,responseTime,attributes.doneCount,attributes.custom.caseIdStr,priority,guichoAcionadoBool,resgateDeBateriaBool,sugestaoTxt,churnRetidoBool,descrevaOProblemaTxt,attributes.custom.informacaoPedidaTxt
0,Pagamentos,Renegociação,Prorrogar data de vencimento,scheduled,,,2024-09-13T06:15:05.197Z,2024-09-13T11:09:44.536Z,2024-09-13T11:28:14.793Z,66e3d869357feab8bd8ebd7e,...,17809324.0,1,7TGSVO,3,,,,,,
1,Pagamentos,Renegociação,Prorrogar data de vencimento,offered,,,2024-09-13T03:28:55.518Z,2024-09-13T11:09:40.760Z,2024-09-13T11:24:11.752Z,66e3b1777a97f33644bf5c11,...,27752109.0,1,ZPB1CR,3,,,,,,
2,Suporte,Suporte com a Estação,Slot não Abre,unresponded,,,2024-09-13T02:03:19.807Z,2024-09-13T02:03:24.092Z,2024-09-13T02:22:47.941Z,66e39d67357feab8bd8e6413,...,84122.0,1,WET9C5,3,False,False,,,,
3,Suporte,Suporte com a Moto,Moto não liga,unresponded,,,2024-09-13T01:43:26.694Z,2024-09-13T01:47:10.466Z,2024-09-13T01:56:03.395Z,66e398be58dc05c1831e6260,...,114595.0,1,V58SE4,3,False,,,,,
4,Pagamentos,Renegociação,Renegociar Manutenção,unresponded,,,2024-09-13T01:29:45.504Z,2024-09-13T01:29:48.820Z,2024-09-13T01:54:35.401Z,66e39589357feab8bd8e49ae,...,2855.0,1,2LUKLJ,3,,,Queria adiantar o pagamento da manutenção,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
4114,Comunicados,Aviso: Nova Multa,,unresponded,,,2024-07-10T13:16:02.000Z,2024-07-10T19:22:43.086Z,2024-07-10T20:19:13.822Z,668e89928d41f3a604a716d6,...,6769301.0,1,8FACQV,3,,,,,,
4115,Comunicados,Aviso: Nova Multa,,unresponded,,,2024-07-10T13:15:59.319Z,2024-07-16T16:10:42.830Z,2024-07-16T21:12:12.845Z,668e898fa31a0e61a1d304dc,...,4129637.0,2,J0LZYF,3,,,,,,
4116,Comunicados,Agendar Manutenção,,unresponded,,,2024-07-10T13:15:57.462Z,2024-07-10T16:37:34.867Z,2024-07-10T18:19:39.399Z,668e898d9276cb40044acb63,...,743113.0,1,8OOSI6,3,,,,,,
4117,Dúvidas / Informações,Agendamento,,unresponded,,,2024-07-09T11:56:01.055Z,2024-07-09T11:58:09.960Z,2024-07-09T13:27:03.557Z,668d2551cdf8a99fdd9fce1d,...,799204.0,2,IA28SL,3,,,Hoje vc vai abrir a base pra revisã,,,
