# REALIZAR A EXTRAÇÃO TRATAMENTO E CARGA DOS DADOS PARA MINERAÇÃO DE PROCESSOS - PARTE III

* __Esse arquivo só deve ser executado após a execução da parte II__

## Importa as Bibliotecas necessárias

In [281]:
import pandas as pd
from sqlalchemy import create_engine
import datetime

## Abrir conexão com o banco de dados

In [282]:
engine = create_engine('postgresql://postgres:postgres@localhost:5432/PesquisaMestrado')
connection = engine.connect()

## GERAÇÃO DOS LOGS DE MINERAÇÃO DE PROCESSOS

In [12]:
ComandoSQL =  "SELECT atividade, transicao, count(*) as Registros \
    FROM tempanaliseocorrencias\
    GROUP BY atividade, transicao\
    ORDER BY count(*) DESC ;"

dados =pd.read_sql_query(ComandoSQL, engine)

dados.head(100)

Unnamed: 0,atividade,transicao,registros
0,ATENDIMENTO,start,73024
1,ABERTURA,start,20254
2,FECHAMENTO,start,20171
3,ENCERRAMENTO,start,18134
4,RECLASSIFICAÇÃO,start,8250
5,ATENDIMENTO,suspend,3331
6,ATENDIMENTO,resume,3225
7,CANCELAMENTO,start,824
8,REABERTURA,start,213


* __Tabela para armazenar os logs no formato necessário para a mineração de processos__

    + O sistema Citsmart armazena os logs ao nível de operações de sistema, ou seja qualquer operação que altere a solicitação de serviço é registrado no log, em consequência um volume muito grande registro é gerado. Esses registros podem ser úteis para mineração de processo a nível de operador.
    + No ministério do Planejamento a Central de Serviço opera com várias equipes e diferentes fornecedores e também de pessoal interno, assim a mineração de processos em nivel de operador seria muito complexa e pouco conclusiva. 
    + O que se tem em mente é a mineração do processo a nível de área responsável (Essa área corresponde a um agrupamento de técnicos que atuam com atividades bem específica. Ao agregar os logs no nível de área de atendimento, permitirá que a mineração de processo avalie o comportamento e o desempenho das equipes, abstraindo qual o operador que realizou a atividade. Isso simplificará o processo.

In [18]:
ComandoSQL ="DROP TABLE  IF EXISTS tempeventlogforprocessminingbyarea;  \
    CREATE TABLE tempeventlogforprocessminingbyarea \
    (       nomefluxo  character varying(200), \
        situacaosolicitacao character varying(30), \
        idEventolog serial, \
        idSolicitacao integer,   \
        agrupamento integer,  \
        atividade character varying(100),  \
        transicaoAtividade character varying(30), \
        areaExecucaoAtividade character varying(100),  \
        papelExecucaoAtividade character varying(100),  \
        NomeRecursoExecucaoAtividade character varying(100),  \
        dataHoraEventoLog timestamp without time zone \
    ); " 

trans = connection.begin()
try:
    resultado = connection.execute( ComandoSQL )
    trans.commit()
except:
    trans.rollback()
    raise

ComandoSQL = "SELECT table_name from INFORMATION_SCHEMA.TABLES \
    WHERE table_name = 'tempeventlogforprocessminingbyarea';"

resultado = connection.execute(ComandoSQL)

dados =pd.read_sql_query(ComandoSQL, engine)

dados.head()


Unnamed: 0,table_name
0,tempeventlogforprocessminingbyarea


* __Carrega os dados das ocorrências em formato de log de eventos para Mineração de processos__ 

    + As atividades de ABERTURA, ENCERRAMENTO, RECLASSIFICAÇÃO, CANCELAMENTO, REABERTURA são atividades realizadas muito rapidamente e geralmente levam apenas segundo a poucos minutos. Para essas atividades serão criado apenas o evento complete para indicar que foram realizadas, mas sem se preocupar com o tempo de duração. As atividades de ATENDIMENTO e FECHAMENTO são as atividades que cosomem o maior tempo do ciclo de vida dos solicitações de serviços, para elas haverá um evento de start e outro de complite. No caso da atividade de ATENDIMENTO haverá ainda um evento de suspend para indicar quando o chamado foi suspenso e um de resume para quando o chamado foi reativado.
    + Os campos role_name e resource_name não serão utilizados nesse caso, mas foram previstos na tabela para uso futuro, em caso de se desejar fazer a mineração de processos a nível de operador , nesse caso o role_name deverá ser preenchido com a função do operador e resource_name com o nome do operador.
    + O tempo de espera que ocorre geralmente entre uma atividade as de ABERTURA, ENCERRAMENTO, RECLASSIFICAÇÃO, CANCELAMENTO, REABERTURA e as atividades de ATENDIMENTO e FECHAMENTO serão representado por uma atividade de FILA DE ESPERA. Essa atividade será utilizada posteriormente para computar o tempo de permanencia da solicitação de serviços e cada área específica, bastando para isso somar o tempo de duração das atividades mais a duração da fila de espera.

In [19]:
ComandoSQL =  "TRUNCATE TABLE tempEventLogforProcessMiningbyArea;\
    \
    INSERT INTO tempEventLogforProcessMiningbyArea  \
    (nomefluxo, situacaosolicitacao, idSolicitacao,  agrupamento, \
    atividade, transicaoAtividade, areaExecucaoAtividade,papelExecucaoAtividade,\
     NomeRecursoExecucaoAtividade, dataHoraEventoLog) \
    SELECT nomefluxo, situacaosolicitacao, idSolicitacao,  agrupamento, atividade,\
     transicaoAtividade, areaExecucaoAtividade, papelExecucaoAtividade, \
    NomeRecursoExecucaoAtividade, dataHoraEventoLog \
    FROM ( \
    /* TODAS AS  ATIVIDADES ATOMICAS QUE DURAM APENAS O TEMPO DE OPERAÇÃO\
     NO SISTEMA JA CRIADAS COM A TRANSAÇÃO COMPLETE)*/ \
    SELECT nomefluxo, situacaosolicitacao, idsolicitacaoservico AS  idSolicitacao,   \
    agrupamentoregistrosporarea AS  agrupamento, \
    atividade AS  atividade,  \
    'complete' as transicaoAtividade,  \
    arearesponsavel AS  areaExecucaoAtividade,  \
    '--'  AS  papelExecucaoAtividade, \
    '--' AS  NomeRecursoExecucaoAtividade,  \
    min(datainicio) dataHoraEventoLog \
    FROM tempanaliseocorrencias \
    WHERE atividade not IN ('ATENDIMENTO','FECHAMENTO')  \
    GROUP BY nomefluxo, situacaosolicitacao, idsolicitacaoservico,  \
     agrupamentoregistrosporarea,atividade, \
    transicao, arearesponsavel  \
     \
    UNION \
     \
    /*START IGUAL AO INICIO DA ATOMICA MAIS 5 SEGUNDOS*/ \
    SELECT nomefluxo, situacaosolicitacao, idsolicitacaoservico AS  idSolicitacao,   \
     agrupamentoregistrosporarea AS  agrupamento, \
    'FILA DE ESPERA' AS  atividade,  \
    'start' AS  transicaoAtividade,  \
    arearesponsavel AS  areaExecucaoAtividade,  \
    '--'  AS  papelExecucaoAtividade, \
    '--' AS  NomeRecursoExecucaoAtividade,  \
    min(datainicio)  + interval '5 sec' dataHoraEventoLog \
    FROM tempanaliseocorrencias \
    WHERE atividade not IN ('ATENDIMENTO','FECHAMENTO')  \
    GROUP BY nomefluxo, situacaosolicitacao, idsolicitacaoservico, \
      agrupamentoregistrosporarea,atividade,  \
    transicao, arearesponsavel  \
    \
    UNION \
     \
    /*COMPLETE IGUAL AO FIM DA ATOMICA*/ \
    SELECT nomefluxo, situacaosolicitacao, idsolicitacaoservico AS  idSolicitacao,   \
     agrupamentoregistrosporarea AS  agrupamento, \
    'FILA DE ESPERA' AS  atividade,  \
    'complete' AS  transicaoAtividade,  \
    arearesponsavel AS  areaExecucaoAtividade,  \
    '--'  AS  papelExecucaoAtividade, \
    '--' AS  NomeRecursoExecucaoAtividade,  \
    max(datafim)  dataHoraEventoLog \
    FROM tempanaliseocorrencias \
    WHERE atividade not IN ('ATENDIMENTO','FECHAMENTO')  \
    GROUP BY nomefluxo, situacaosolicitacao, idsolicitacaoservico,   \
    agrupamentoregistrosporarea,atividade,  \
    transicao, arearesponsavel  \
     \
    UNION \
     \
    /*  TRANSIÇÕES DE SUSPENSÃO E REATIVAÇÃO DOS CHAMADOS  */ \
    SELECT nomefluxo,  situacaosolicitacao, idsolicitacaoservico AS  idSolicitacao,   \
     agrupamentoregistrosporarea AS  agrupamento, \
    atividade AS  atividade,  \
    transicao AS  transicaoAtividade,  \
    arearesponsavel AS  areaExecucaoAtividade,  \
    '--'  AS  papelExecucaoAtividade, \
    '--' AS  NomeRecursoExecucaoAtividade,  \
    min(datainicio) dataHoraEventoLog \
    FROM tempanaliseocorrencias \
    WHERE  atividade IN ('ATENDIMENTO') \
    AND transicao IN ('suspend','resume')  \
    GROUP BY nomefluxo, situacaosolicitacao, idsolicitacaoservico,  \
     agrupamentoregistrosporarea,atividade, \
     transicao, arearesponsavel  \
     \
    UNION \
     \
    /* CRIA TRANSIÇÃO START PARA ATIVIDADES DE ATENDIMENTO \
    COM A MENOR DATA DE INICIO DO AGRUPAMENTO*/ \
    SELECT nomefluxo, situacaosolicitacao,  idsolicitacaoservico AS  idSolicitacao,   \
     agrupamentoregistrosporarea AS  agrupamento, \
    atividade AS  atividade,  \
    transicao AS  transicaoAtividade,  \
    arearesponsavel AS  areaExecucaoAtividade,  \
    '--'  AS  papelExecucaoAtividade, \
    '--' AS  NomeRecursoExecucaoAtividade,  \
    min(datainicio) dataHoraEventoLog \
    FROM tempanaliseocorrencias \
    WHERE  atividade IN ('ATENDIMENTO','FECHAMENTO')  \
    AND transicao NOT IN ('suspend','resume')  \
    GROUP BY nomefluxo, situacaosolicitacao, idsolicitacaoservico, \
      agrupamentoregistrosporarea,atividade, \
     transicao, arearesponsavel  \
     \
    UNION \
     \
    /*A TRANSIÇÃO COMPLETA PARA ATIVIDADES DE ATENDIMENTO COM \
    A MAIOR DATA DE FIM DO AGRUPAMENTO*/ \
    SELECT nomefluxo,situacaosolicitacao,  idsolicitacaoservico AS  idSolicitacao,   \
     agrupamentoregistrosporarea AS  agrupamento, \
    atividade AS  atividade,  \
    'complete' AS  transicaoAtividade,  \
    arearesponsavel AS  areaExecucaoAtividade,  \
    '--'  AS  papelExecucaoAtividade, \
    '--' AS  NomeRecursoExecucaoAtividade,  \
    max(datafim) dataHoraEventoLog \
    FROM tempanaliseocorrencias \
    WHERE  atividade IN ('ATENDIMENTO','FECHAMENTO')  \
    AND transicao NOT IN ('suspend','resume')  \
    GROUP BY nomefluxo, situacaosolicitacao, idsolicitacaoservico,  \
     agrupamentoregistrosporarea,atividade, \
     transicao, arearesponsavel  \
     \
    ) AS  t \
    ORDER BY idSolicitacao,  dataHoraEventoLog; " 
    
trans = connection.begin()
try:
    resultado = connection.execute( ComandoSQL )
    trans.commit()
except:
    trans.rollback()
    raise
    
#print ComandoSQL

ComandoSQL =  "SELECT atividade,transicaoAtividade, count(*) as Registros \
    FROM tempEventLogforProcessMiningbyArea\
    GROUP BY atividade,transicaoAtividade\
    ORDER BY count(*) DESC ;"

dados =pd.read_sql_query(ComandoSQL, engine)

dados.head(100)

Unnamed: 0,atividade,transicaoatividade,registros
0,FILA DE ESPERA,start,46598
1,FILA DE ESPERA,complete,46598
2,ATENDIMENTO,complete,36132
3,ATENDIMENTO,start,36132
4,ABERTURA,complete,20254
5,FECHAMENTO,start,19993
6,FECHAMENTO,complete,19993
7,ENCERRAMENTO,complete,17319
8,RECLASSIFICAÇÃO,complete,8021
9,ATENDIMENTO,suspend,3331


* __Corrigir a área da atividade de fila de espera__
    + Como a atividade de fila de espera foi criada com base nas atividades de ABERTURA, ENCERRAMENTO, RECLASSIFICAÇÃO, CANCELAMENTO, REABERTURA, geralmente ocorre um movimento no fluxo da solicitação no fluxo, por exemplo após a operação de abertura a solicitação é disponibilizada para atendimento da equipe, e fica aguardando até que um técnico faça a captura da solicitação para iniciar o atendimento. Nesse caso o tempo de espera deve ser computado não para a área que fez a abertura da solicitação, mas para a área que fez o atendimento.
    + Como no passa anterior a atividade de espera foi criada com a área da atividade de ABERTURA, ENCERRAMENTO, RECLASSIFICAÇÃO, CANCELAMENTO, REABERTURA , então será necessário ajustar o área com o nome da área que registrou a atividade imediatamente posterior.

In [20]:
ComandoSQL =  "UPDATE tempEventLogforProcessMiningbyArea AS EV \
    SET areaExecucaoAtividade = T.areaExecucaoAtividade \
    FROM ( \
    SELECT ATUALESPERA.idEventolog, PROXIMO.areaExecucaoAtividade \
    FROM ( \
        SELECT E.atividade, E.idSolicitacao, E.idEventolog, \
        min(P.idEventolog) as proxidEventolog  \
        FROM tempEventLogforProcessMiningbyArea E \
        JOIN tempEventLogforProcessMiningbyArea P \
            ON P.idSolicitacao = e.idSolicitacao \
            and P.idEventolog > e.idEventolog \
        WHERE E.atividade = 'FILA DE ESPERA' \
        AND  P.atividade <> 'FILA DE ESPERA' \
        GROUP BY  E.atividade, E.idSolicitacao, E.idEventolog \
        ) ATUALESPERA  \
    JOIN tempEventLogforProcessMiningbyArea PROXIMO	 \
        ON ATUALESPERA.proxidEventolog = PROXIMO.idEventolog   \
    ) AS T  \
    WHERE T.idEventolog = EV.idEventolog;" 
    
trans = connection.begin()
try:
    resultado = connection.execute( ComandoSQL )
    trans.commit()
except:
    trans.rollback()
    raise
    
#print ComandoSQL

ComandoSQL =  "SELECT atividade,transicaoAtividade,areaExecucaoAtividade, \
    count(*) as Registros \
    FROM tempEventLogforProcessMiningbyArea\
    WHERE atividade = 'FILA DE ESPERA' \
    GROUP BY atividade,transicaoAtividade,areaExecucaoAtividade\
    ORDER BY count(*) DESC ;"

dados =pd.read_sql_query(ComandoSQL, engine)

dados.head(100)

Unnamed: 0,atividade,transicaoatividade,areaexecucaoatividade,registros
0,FILA DE ESPERA,start,CIT-NIVEL1,27171
1,FILA DE ESPERA,complete,CIT-NIVEL1,27137
2,FILA DE ESPERA,complete,DTI-SUPORTE,6062
3,FILA DE ESPERA,start,DTI-SUPORTE,6044
4,FILA DE ESPERA,complete,CIT-PRES-DF,5531
5,FILA DE ESPERA,start,CIT-PRES-DF,5522
6,FILA DE ESPERA,complete,CIT-SISTEMAS,3396
7,FILA DE ESPERA,start,CIT-SISTEMAS,3393
8,FILA DE ESPERA,complete,CIT-INFRA,1835
9,FILA DE ESPERA,start,CIT-INFRA,1834


* __Verifica a quantidade de eventos por mês__

In [21]:
ComandoSQL =  "SELECT  date_part('year'::text, dataHoraEventoLog) AS  ANO,  \
    date_part('month'::text, dataHoraEventoLog) AS  MES, COUNT(*) as registros  \
    FROM tempEventLogforProcessMiningbyArea  \
    GROUP BY  date_part('year'::text, dataHoraEventoLog),  \
    date_part('month'::text, dataHoraEventoLog) \
    ORDER BY date_part('year'::text, dataHoraEventoLog),  \
    date_part('month'::text, dataHoraEventoLog);"

dados =pd.read_sql_query(ComandoSQL, engine)

dados.head(100)

Unnamed: 0,ano,mes,count
0,2013,4,15
1,2013,10,58
2,2014,1,4
3,2014,3,5
4,2014,4,9
5,2014,6,113
6,2014,7,5320
7,2014,8,10414
8,2014,9,19024
9,2014,10,25397


## Gerar os arquivos de Logs para período desejado

In [283]:
ParametrosSQL={"dataInicio" : datetime.datetime(2014,10,1,0,0,0),"dataFim" : datetime.datetime(2015,3,31,23,59,59)}

ComandoSQL =  "SELECT distinct pm.nomefluxo, pm.situacaosolicitacao as Eventosituacaosolicitacao , \
    upper(ss.situacao) AS SituacaoFinalSolicitacao,\
    to_char(idSolicitacao, '0000000') AS  idSolicitacao , pm.agrupamento,  \
    to_char(idEventolog, '000000000') AS  idEventolog ,   \
    atividade, transicaoAtividade, areaExecucaoAtividade, papelExecucaoAtividade,\
    NomeRecursoExecucaoAtividade,  \
    to_char(dataHoraEventoLog, 'dd-mm-yyyy HH24:MI:SS') AS  dataHoraEventoLog, \
    split_part(S.NOMESERVICO,' - ',1) as grupoServico,  \
    split_part(S.NOMESERVICO,' - ',2) as servico,  \
    split_part(S.NOMESERVICO,' - ',3) as operacaoServico, \
    btrim(upper(td.nometipodemandaservico::text), ' '::text) AS tipoSolicitacao, \
    btrim(upper(prd.nomeprioridade::text), ' '::text) AS prioridade, \
    btrim(upper(org.descricao::text), ' '::text) AS origemSolicitacao, \
    round(tans.tempohh + ( tans.tempomm/60),2) as TempoAtendimentoSLAServico, \
    round(ss.prazohh + ( ss.prazomm/60),2) as TempoAtendimentoSLAChamado,   \
    SPLIT_PART(SPLIT_PART(ge.descricao, 'AREA=', 2),']',1)  AS  areaResponsavelServico \
    FROM tempEventLogforProcessMiningbyArea pm \
    JOIN solicitacaoServico ss ON ss.idsolicitacaoservico = pm.idSolicitacao \
    JOIN servicocontrato sc ON sc.idservicocontrato = ss.idservicocontrato \
    JOIN servico s on s.idservico = sc.idservico \
    LEFT JOIN prioridade prd ON prd.idprioridade = ss.idprioridade \
    LEFT JOIN origematendimento org ON org.idorigem = ss.idorigem \
    LEFT JOIN tipodemandaservico td ON td.idtipodemandaservico = ss.idtipodemandaservico \
    join acordoservicocontrato asct on asct.idservicocontrato = sc.idservicocontrato \
    join acordonivelservico ans on ans.idacordonivelservico = asct.idacordonivelservico \
    join tempoacordonivelservico tans on tans.idacordonivelservico = ans.idacordonivelservico  \
        and tans.idfase = 2 and  tans.idprioridade = 3 \
    join grupo ge on ge.idgrupo = sc.idgrupoexecutor \
    WHERE idSolicitacao IN ( \
            SELECT idSolicitacao \
            FROM tempEventLogforProcessMiningbyArea  \
            where nomefluxo = 'SOLICITACAOSERVICOCOMQUALIDADE' \
            GROUP BY idSolicitacao \
            having min(dataHoraEventoLog)>= %(dataInicio)s  \
            and  min(dataHoraEventoLog)<= %(dataFim)s   \
            order by idSolicitacao \
       ) \
    ORDER BY ideventolog, idSolicitacao; "

dadosLogs =pd.read_sql_query(ComandoSQL, engine,params=ParametrosSQL, index_col='ideventolog')

dadosLogs.head(10)

Unnamed: 0_level_0,nomefluxo,eventosituacaosolicitacao,situacaofinalsolicitacao,idsolicitacao,agrupamento,atividade,transicaoatividade,areaexecucaoatividade,papelexecucaoatividade,nomerecursoexecucaoatividade,datahoraeventolog,gruposervico,servico,operacaoservico,tiposolicitacao,prioridade,origemsolicitacao,tempoatendimentoslaservico,tempoatendimentoslachamado,arearesponsavelservico
ideventolog,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1
37199,SOLICITACAOSERVICOCOMQUALIDADE,REGISTRADA,FECHADA,3031,31760,ABERTURA,complete,PORTAL,--,--,01-10-2014 07:32:00,APLICAÇÕES,PONTO DA SOF,DIAGNOSTICAR ERROS E FALHAS,INCIDENTE,3,2º NÍVEL,18,8,CIT-SISTEMAS
37200,SOLICITACAOSERVICOCOMQUALIDADE,REGISTRADA,FECHADA,3031,31760,FILA DE ESPERA,start,OUTROS,--,--,01-10-2014 07:32:05,APLICAÇÕES,PONTO DA SOF,DIAGNOSTICAR ERROS E FALHAS,INCIDENTE,3,2º NÍVEL,18,8,CIT-SISTEMAS
37201,SOLICITACAOSERVICOCOMQUALIDADE,REGISTRADA,FECHADA,3031,31760,FILA DE ESPERA,complete,OUTROS,--,--,01-10-2014 07:32:58,APLICAÇÕES,PONTO DA SOF,DIAGNOSTICAR ERROS E FALHAS,INCIDENTE,3,2º NÍVEL,18,8,CIT-SISTEMAS
37202,SOLICITACAOSERVICOCOMQUALIDADE,EM ANDAMENTO,FECHADA,3031,31885,ATENDIMENTO,start,OUTROS,--,--,01-10-2014 07:33:00,APLICAÇÕES,PONTO DA SOF,DIAGNOSTICAR ERROS E FALHAS,INCIDENTE,3,2º NÍVEL,18,8,CIT-SISTEMAS
37203,SOLICITACAOSERVICOCOMQUALIDADE,EM ANDAMENTO,FECHADA,3031,31885,ATENDIMENTO,complete,OUTROS,--,--,01-10-2014 09:42:58,APLICAÇÕES,PONTO DA SOF,DIAGNOSTICAR ERROS E FALHAS,INCIDENTE,3,2º NÍVEL,18,8,CIT-SISTEMAS
37204,SOLICITACAOSERVICOCOMQUALIDADE,RESOLVIDA,FECHADA,3031,31899,ENCERRAMENTO,complete,OUTROS,--,--,01-10-2014 09:43:00,APLICAÇÕES,PONTO DA SOF,DIAGNOSTICAR ERROS E FALHAS,INCIDENTE,3,2º NÍVEL,18,8,CIT-SISTEMAS
37205,SOLICITACAOSERVICOCOMQUALIDADE,RESOLVIDA,FECHADA,3031,31899,FILA DE ESPERA,start,CIT-NIVEL1,--,--,01-10-2014 09:43:05,APLICAÇÕES,PONTO DA SOF,DIAGNOSTICAR ERROS E FALHAS,INCIDENTE,3,2º NÍVEL,18,8,CIT-SISTEMAS
37206,SOLICITACAOSERVICOCOMQUALIDADE,RESOLVIDA,FECHADA,3031,31899,FILA DE ESPERA,complete,CIT-NIVEL1,--,--,01-10-2014 09:46:58,APLICAÇÕES,PONTO DA SOF,DIAGNOSTICAR ERROS E FALHAS,INCIDENTE,3,2º NÍVEL,18,8,CIT-SISTEMAS
37207,SOLICITACAOSERVICOCOMQUALIDADE,FECHADA,FECHADA,3031,31900,FECHAMENTO,start,CIT-NIVEL1,--,--,01-10-2014 09:47:00,APLICAÇÕES,PONTO DA SOF,DIAGNOSTICAR ERROS E FALHAS,INCIDENTE,3,2º NÍVEL,18,8,CIT-SISTEMAS
37208,SOLICITACAOSERVICOCOMQUALIDADE,FECHADA,FECHADA,3031,31900,FECHAMENTO,complete,CIT-NIVEL1,--,--,01-10-2014 09:48:00,APLICAÇÕES,PONTO DA SOF,DIAGNOSTICAR ERROS E FALHAS,INCIDENTE,3,2º NÍVEL,18,8,CIT-SISTEMAS


*  __Gerar o arquivo csv para mineração de processsos__

In [284]:
nomeArquivoCSV = 'D:\\RepositoriosGitHub\\DataAndCode\\DADOS\\arquivodelogsmineracaoprocessos.csv'
FormatoData='%d-%m-%Y %H:%M:%S'
dadosLogs.to_csv(nomeArquivoCSV, sep=';', encoding='utf-8', date_format=FormatoData )