## Descripción y comentarios

Encontrando TKs asociados a los cambios en Central Puerto

Pipelne
1. Descargar un reporte desde las vistas armadas. Importar y generar un dataframe en base a este.
2. Levantar el reporte de ABM para obtener el set de usuarios.
3. De los tks obtenidos a través de las vistas, descargar su html y realizar la busqueda de los objetos involucrados en los cambios identificados en los reportes.



In [None]:
import requests
import re
import pandas as pd
from bs4 import BeautifulSoup
import time

In [None]:
def parseCookieFile(cookiefile):
    """Parse a cookies.txt file and return a dictionary of key value pairs
    compatible with requests."""

    cookies = {}
    with open (cookiefile, 'r') as fp:
        for line in fp:
            if re.match(r'^\w', line):
                lineFields = line.strip().split('\t')
                cookies[lineFields[5]] = lineFields[6]
    return cookies


def buscar_tag(df, list_usuarios, tag):
    """ 
    Busca los tks que se encuentran en el dataframe, asociados a los usuarios que se encuentran en la list_usuarios.  
    
    Args:
        df(dataframe): Tks generados en la ticketera.
        list_usuarios(list): Lista de usuarios extraidos del reporte de cambios ABM.
        tag(str): ('comments' | 'title' | 'Apellido') Lugar en donde se hace la busqueda.
    
    Return:
        lista(list):
    """
    comments = df[tag].items()
    tk_comments = []
    tk_user = []
    
    # regla_user = tomo el usuario de la lista.
    for regla_user in list_usuarios:

        # recorro la lista de titulos de los requerimientos.
        for label, content in comments:
            
            # Busco dentro del titulo el nombre del usuario
            if content.find(regla_user) >= 0:
                tk_comments.append(label)
                tk_user.append(regla_user)
            elif content.find(regla_user.capitalize()) >= 0:
                tk_comments.append(label)
                tk_user.append(regla_user)
            elif content.find(regla_user.upper()) >= 0:
                tk_comments.append(label)
                tk_user.append(regla_user)


        comments = df[tag].items()

    lista = list(zip(tk_comments,tk_user))
    return lista

## Set de usuarios

In [None]:
# Importo el reporte sobre las AMB de usuarios
abm_usuarios = pd.read_csv("CPITAPDC10_-_WIN_-_ABM_de_Usuarios-2024-07-01.csv")


# 4720: A user account was created
# 4726: A user account was deleted
# 4725: A user account was disabled
# 4767: A user account was unlocked
lista_usuarios = abm_usuarios[abm_usuarios['EventCode'].isin([4767]) &
                                   ~abm_usuarios['Usuario Fuente'].str.startswith('MSOL') &
                                   ~abm_usuarios['Usuario Objetivo'].str.endswith('$')]['Usuario Objetivo'].values


lista_apellidos = []
for i in lista_usuarios:
    if i.startswith('e.'):
        # print(i[3:])
        lista_apellidos.append(i[3:])
    else:
        # print(i[1:])
        lista_apellidos.append(i[1:])
        

### Import lista de tks desde InvGate

In [None]:
# Importo el reporte de los tk
vista_abm_baja = pd.read_csv("InvGate_ServiceDesk_-_Requests_List.csv")
# vista_abm_baja.columns

# Acoto la lista y me quedo solo con los IDs
lista_tks = vista_abm_baja[vista_abm_baja['ID'] > 40000]['ID'].values
len(lista_tks)

# lista_tks = [41086,40990,40989,41017,40904,40842,40829,40779,40790,40771,40598,40102,40428,
             # 40117,40374,40187,40041]    

## Webscraping

In [None]:
df1 = pd.DataFrame()
cookies = parseCookieFile('cookie_invgate.txt')

for id_ in lista_tks:
    header = {
    'user-agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'
    }
    #id_ = '29649' 
    url=f'https://centralpuerto.cloud.invgate.net/incident/show/index/id/{id_}'

    response = requests.get(url, headers = header, cookies = cookies)
    # En caso de error imprimir por pantalla
    # if response.status_code != 200:
    #     print(response.status_code)
    print(response.status_code)
    soup = BeautifulSoup(response.content, 'html.parser')
    

    # Busco por clase, escribo class_ porque "class" es una palabra reservada en Python
    eventos_viewtitle = soup.find_all(class_ = 'requestViewTitle')
    eventos_title = soup.find_all(class_ = 'itemTitle')
    eventos_cont = soup.find_all(class_ = 'itemCont')
    eventos_tk = soup.find_all(class_ = 'section-button__text')
    eventos_comentarios = soup.find_all(class_ = 'activity-message__text')
    
    # Guardo los comentarios del tk en una string
    comentarios = " "
    for evento in eventos_comentarios:
        comentarios += evento.text
    
    # Guardo los campos del tk en una lista
    atributo = [evento.text for evento in eventos_title]
    valor = [evento.text.strip() for evento in eventos_cont]
    tk = [evento.text.strip() for evento in eventos_tk]
    
    # Armo los diccionarios
    dict_tk = {tk[0]: comentarios}
    lista = dict(zip(atributo,valor))
    lista['title'] = eventos_viewtitle[0].text
    lista['comments'] = comentarios
    
    # Armo los dataframes
    df2 = pd.DataFrame(lista, index=tk)
    df1 = pd.concat([df1,df2])
    
    time.sleep(1)
    
df1



In [None]:
df1.tail()

## Búsqueda

### Búsqueda por título del tk 

In [None]:
buscar_tag(df1, lista_usuarios, 'title')

In [None]:
buscar_tag(df1, lista_apellidos, 'title')

### Búsqueda por los comentarios del tk 

In [None]:
buscar_tag(df1, lista_apellidos, 'comments')

In [None]:
buscar_tag(df1, lista_usuarios, 'comments')

### Buscar en los campos personalizados del tk.
Este podría sumarse. Hay que tener en cuenta de separar el apellido del formato usuario.

In [None]:
df2 = df1.fillna("")

In [None]:
buscar_tag(df2, lista_apellidos, 'Apellido')

# Herramientas útiles
- [curl2python](https://curl.trillworks.com/)
- [Visualizador de JSONs](http://jsonviewer.stack.hu/)

# Recursos útiles
- [Tutorial de Indian Pythonista sobre APIs ocultas](https://www.youtube.com/watch?v=twuhocLtGCg)
- [Códigos de error HTTP](https://developer.mozilla.org/es/docs/Web/HTTP/Status)