In [9]:
import pandas as pd
import re
import warnings
import unidecode 

In [18]:
def read_data():
    warnings.filterwarnings("ignore")
    data = pd.read_csv("Dataset/SetRegexFin.csv")
    return data

In [11]:
def normalize_df(df):
    """
    Normaliza el dataframe
    Parametros:
    df -- dataframe a normalizar
    Retorna:
    df -- dataframe normalizado
    """
    df['AntecedentesSSPracticasSexualesRiesgoCuales'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.upper()
    df['AntecedentesSSPracticasSexualesRiesgoCuales'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].astype(str)
    df['AntecedentesSSPracticasSexualesRiesgoCuales'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.strip()
    df['AntecedentesSSPracticasSexualesRiesgoCuales'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].apply(unidecode.unidecode)
    return df

In [12]:
def get_sexual_risk_practices(df):
    """
    Obtiene las practicas sexuales de riesgo
    Parametros:
    df -- dataframe
    Retorna:
    df -- dataframe con columnas de practicas sexuales de riesgo 
    """
    df['PracticasSexualesDeRiesgoSinEspecificar'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b|SIN).*?RIES\w+').astype(int)
    df['MultiplesParejasSexuales'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?(PROMIS\w.*)').astype(int)
    df['MultiplesParejasSexuales2'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?(MUJE\w.*)\s(DIFERE\w+)').astype(int)
    df['MultiplesParejasSexuales3'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?(VARI\w+)\s(PAREJ\w+)').astype(int)
    df['MultiplesParejasSexuales4'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?(MULTI\w+)(\s)(PARE\w+)').astype(int)
    df['MultiplesParejasSexuales5'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?(MULTI\w+)(\s)(RELAC\w+)').astype(int)
    df['MultiplesParejasSexuales6'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?(OTRA)(\s)(MUJ\w+)').astype(int)
    df['MultiplesParejasSexuales7'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?(INFI\w+)').astype(int)
    df['MultiplesParejasSexuales8'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?(EXTRAMA\w+)').astype(int)
    df['UsoIntermitenteDeCondon'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?USO.IRRE\w+.DE[L]?.(COND\w+|PRESE\w+|PROTE\w+)').astype(int)
    df['UsoIntermitenteDeCondon2'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bOCAS\w+\b.NO.HA.US\w+.COND\w+').astype(int)
    df['UsoIntermitenteDeCondon3'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bUTIL\w+\b.CON\w+.OCASI\w+').astype(int)
    df['UsoIntermitenteDeCondon4'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bUSO\b.OCAS\w+.DE.COND\w+').astype(int)
    df['UsoIntermitenteDeCondon5'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bOCAS\w+\b.QUE.SI.UTILI\w+.PROTE\w+').astype(int)
    df['UsoIntermitenteDeCondon6'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bLA\b.MAYO\w+.SIN.COND\w+').astype(int)
    df['UsoIntermitenteDeCondon7'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bOCAS\w+\b.SIN.COND\w+').astype(int)
    df['UsoIntermitenteDeCondon8'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bOCAS\w+\b.SI.USO.DE.PRESER\w+').astype(int)
    df['UsoIntermitenteDeCondon9'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bUSO\b.OCAS\w+.DE.(PRESE\w+|CON\w+)').astype(int)
    df['UsoIntermitenteDeCondon10'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bUSO\b.DE.(PRES\w+|COND\w+|PROT\w+).IRRE\w+').astype(int)
    df['UsoIntermitenteDeCondon11'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bPROT\w+\b.(IRRE\w+|OCAS\w+)').astype(int)
    df['UsoIntermitenteDeCondon12'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bA\b.VECES.(SIN|CON|USA).(PRES\w+|COND\w+|PROT\w+)').astype(int)
    df['UsoIntermitenteDeCondon13'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bA\b.VECES.NO.USA.(PRES\w+|COND\w+|PROT\w+)').astype(int)
    df['UsoIntermitenteDeCondon14'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bA\b.VECES.HA.USA\w+.(PRES\w+|COND\w+|PROT\w+)').astype(int)
    df['UsoIntermitenteDeCondon15'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bA\b.VECES.(PRES\w+|COND\w+|PROT\w+)').astype(int)
    df['UsoIntermitenteDeCondon16'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bA\b.VECES.NO.HA.UTI\w+.(PRES\w+|COND\w+|PROT\w+)').astype(int)
    df['PenetracionSinCondon'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bSIN\b.(CON\w+|PRES\w+|PROT\w+)').astype(int)
    df['PenetracionSinCondon2'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\b(NO|SIN)\b.USO.(ADEC\w+)?.?(DE)?.?(CON\w+|PRES\w+|PROT\w+)').astype(int)
    df['PenetracionSinCondon3'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bSIN\b.MED\w+.DE.(PROT\w+|PRES\w+|COND\w+)').astype(int)
    df['PenetracionSinCondon4'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bSIN\b.(USO|PROT\w+|PRES\w+|COND\w+)').astype(int)
    df['PenetracionSinCondon5'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bNO\b.UTIL\w+.(PROT\w+|PRES\w+|COND\w+)').astype(int)
    df['SexoOralSinProteccion'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\b(SIN|NO)\b.USO.*(CON\w+|PRES\w+|PROT\w+).*(\bORA\w+)').astype(int)
    df['SexoOralSinProteccion2'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bSEX\w+\b.ORA\w+.SIN.(CON\w+|PRES\w+|PROT\w+)').astype(int)
    df['SexoGrupal'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bGRUPO\b.*SIN.(COND\w+|PRES\w+|PROT\w+)').astype(int)
    df['SexoGrupal2'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bSIN\b.USO?.?DE?.?(PRES\w+|COND\w+|PROT\w+).*(TRIOS|ORG\w+)').astype(int)
    df['SexoConTrabajadorasSexuales'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?RELAC\w+.SEX\w+.+\bTRAB\w+\s.AS.\sSEX\w+').astype(int)
    df['SexoConTrabajadorasSexuales2'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?RELAC\w+.SEX\w+.CON.SEXOS\w+').astype(int)
    df['SexoConTrabajadorasSexuales3'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?CONTA\w+.SEX\w+.CON.SEX\w+').astype(int)
    df['SexoConTrabajadorasSexuales4'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bCON.SEX\w+').astype(int)
    df['SexoConTrabajadorasSexuales5'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bCON.TRAB\w+.SEX\w+').astype(int)
    df['TrabajadorasSexuales'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bTRAB\w+.COMO.(SEX\w+|ACOMP\w+|PROST\w+|STRI\w+|TRAB\w+|ESCO\w+|DAMA)').astype(int)
    df['TrabajadorasSexuales2'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bDEDI\w+.(COMO|A)?.?LA?.?(SEX\w+|ACOMP\w+|PROST\w+|STRI\w+|TRAB\w+|ESCO\w+|DAMA)').astype(int)
    df['IntercambioDeSexoPorDroga'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bINTER\w+.(?!.*POR.(DINERO|BIENES)\b)').astype(int)
    df['IntercambioDeSexoPorBienes'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bINTER\w+.(?!.*POR.(SUST\w+|DRO\w+)\b)').astype(int)
    df['LesionesHeridasEnGenitales'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bLES\w+').astype(int)
    df['LesionesHeridasEnGenitales2'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bHERI\w+').astype(int)
    df['InfeccionesDeTransmisionSexual'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?(\bPUS\b|\bGRANITOS|\bGRANOS|VERR\w+)').astype(int)
    df['InfeccionesDeTransmisionSexual2'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?TRAN\w+.SEX\w+').astype(int)
    df['InfeccionesDeTransmisionSexual3'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?INFE\w+').astype(int)
    df['InfeccionesDeTransmisionSexual4'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bPOR\w+.DE.VIH').astype(int)
    df['InfeccionesDeTransmisionSexual5'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bDIAGN\w+.CON.VIH').astype(int)
    df['InfeccionesDeTransmisionSexual6'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bCONT\w+.DE.VIH').astype(int)
    df['InfeccionesDeTransmisionSexual7'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bVIH.LO.ADQ\w+').astype(int)
    df['InfeccionesDeTransmisionSexual8'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bVIH.POS\w+').astype(int)
    df['InfeccionesDeTransmisionSexual9'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bADQU\w+.VIH').astype(int)
    df['InfeccionesDeTransmisionSexual10'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bCONT\w+.VIH').astype(int)
    df['InfeccionesDeTransmisionSexual11'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bVIH.SEROP\w+').astype(int)
    df['InfeccionesDeTransmisionSexual12'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bCON.VIH').astype(int)
    df['InfeccionesDeTransmisionSexual13'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bINFE\w+.DE.VIH').astype(int)
    df['InfeccionesDeTransmisionSexual14'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bCONTA+\w+.DE.SIDA').astype(int)
    df['InfeccionesDeTransmisionSexual15'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?\bGONORREA').astype(int)
    df['InfeccionesDeTransmisionSexual16'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA|NO\b).*?(\bCLAMIDIA|\bHERPES|\bPAPILOMA|\bHEPATITIS)').astype(int)
    df['SexoCasual'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'\bCASUA\w+').astype(int)
    df['SexoCasual2'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'\bFORTUI\w+').astype(int)
    df['AlcoholRelacionesSexuales'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'\bALCOH\w+').astype(int)
    df['MariguanaRelacionesSexuales'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'(\bMARIG\w+|MARIH\w+)').astype(int)
    df['SustanciasRelacionesSexuales'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'\bCONS\w+.DE.(SUST\w+|DROG\w+)').astype(int)
    df['GHBGBLRelacionesSexuales'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'(\bCRIS\w+|\bMETAN\w+|\bCOC\+|\bCRACK|\bANFET\w+)').astype(int)
    df['SexoSinConsentimiento'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'\bSIN.CONSE\w+').astype(int)
    df['SexoSinConsentimiento2'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA).*?(\bVIOLA\w+|TOCAM\w+)').astype(int)
    df['SexoSinConsentimiento3'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'^(?!.*\bNIEGA).*?\bVIOLEN\w+.SEX\w+').astype(int)
    df['DrogasInyectadas'] = df['AntecedentesSSPracticasSexualesRiesgoCuales'].str.contains(r'(\bAGUJAS\w+|JERINGAS)').astype(int)
    return df


In [13]:
def deff_risk_practices(df):
    """
    Obtiene las practicas sexuales de riesgo
    Parametros:
    df -- dataframe
    Retorna:
    df -- dataframe con columnas de practicas sexuales de riesgo
    """
    df['MULTIPLESPAREJASSEXUALES'] = df[['MultiplesParejasSexuales', 'MultiplesParejasSexuales2', 'MultiplesParejasSexuales3', 'MultiplesParejasSexuales4', 'MultiplesParejasSexuales5', 'MultiplesParejasSexuales6', 'MultiplesParejasSexuales7', 'MultiplesParejasSexuales8']].max(axis=1)
    df['USOINTERMITENTEDECONDON'] = df[['UsoIntermitenteDeCondon', 'UsoIntermitenteDeCondon2', 'UsoIntermitenteDeCondon3', 'UsoIntermitenteDeCondon4', 'UsoIntermitenteDeCondon5', 'UsoIntermitenteDeCondon6', 'UsoIntermitenteDeCondon7', 'UsoIntermitenteDeCondon8', 'UsoIntermitenteDeCondon9', 'UsoIntermitenteDeCondon10', 'UsoIntermitenteDeCondon11', 'UsoIntermitenteDeCondon12', 'UsoIntermitenteDeCondon13', 'UsoIntermitenteDeCondon14', 'UsoIntermitenteDeCondon15', 'UsoIntermitenteDeCondon16' ]].max(axis=1)
    df['PENETRACIONSINCONDON'] = df[['PenetracionSinCondon', 'PenetracionSinCondon2', 'PenetracionSinCondon3', 'PenetracionSinCondon4','PenetracionSinCondon5']].max(axis=1)
    df['SEXOORALSINPROTECCION'] = df[['SexoOralSinProteccion', 'SexoOralSinProteccion2']].max(axis=1)
    df['SEXOGRUPAL'] = df[['SexoGrupal', 'SexoGrupal2']].max(axis=1)
    df['SEXOCONTRABAJADORASSEXUALES'] = df[['SexoConTrabajadorasSexuales', 'SexoConTrabajadorasSexuales2', 'SexoConTrabajadorasSexuales3', 'SexoConTrabajadorasSexuales4', 'SexoConTrabajadorasSexuales5']].max(axis=1)
    df['TRABAJADORASSEXUALES'] = df[['TrabajadorasSexuales', 'TrabajadorasSexuales2']].max(axis=1)
    df['INTERCAMBIODESEXOPORDROGA'] = df[['IntercambioDeSexoPorDroga']].max(axis=1)
    df['INTERCAMBIODESEXOPORBIENES'] = df[['IntercambioDeSexoPorBienes']].max(axis=1)
    df['LESIONESHERIDASENGENITALES'] = df[['LesionesHeridasEnGenitales', 'LesionesHeridasEnGenitales2']].max(axis=1)
    df['INFECCIONESDETRANSMISIONSEXUAL'] = df[['InfeccionesDeTransmisionSexual', 'InfeccionesDeTransmisionSexual2', 'InfeccionesDeTransmisionSexual3','InfeccionesDeTransmisionSexual4', 'InfeccionesDeTransmisionSexual5', 'InfeccionesDeTransmisionSexual6','InfeccionesDeTransmisionSexual7','InfeccionesDeTransmisionSexual8','InfeccionesDeTransmisionSexual9','InfeccionesDeTransmisionSexual10','InfeccionesDeTransmisionSexual11','InfeccionesDeTransmisionSexual12','InfeccionesDeTransmisionSexual13','InfeccionesDeTransmisionSexual14','InfeccionesDeTransmisionSexual15','InfeccionesDeTransmisionSexual16']].max(axis=1)
    df['SEXOCASUAL'] = df[['SexoCasual']].max(axis=1)
    df['ALCOHOLRELACIONESSEXUALES'] = df[['AlcoholRelacionesSexuales']].max(axis=1)
    df['MARIGUANARELACIONESSEXUALES'] = df[['MariguanaRelacionesSexuales']].max(axis=1)
    df['SUSTANCIASRELACIONESSEXUALES'] = df[['SustanciasRelacionesSexuales']].max(axis=1)
    df['GHGBLRELACIONESSEXUALES'] = df[['GHBGBLRelacionesSexuales']].max(axis=1)
    df['SEXOSINCONSENTIMIENTO'] = df[['SexoSinConsentimiento', 'SexoSinConsentimiento2', 'SexoSinConsentimiento3']].max(axis=1)
    df['DROGASINYECTADAS'] = df[['DrogasInyectadas']].max(axis=1)
    return df

In [14]:
def clear_set(df):
    """
    Elimina las columnas que no se utilizaran
    Parametros:
    df -- dataframe
    Retorna:
    df -- dataframe con columnas eliminadas
    """
    list_eliminar = []
    for col in df.columns:
        if col.startswith('MultiplesParejasSexuales') or col.startswith('UsoIntermitenteDeCondon') or col.startswith('PenetracionSinCondon') or col.startswith('SexoOralSinProteccion') or col.startswith('SexoGrupal') or col.startswith('SexoConTrabajadorasSexuales') or col.startswith('TrabajadorasSexuales') or col.startswith('IntercambioDeSexoPorDroga') or col.startswith('IntercambioDeSexoPorBienes') or col.startswith('LesionesHeridasEnGenitales') or col.startswith('InfeccionesDeTransmisionSexual') or col.startswith('SexoCasual') or col.startswith('AlcoholRelacionesSexuales') or col.startswith('MariguanaRelacionesSexuales') or col.startswith('SustanciasRelacionesSexuales') or col.startswith('GHBGBLRelacionesSexuales') or col.startswith('SexoSinConsentimiento') or col.startswith('DrogasInyectadas'):
            list_eliminar.append(col)
    df.drop(columns=list_eliminar, inplace=True)
    return df

In [19]:
df = read_data()
df = normalize_df(df)
df = get_sexual_risk_practices(df)
df = deff_risk_practices(df)
df = clear_set(df)
df.to_csv('Result/DbSof.csv', index=False)