#An√°lisis de Personas Pol√≠ticamente Expuestas (PEP) - Uruguay

**Autor:** Federico Ramos  
**Fecha:** Diciembre 2025  
**Formaci√≥n:** Analista de Datos Jr. - Fundaci√≥n Telef√≥nica/UCU  
**Objetivo:** An√°lisis exploratorio para prevenci√≥n de lavado de activos seg√∫n Ley 19.574



# üì¶ PASO 1: SETUP Y CARGA DE DATOS


In [1]:
# Importar librer√≠as
import pandas as pd
import numpy as np

# Verificar que funcionan
print("‚úÖ Pandas versi√≥n:", pd.__version__)
print("‚úÖ Numpy versi√≥n:", np.__version__)
print("\n¬°Todo listo para empezar!")

‚úÖ Pandas versi√≥n: 2.2.2
‚úÖ Numpy versi√≥n: 2.0.2

¬°Todo listo para empezar!


In [2]:
# Configurar Pandas para mostrar n√∫meros sin notaci√≥n cient√≠fica
pd.options.display.float_format = '{:.2f}'.format

print("‚úÖ Pandas configurado para mostrar n√∫meros normales")

‚úÖ Pandas configurado para mostrar n√∫meros normales


## üìÇ 1.1 - Carga del Dataset


In [3]:
# Subir archivo (va a aparecer un bot√≥n para seleccionar)
from google.colab import files
uploaded = files.upload()

# Cargar el CSV
df = pd.read_csv('lista-actualizada-de-pep.csv')
print(f"Dataset cargado: {df.shape}")


Saving lista-actualizada-de-pep.csv to lista-actualizada-de-pep.csv
Dataset cargado: (857, 4)


# üîç PASO 2: EXPLORACI√ìN INICIAL

## 2.1 - Primeras Filas del Dataset


In [4]:
# Ver las primeras 5 filas
print("=" * 60)
print("PRIMERAS 5 FILAS DEL DATASET")
print("=" * 60)
df.head()


PRIMERAS 5 FILAS DEL DATASET


Unnamed: 0,CI,NOMBRE,CARGO,ORGANISMO
0,19995767,ABAL BARU FERNANDO MARTIN,ENCARGADO DE NEGOCIOS,MINISTERIO DE RELACIONES EXTERIORES (MRREE)
1,14472184,ABAL ORGUET ALICIA ELENA,DIRECTOR DE DIVISION,INSTITUTO DEL NI√ëO Y DEL ADOLESCENTE DEL URUGU...
2,38735055,ABAL RODRIGUEZ EVA MARIA,EDIL,JUNTA DEPARTAMENTAL DE MALDONADO
3,31168574,ABAL SABA√ëO VICTOR MANUEL,DIRECTOR DE CONVIVENCIA Y SEGURIDAD CIUDADANA,MINISTERIO DEL INTERIOR (MI)
4,13274529,ABDALA REMERCIARI MANUEL JUAN WASHINGTON,REPRESENTANTE PERMANENTE,MINISTERIO DE RELACIONES EXTERIORES (MRREE)


## üìã 2.2 - Informaci√≥n General


In [5]:
# Informaci√≥n del dataset
print("\n" + "=" * 60)
print("INFORMACI√ìN GENERAL")
print("=" * 60)
df.info()



INFORMACI√ìN GENERAL
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 857 entries, 0 to 856
Data columns (total 4 columns):
 #   Column     Non-Null Count  Dtype 
---  ------     --------------  ----- 
 0   CI         857 non-null    int64 
 1   NOMBRE     857 non-null    object
 2   CARGO      857 non-null    object
 3   ORGANISMO  857 non-null    object
dtypes: int64(1), object(3)
memory usage: 26.9+ KB


## üî¢ 2.3 - Valores √önicos


In [6]:
print("=" * 60)
print("VALORES √öNICOS POR COLUMNA")
print("=" * 60)

print(f"CI:        {df['CI'].nunique()} valores √∫nicos")
print(f"NOMBRE:    {df['NOMBRE'].nunique()} valores √∫nicos")
print(f"CARGO:     {df['CARGO'].nunique()} valores √∫nicos")
print(f"ORGANISMO: {df['ORGANISMO'].nunique()} valores √∫nicos")


VALORES √öNICOS POR COLUMNA
CI:        857 valores √∫nicos
NOMBRE:    856 valores √∫nicos
CARGO:     179 valores √∫nicos
ORGANISMO: 108 valores √∫nicos


## üìä 2.4 - Estad√≠sticas Descriptivas


In [7]:
# Estad√≠sticas descriptivas
print("\n" + "=" * 60)
print("ESTAD√çSTICAS DESCRIPTIVAS")
print("=" * 60)
df.describe()



ESTAD√çSTICAS DESCRIPTIVAS


Unnamed: 0,CI
count,857.0
mean,29850095.75
std,11198865.21
min,8861335.0
25%,18596013.0
50%,30975291.0
75%,38795746.0
max,56396655.0


# üßπ PASO 3: LIMPIEZA Y VERIFICACI√ìN

## üîç 3.1 - Verificaci√≥n de Duplicados


In [8]:
print("=" * 60)
print("VERIFICACI√ìN DE DUPLICADOS")
print("=" * 60)

# ¬øHay filas completamente duplicadas?
duplicados_totales = df.duplicated().sum()
print(f"\nFilas duplicadas (completas): {duplicados_totales}")

if duplicados_totales > 0:
    print("‚ö†Ô∏è  Hay duplicados que eliminar")
else:
    print("‚úÖ No hay filas duplicadas")


VERIFICACI√ìN DE DUPLICADOS

Filas duplicadas (completas): 0
‚úÖ No hay filas duplicadas


## üÜî 3.2 - Verificaci√≥n de CIs Duplicadas


In [9]:
# ¬øHay CIs repetidas? (esto ser√≠a raro, cada persona tiene 1 CI)
duplicados_ci = df['CI'].duplicated().sum()
print(f"\nCIs duplicadas: {duplicados_ci}")

if duplicados_ci > 0:
    print("‚ö†Ô∏è  Algunas personas aparecen m√°s de una vez")
    print("\nMostrando personas con CI duplicada:")
    print(df[df['CI'].duplicated(keep=False)].sort_values('CI'))
else:
    print("‚úÖ Cada CI aparece solo una vez")



CIs duplicadas: 0
‚úÖ Cada CI aparece solo una vez


## üë• 3.3 - Nombres Duplicados (Hom√≥nimos)


In [10]:
# ¬øQui√©nes tienen el mismo nombre?
duplicados_nombre = df['NOMBRE'].duplicated().sum()
print(f"\nNombres duplicados: {duplicados_nombre}")

if duplicados_nombre > 0:
    print("\nPersonas con el mismo nombre:")
    nombres_repetidos = df[df['NOMBRE'].duplicated(keep=False)].sort_values('NOMBRE')
    print(nombres_repetidos[['CI', 'NOMBRE', 'CARGO']])



Nombres duplicados: 1

Personas con el mismo nombre:
           CI                     NOMBRE                     CARGO
719  13994911  BOTTA LUQUIN DANIEL JULIO        CONSUL DE DISTRITO
720  12776996  BOTTA LUQUIN DANIEL JULIO  JEFE DE SECCION CONSULAR


## ‚úÖ 3.4 - Resumen de Calidad


In [11]:
print("\n" + "=" * 60)
print("RESUMEN DE CALIDAD DE DATOS")
print("=" * 60)

print(f"‚úÖ Total de registros: {len(df)}")
print(f"‚úÖ Valores nulos: {df.isnull().sum().sum()}")
print(f"‚úÖ Filas duplicadas: {df.duplicated().sum()}")
print(f"‚úÖ CIs duplicadas: {df['CI'].duplicated().sum()}")
print("\nüéØ Conclusi√≥n: El dataset est√° limpio y listo para analizar")



RESUMEN DE CALIDAD DE DATOS
‚úÖ Total de registros: 857
‚úÖ Valores nulos: 0
‚úÖ Filas duplicadas: 0
‚úÖ CIs duplicadas: 0

üéØ Conclusi√≥n: El dataset est√° limpio y listo para analizar


# üìä PASO 4: AN√ÅLISIS EXPLORATORIO

## üèõÔ∏è 4.1 - Top 10 Organismos con mas PePs


In [12]:
print("=" * 60)
print("TOP 10 ORGANISMOS CON M√ÅS PEPs")
print("=" * 60)

# Contar cu√°ntas personas hay por organismo
top_organismos = df['ORGANISMO'].value_counts().head(10)

# Mostrar con porcentajes
for i, (organismo, cantidad) in enumerate(top_organismos.items(), 1):
    porcentaje = (cantidad / len(df)) * 100
    print(f"{i:2}. {organismo[:45]:45} ‚Üí {cantidad:3} ({porcentaje:4.1f}%)")


TOP 10 ORGANISMOS CON M√ÅS PEPs
 1. PODER JUDICIAL                                ‚Üí  97 (11.3%)
 2. PODER LEGISLATIVO                             ‚Üí  66 ( 7.7%)
 3. FISCALIA GENERAL DE LA NACION                 ‚Üí  59 ( 6.9%)
 4. MINISTERIO DE RELACIONES EXTERIORES (MRREE)   ‚Üí  44 ( 5.1%)
 5. MINISTERIO DEL INTERIOR (MI)                  ‚Üí  35 ( 4.1%)
 6. JUNTA DEPARTAMENTAL DE CANELONES              ‚Üí  31 ( 3.6%)
 7. MINISTERIO DE ECONOMIA Y FINANZAS (MEF)       ‚Üí  31 ( 3.6%)
 8. INSTITUTO DEL NI√ëO Y DEL ADOLESCENTE DEL URUG ‚Üí  22 ( 2.6%)
 9. JUNTA DEPARTAMENTAL DE PAYSANDU               ‚Üí  20 ( 2.3%)
10. MINISTERIO DE SALUD PUBLICA (MSP)             ‚Üí  20 ( 2.3%)


## üèõÔ∏è 4.2 - Top 10 cargos mas comunes de PePs

In [13]:
print("\n" + "=" * 60)
print("TOP 10 CARGOS M√ÅS COMUNES")
print("=" * 60)

top_cargos = df['CARGO'].value_counts().head(10)

for i, (cargo, cantidad) in enumerate(top_cargos.items(), 1):
    porcentaje = (cantidad / len(df)) * 100
    print(f"{i:2}. {cargo:30} ‚Üí {cantidad:3} ({porcentaje:4.1f}%)")



TOP 10 CARGOS M√ÅS COMUNES
 1. EDIL                           ‚Üí 171 (20.0%)
 2. JUEZ LETRADO                   ‚Üí  65 ( 7.6%)
 3. DIRECTOR                       ‚Üí  42 ( 4.9%)
 4. REPRESENTANTE NACIONAL         ‚Üí  35 ( 4.1%)
 5. FISCAL LETRADA ADSCRIPTA       ‚Üí  27 ( 3.2%)
 6. GERENTE                        ‚Üí  25 ( 2.9%)
 7. JUEZ DE PAZ                    ‚Üí  20 ( 2.3%)
 8. GERENTE DE AREA                ‚Üí  19 ( 2.2%)
 9. DIRECTOR DE DIVISION           ‚Üí  18 ( 2.1%)
10. DIRECTOR GENERAL               ‚Üí  17 ( 2.0%)


## üéØ 4.3 - Categorizaci√≥n por Nivel de Riesgo (v1)


In [14]:
print("=" * 60)
print("CREANDO CATEGOR√çA: NIVEL DE RIESGO")
print("=" * 60)

# Funci√≥n para categorizar cargos
def categorizar_cargo(cargo):
    """
    Esta funci√≥n lee el nombre del cargo y devuelve el nivel de riesgo
    """
    cargo_mayuscula = cargo.upper()  # Convertir a may√∫sculas para buscar

    # Alto Riesgo - Poder Ejecutivo/Legislativo
    if any(palabra in cargo_mayuscula for palabra in
           ['MINISTRO', 'SUBSECRETARIO', 'PRESIDENTE', 'VICEPRESIDENTE',
            'INTENDENTE', 'EMBAJADOR', 'SENADOR', 'REPRESENTANTE NACIONAL']):
        return 'Alto - Ejecutivo/Legislativo'

    # Alto Riesgo - Poder Judicial
    elif any(palabra in cargo_mayuscula for palabra in
             ['JUEZ', 'FISCAL', 'MAGISTRADO']):
        return 'Alto - Poder Judicial'

    # Alto Riesgo - Direcci√≥n General
    elif any(palabra in cargo_mayuscula for palabra in
             ['DIRECTOR GENERAL', 'DIRECTOR NACIONAL', 'GERENTE GENERAL']):
        return 'Alto - Direcci√≥n General'

    # Medio Riesgo - Direcci√≥n/Gerencia
    elif any(palabra in cargo_mayuscula for palabra in
             ['DIRECTOR', 'GERENTE', 'SUBDIRECTOR', 'COORDINADOR']):
        return 'Medio - Direcci√≥n/Gerencia'

    # Medio Riesgo - Representaci√≥n Local
    elif any(palabra in cargo_mayuscula for palabra in
             ['EDIL', 'CONCEJAL', 'ALCALDE']):
        return 'Medio - Representaci√≥n Local'

    # Otros
    else:
        return 'Otros'

# Aplicar la funci√≥n a todas las filas
df['NIVEL_RIESGO'] = df['CARGO'].apply(categorizar_cargo)

print("‚úÖ Nueva columna 'NIVEL_RIESGO' creada\n")

# Ver cu√°ntas personas hay en cada nivel
print("Distribuci√≥n por Nivel de Riesgo:")
print("-" * 60)
niveles = df['NIVEL_RIESGO'].value_counts()

for nivel, cantidad in niveles.items():
    porcentaje = (cantidad / len(df)) * 100
    print(f"{nivel:35} ‚Üí {cantidad:3} ({porcentaje:5.1f}%)")


CREANDO CATEGOR√çA: NIVEL DE RIESGO
‚úÖ Nueva columna 'NIVEL_RIESGO' creada

Distribuci√≥n por Nivel de Riesgo:
------------------------------------------------------------
Medio - Direcci√≥n/Gerencia          ‚Üí 246 ( 28.7%)
Medio - Representaci√≥n Local        ‚Üí 186 ( 21.7%)
Alto - Poder Judicial               ‚Üí 144 ( 16.8%)
Otros                               ‚Üí 126 ( 14.7%)
Alto - Ejecutivo/Legislativo        ‚Üí 114 ( 13.3%)
Alto - Direcci√≥n General            ‚Üí  41 (  4.8%)


## ‚úîÔ∏è 4.4 - Verificaci√≥n de Categorizaci√≥n


In [15]:
print("=" * 60)
print("VERIFICACI√ìN: ¬øLa categorizaci√≥n funcion√≥ bien?")
print("=" * 60)

# Ver ejemplos de cada categor√≠a
print("\n1. Ejemplos de ALTO RIESGO - Ejecutivo/Legislativo:")
print(df[df['NIVEL_RIESGO'] == 'Alto - Ejecutivo/Legislativo'][['NOMBRE', 'CARGO']].head(3))

print("\n2. Ejemplos de ALTO RIESGO - Poder Judicial:")
print(df[df['NIVEL_RIESGO'] == 'Alto - Poder Judicial'][['NOMBRE', 'CARGO']].head(3))

print("\n3. Ejemplos de MEDIO RIESGO - Representaci√≥n Local:")
print(df[df['NIVEL_RIESGO'] == 'Medio - Representaci√≥n Local'][['NOMBRE', 'CARGO']].head(3))

print("\n4. Ejemplos de OTROS:")
print(df[df['NIVEL_RIESGO'] == 'Otros'][['NOMBRE', 'CARGO']].head(3))


VERIFICACI√ìN: ¬øLa categorizaci√≥n funcion√≥ bien?

1. Ejemplos de ALTO RIESGO - Ejecutivo/Legislativo:
                              NOMBRE           CARGO
5        ABDALA SCHWARZ PABLO DANIEL   SUBSECRETARIO
11   ABILLEIRA ALVAREZ DARIO AURELIO  VICEPRESIDENTE
14  ABRACINSKAS CEPLIKAS ROSA LILIAN        SENADORA

2. Ejemplos de ALTO RIESGO - Poder Judicial:
                             NOMBRE           CARGO
6        ABDALA SOSA MERCEDES MARIA  FISCAL LETRADO
10  ABERASTEGUI PALMINA ANA CLAUDIA    JUEZ LETRADO
15  ABRAHAM BANCHERO MARIA VICTORIA    JUEZ LETRADO

3. Ejemplos de MEDIO RIESGO - Representaci√≥n Local:
                               NOMBRE     CARGO
2            ABAL RODRIGUEZ EVA MARIA      EDIL
16  ABRAHAM LEONE GUSTAVO MAXIMILIANO      EDIL
26   ACERENZA SAN JUAN FRANCISCO JOSE  CONCEJAL

4. Ejemplos de OTROS:
                                      NOMBRE  \
0                  ABAL BARU FERNANDO MARTIN   
4   ABDALA REMERCIARI MANUEL JUAN WASHINGTON   
29              

## üè¢ 4.5 - Categorizaci√≥n por Tipo de Organismo

In [16]:
print("=" * 60)
print("CREANDO CATEGOR√çA: TIPO DE ORGANISMO")
print("=" * 60)

def categorizar_organismo(organismo):
    """
    Clasifica el organismo seg√∫n su naturaleza
    """
    org_mayuscula = organismo.upper()

    if 'MINISTERIO' in org_mayuscula:
        return 'Ministerios'

    elif 'PODER JUDICIAL' in org_mayuscula or 'FISCALIA' in org_mayuscula or 'TRIBUNAL' in org_mayuscula:
        return 'Poder Judicial'

    elif 'PODER LEGISLATIVO' in org_mayuscula or 'JUNTA DEPARTAMENTAL' in org_mayuscula:
        return 'Poder Legislativo'

    elif 'INTENDENCIA' in org_mayuscula:
        return 'Gobiernos Departamentales'

    elif 'BANCO' in org_mayuscula or 'BPS' in org_mayuscula or 'BSE' in org_mayuscula:
        return 'Instituciones Financieras'

    elif any(empresa in org_mayuscula for empresa in ['ANTEL', 'ANCAP', 'OSE', 'UTE', 'ANP']):
        return 'Empresas P√∫blicas'

    elif 'UNIVERSIDAD' in org_mayuscula or 'ANEP' in org_mayuscula:
        return 'Educaci√≥n'

    else:
        return 'Otros Organismos'

# Aplicar la funci√≥n
df['TIPO_ORGANISMO'] = df['ORGANISMO'].apply(categorizar_organismo)

print("‚úÖ Nueva columna 'TIPO_ORGANISMO' creada\n")

# Ver distribuci√≥n
print("Distribuci√≥n por Tipo de Organismo:")
print("-" * 60)
tipos = df['TIPO_ORGANISMO'].value_counts()

for tipo, cantidad in tipos.items():
    porcentaje = (cantidad / len(df)) * 100
    print(f"{tipo:30} ‚Üí {cantidad:3} ({porcentaje:5.1f}%)")


CREANDO CATEGOR√çA: TIPO DE ORGANISMO
‚úÖ Nueva columna 'TIPO_ORGANISMO' creada

Distribuci√≥n por Tipo de Organismo:
------------------------------------------------------------
Poder Legislativo              ‚Üí 244 ( 28.5%)
Ministerios                    ‚Üí 172 ( 20.1%)
Poder Judicial                 ‚Üí 158 ( 18.4%)
Otros Organismos               ‚Üí  98 ( 11.4%)
Gobiernos Departamentales      ‚Üí  87 ( 10.2%)
Instituciones Financieras      ‚Üí  52 (  6.1%)
Empresas P√∫blicas              ‚Üí  35 (  4.1%)
Educaci√≥n                      ‚Üí  11 (  1.3%)


## üîç 4.6 - Investigaci√≥n: Errores Detectados


In [17]:
print("=" * 60)
print("INVESTIGANDO: ¬øQu√© pas√≥ con Carolina Ache?")
print("=" * 60)

# Buscar por nombre
carolina = df[df['NOMBRE'].str.contains('ACHE', case=False)]
print(carolina[['NOMBRE', 'CARGO', 'NIVEL_RIESGO']])


INVESTIGANDO: ¬øQu√© pas√≥ con Carolina Ache?
                         NOMBRE                                   CARGO  \
29         ACHE BATLLE CAROLINA  SUBSECRETARIA DE RELACIONES EXTERIORES   
723  BOTTARO IRACHE CELIA MARIA                                    EDIL   

                     NIVEL_RIESGO  
29                          Otros  
723  Medio - Representaci√≥n Local  


## üìã 4.7 - Revisi√≥n de Casos "Otros"


In [18]:
print("\n" + "=" * 60)
print("TODOS LOS CARGOS CLASIFICADOS COMO 'OTROS'")
print("=" * 60)

otros = df[df['NIVEL_RIESGO'] == 'Otros'][['NOMBRE', 'CARGO', 'ORGANISMO']]
print(f"\nTotal de 'Otros': {len(otros)}\n")

# Mostrar los primeros 20 para revisar
print("Primeros 20 casos:")
print(otros.head(20).to_string())



TODOS LOS CARGOS CLASIFICADOS COMO 'OTROS'

Total de 'Otros': 126

Primeros 20 casos:
                                       NOMBRE                                   CARGO                                                                             ORGANISMO
0                   ABAL BARU FERNANDO MARTIN                   ENCARGADO DE NEGOCIOS                                           MINISTERIO DE RELACIONES EXTERIORES (MRREE)
4    ABDALA REMERCIARI MANUEL JUAN WASHINGTON                REPRESENTANTE PERMANENTE                                           MINISTERIO DE RELACIONES EXTERIORES (MRREE)
29                       ACHE BATLLE CAROLINA  SUBSECRETARIA DE RELACIONES EXTERIORES                                           MINISTERIO DE RELACIONES EXTERIORES (MRREE)
30                       ACHUGAR DIAZ MARIANA                               CONSEJERA                                                  UNIVERSIDAD DE LA REPUBLICA (UDELAR)
58                 AGRASAR VIGNOLO OMAR MARIO        

## üîß 4.8 - Categorizaci√≥n Mejorada (v2)

**Iteraci√≥n:** crear ‚Üí verificar ‚Üí mejorar

In [19]:
print("=" * 60)
print("MEJORANDO LA CATEGORIZACI√ìN")
print("=" * 60)

def categorizar_cargo_v2(cargo):
    """
    Versi√≥n mejorada con m√°s casos
    """
    cargo_mayuscula = cargo.upper()

    # Alto Riesgo - Poder Ejecutivo/Legislativo
    # IMPORTANTE: Agregamos versiones femeninas y m√°s cargos
    if any(palabra in cargo_mayuscula for palabra in
           ['MINISTRO', 'MINISTRA', 'SUBSECRETARIO', 'SUBSECRETARIA',
            'PRESIDENTE', 'PRESIDENTA', 'VICEPRESIDENTE', 'VICEPRESIDENTA',
            'INTENDENTE', 'INTENDENTA', 'EMBAJADOR', 'EMBAJADORA',
            'SENADOR', 'SENADORA', 'REPRESENTANTE NACIONAL',
            'REPRESENTANTE PERMANENTE', 'GENERAL', 'ALMIRANTE']):
        return 'Alto - Ejecutivo/Legislativo'

    # Alto Riesgo - Poder Judicial
    elif any(palabra in cargo_mayuscula for palabra in
             ['JUEZ', 'JUEZA', 'FISCAL', 'MAGISTRADO', 'MAGISTRADA']):
        return 'Alto - Poder Judicial'

    # Alto Riesgo - Direcci√≥n General
    elif any(palabra in cargo_mayuscula for palabra in
             ['DIRECTOR GENERAL', 'DIRECTORA GENERAL',
              'DIRECTOR NACIONAL', 'DIRECTORA NACIONAL',
              'GERENTE GENERAL']):
        return 'Alto - Direcci√≥n General'

    # Medio-Alto - Cargos diplom√°ticos y policiales
    elif any(palabra in cargo_mayuscula for palabra in
             ['CONSUL GENERAL', 'C√ìNSUL GENERAL',
              'JEFE DE POLICIA', 'SUBJEFE DE POLICIA',
              'ENCARGADO DE NEGOCIOS', 'COMISARIO GENERAL']):
        return 'Medio-Alto - Diplom√°tico/Policial'

    # Medio Riesgo - Direcci√≥n/Gerencia
    elif any(palabra in cargo_mayuscula for palabra in
             ['DIRECTOR', 'DIRECTORA', 'GERENTE',
              'SUBDIRECTOR', 'SUBDIRECTORA', 'COORDINADOR', 'COORDINADORA']):
        return 'Medio - Direcci√≥n/Gerencia'

    # Medio Riesgo - Representaci√≥n Local
    elif any(palabra in cargo_mayuscula for palabra in
             ['EDIL', 'CONCEJAL', 'ALCALDE', 'ALCALDESA']):
        return 'Medio - Representaci√≥n Local'

    # Otros
    else:
        return 'Otros'

# Aplicar la nueva funci√≥n
df['NIVEL_RIESGO'] = df['CARGO'].apply(categorizar_cargo_v2)

print("‚úÖ Categorizaci√≥n actualizada\n")

# Ver c√≥mo cambi√≥
print("Nueva distribuci√≥n:")
print("-" * 60)
niveles = df['NIVEL_RIESGO'].value_counts()

for nivel, cantidad in niveles.items():
    porcentaje = (cantidad / len(df)) * 100
    print(f"{nivel:35} ‚Üí {cantidad:3} ({porcentaje:5.1f}%)")

print("\n¬øCu√°ntos 'Otros' quedan ahora?")
print(f"‚Üí {len(df[df['NIVEL_RIESGO'] == 'Otros'])} personas")


MEJORANDO LA CATEGORIZACI√ìN
‚úÖ Categorizaci√≥n actualizada

Nueva distribuci√≥n:
------------------------------------------------------------
Medio - Direcci√≥n/Gerencia          ‚Üí 229 ( 26.7%)
Medio - Representaci√≥n Local        ‚Üí 186 ( 21.7%)
Alto - Ejecutivo/Legislativo        ‚Üí 181 ( 21.1%)
Alto - Poder Judicial               ‚Üí 143 ( 16.7%)
Otros                               ‚Üí  87 ( 10.2%)
Alto - Direcci√≥n General            ‚Üí  20 (  2.3%)
Medio-Alto - Diplom√°tico/Policial   ‚Üí  11 (  1.3%)

¬øCu√°ntos 'Otros' quedan ahora?
‚Üí 87 personas


## ‚úÖ 4.9 - Verificaci√≥n de Correcciones


In [20]:
# Verificar que Carolina Ache cambi√≥
print("\n" + "=" * 60)
print("VERIFICACI√ìN: ¬øSe corrigi√≥ Carolina Ache?")
print("=" * 60)

carolina = df[df['NOMBRE'].str.contains('ACHE', case=False)]
print(carolina[['NOMBRE', 'CARGO', 'NIVEL_RIESGO']])



VERIFICACI√ìN: ¬øSe corrigi√≥ Carolina Ache?
                         NOMBRE                                   CARGO  \
29         ACHE BATLLE CAROLINA  SUBSECRETARIA DE RELACIONES EXTERIORES   
723  BOTTARO IRACHE CELIA MARIA                                    EDIL   

                     NIVEL_RIESGO  
29   Alto - Ejecutivo/Legislativo  
723  Medio - Representaci√≥n Local  


## üìÖ 4.10 - Estimaci√≥n de Rango Etario


In [21]:
print("=" * 60)
print("CREANDO CATEGOR√çA: RANGO DE EDAD (ESTIMADO)")
print("=" * 60)

def estimar_edad(ci):
    """
    Estima rango de edad seg√∫n la CI uruguaya
    CIs m√°s bajas = personas mayores
    """
    if ci < 20000000:
        return 'Mayor 50 a√±os'
    elif ci < 40000000:
        return '35-50 a√±os'
    else:
        return 'Menor 35 a√±os'

# Aplicar la funci√≥n
df['RANGO_EDAD'] = df['CI'].apply(estimar_edad)

print("‚úÖ Nueva columna 'RANGO_EDAD' creada\n")

# Ver distribuci√≥n
print("Distribuci√≥n por Rango de Edad:")
print("-" * 60)
edades = df['RANGO_EDAD'].value_counts().sort_index()

for edad, cantidad in edades.items():
    porcentaje = (cantidad / len(df)) * 100
    print(f"{edad:15} ‚Üí {cantidad:3} ({porcentaje:5.1f}%)")


CREANDO CATEGOR√çA: RANGO DE EDAD (ESTIMADO)
‚úÖ Nueva columna 'RANGO_EDAD' creada

Distribuci√≥n por Rango de Edad:
------------------------------------------------------------
35-50 a√±os      ‚Üí 412 ( 48.1%)
Mayor 50 a√±os   ‚Üí 260 ( 30.3%)
Menor 35 a√±os   ‚Üí 185 ( 21.6%)


In [22]:
print("\n" + "=" * 60)
print("EJEMPLOS: CI vs EDAD ESTIMADA")
print("=" * 60)

# Mostrar algunos casos para ver si tiene sentido
ejemplos = df[['CI', 'NOMBRE', 'RANGO_EDAD']].sample(10).sort_values('CI')
print(ejemplos.to_string(index=False))



EJEMPLOS: CI vs EDAD ESTIMADA
      CI                               NOMBRE    RANGO_EDAD
10333685         ABREU BONILLA SERGIO ENRIQUE Mayor 50 a√±os
11839505            BARTOLOTTA DE LEON RAFAEL Mayor 50 a√±os
12776996            BOTTA LUQUIN DANIEL JULIO Mayor 50 a√±os
12893754 BARRERA MALRECHAUFFE GRACIELA HAYDEE Mayor 50 a√±os
13496884           BAYARDI LOZANO JOSE ARTURO Mayor 50 a√±os
30309824           BORBA SIERRA SILVIA SUSANA    35-50 a√±os
35206198               ARTOLA ROCHA JUAN LUIS    35-50 a√±os
37117979        BUONO CANEPA SABRINA CRISTINA    35-50 a√±os
38409460             BELLOMO PERAZA MARIA SOL    35-50 a√±os
39207265         ALMADA MALLADA PABLO ALBERTO    35-50 a√±os


---
# üî• PASO 5: AN√ÅLISIS CRUZADO

## üö® 5.1 - Alto Riesgo por Organismo


In [23]:
print("=" * 60)
print("AN√ÅLISIS CRUZADO 1: Alto Riesgo por Organismo")
print("=" * 60)

# Filtrar solo Alto Riesgo
alto_riesgo = df[df['NIVEL_RIESGO'].str.contains('Alto')]

# Top 10 organismos con m√°s PEPs de Alto Riesgo
top_alto = alto_riesgo['ORGANISMO'].value_counts().head(10)

print(f"\nTotal de PEPs de Alto Riesgo: {len(alto_riesgo)} ({len(alto_riesgo)/len(df)*100:.1f}%)\n")
print("Top 10 organismos con PEPs de Alto Riesgo:")
print("-" * 60)

for i, (org, cant) in enumerate(top_alto.items(), 1):
    porcentaje = (cant / len(alto_riesgo)) * 100
    print(f"{i:2}. {org[:50]:50} {cant:3} ({porcentaje:4.1f}%)")


AN√ÅLISIS CRUZADO 1: Alto Riesgo por Organismo

Total de PEPs de Alto Riesgo: 355 (41.4%)

Top 10 organismos con PEPs de Alto Riesgo:
------------------------------------------------------------
 1. PODER JUDICIAL                                      94 (26.5%)
 2. PODER LEGISLATIVO                                   63 (17.7%)
 3. FISCALIA GENERAL DE LA NACION                       56 (15.8%)
 4. MINISTERIO DE RELACIONES EXTERIORES (MRREE)         25 ( 7.0%)
 5. MINISTERIO DEL INTERIOR (MI)                        17 ( 4.8%)
 6. MINISTERIO DE ECONOMIA Y FINANZAS (MEF)              7 ( 2.0%)
 7. MINISTERIO DE SALUD PUBLICA (MSP)                    6 ( 1.7%)
 8. MINISTERIO DE DEFENSA NACIONAL (MDN)                 5 ( 1.4%)
 9. INTENDENCIA DE CANELONES                             4 ( 1.1%)
10. MINISTERIO DE DESARROLLO SOCIAL (MIDES)              4 ( 1.1%)


## üè¶ 5.2 - PEPs en Instituciones Financieras


In [24]:
print("\n" + "=" * 60)
print("AN√ÅLISIS CRUZADO 2: PEPs en Instituciones Financieras")
print("=" * 60)

# Filtrar instituciones financieras
fin = df[df['TIPO_ORGANISMO'] == 'Instituciones Financieras']

print(f"\nTotal de PEPs en instituciones financieras: {len(fin)}\n")

# ¬øQu√© nivel de riesgo tienen?
print("Distribuci√≥n por Nivel de Riesgo:")
print("-" * 60)
for nivel, cant in fin['NIVEL_RIESGO'].value_counts().items():
    porcentaje = (cant / len(fin)) * 100
    print(f"{nivel:35} ‚Üí {cant:2} ({porcentaje:5.1f}%)")

print("\n¬øEn qu√© instituciones est√°n?")
print("-" * 60)
for inst, cant in fin['ORGANISMO'].value_counts().items():
    print(f"  {inst}: {cant}")



AN√ÅLISIS CRUZADO 2: PEPs en Instituciones Financieras

Total de PEPs en instituciones financieras: 52

Distribuci√≥n por Nivel de Riesgo:
------------------------------------------------------------
Medio - Direcci√≥n/Gerencia          ‚Üí 46 ( 88.5%)
Alto - Ejecutivo/Legislativo        ‚Üí  4 (  7.7%)
Otros                               ‚Üí  2 (  3.8%)

¬øEn qu√© instituciones est√°n?
------------------------------------------------------------
  BANCO DE PREVISION SOCIAL (BPS): 19
  BANCO DE SEGUROS DEL ESTADO (BSE): 15
  BANCO DE LA REPUBLICA ORIENTAL DEL URUGUAY (BROU): 11
  BANCO CENTRAL DEL URUGUAY (BCU): 5
  BANCO HIPOTECARIO DEL URUGUAY (BHU): 2


In [25]:
print("\n" + "=" * 60)
print("AN√ÅLISIS CRUZADO 3: Edad de PEPs de Alto Riesgo")
print("=" * 60)

# Filtrar Alto Riesgo
alto_riesgo = df[df['NIVEL_RIESGO'].str.contains('Alto')]

print("Distribuci√≥n etaria de PEPs de Alto Riesgo:")
print("-" * 60)

for edad, cant in alto_riesgo['RANGO_EDAD'].value_counts().sort_index().items():
    porcentaje = (cant / len(alto_riesgo)) * 100
    print(f"{edad:15} ‚Üí {cant:3} ({porcentaje:5.1f}%)")



AN√ÅLISIS CRUZADO 3: Edad de PEPs de Alto Riesgo
Distribuci√≥n etaria de PEPs de Alto Riesgo:
------------------------------------------------------------
35-50 a√±os      ‚Üí 168 ( 47.3%)
Mayor 50 a√±os   ‚Üí 111 ( 31.3%)
Menor 35 a√±os   ‚Üí  76 ( 21.4%)


In [26]:
print("\n" + "=" * 60)
print("TABLA RESUMEN EJECUTIVO")
print("=" * 60)

# Crear tabla cruzada: Tipo de Organismo vs Nivel de Riesgo
tabla_resumen = pd.crosstab(
    df['TIPO_ORGANISMO'],
    df['NIVEL_RIESGO'],
    margins=True,  # Agregar totales
    margins_name='TOTAL'
)

print("\nCantidad de PEPs por Tipo de Organismo y Nivel de Riesgo:")
print(tabla_resumen)

# Guardarlo en CSV para usar despu√©s
tabla_resumen.to_csv('tabla_cruzada_pep.csv')
print("\n‚úÖ Tabla guardada en: tabla_cruzada_pep.csv")



TABLA RESUMEN EJECUTIVO

Cantidad de PEPs por Tipo de Organismo y Nivel de Riesgo:
NIVEL_RIESGO               Alto - Direcci√≥n General  \
TIPO_ORGANISMO                                        
Educaci√≥n                                         0   
Empresas P√∫blicas                                 0   
Gobiernos Departamentales                         0   
Instituciones Financieras                         0   
Ministerios                                      19   
Otros Organismos                                  0   
Poder Judicial                                    1   
Poder Legislativo                                 0   
TOTAL                                            20   

NIVEL_RIESGO               Alto - Ejecutivo/Legislativo  \
TIPO_ORGANISMO                                            
Educaci√≥n                                             1   
Empresas P√∫blicas                                     6   
Gobiernos Departamentales                            25   
Institucio

## üö® 5.3 - CASOS CR√çTICOS DE: Alto Riesgo en Finanzas

**M√°xima prioridad para Compliance**


In [27]:
print("=" * 60)
print("üö® AN√ÅLISIS CR√çTICO: Alto Riesgo en Finanzas")
print("=" * 60)

# Filtrar: Alto Riesgo + Instituciones Financieras
criticos = df[
    (df['NIVEL_RIESGO'].str.contains('Alto')) &
    (df['TIPO_ORGANISMO'] == 'Instituciones Financieras')
]

print(f"\n‚ö†Ô∏è  TOTAL DE CASOS CR√çTICOS: {len(criticos)}\n")
print("Estos son PEPs de Alto Riesgo que trabajan EN instituciones financieras.")
print("Requieren M√ÅXIMA diligencia seg√∫n Ley 19.574\n")
print("=" * 60)

if len(criticos) > 0:
    # Mostrar todos los casos
    print("\nLISTA COMPLETA DE CASOS CR√çTICOS:")
    print("-" * 60)

    for idx, row in criticos.iterrows():
        print(f"\nüë§ {row['NOMBRE']}")
        print(f"   üìã Cargo: {row['CARGO']}")
        print(f"   üèõÔ∏è  Organismo: {row['ORGANISMO']}")
        print(f"   ‚ö†Ô∏è  Nivel de Riesgo: {row['NIVEL_RIESGO']}")
        print(f"   üìÖ Rango Edad: {row['RANGO_EDAD']}")
        print(f"   üÜî CI: {row['CI']}")

    print("\n" + "=" * 60)
    print("üí° RECOMENDACI√ìN:")
    print("   ‚Ä¢ Monitoreo reforzado de transacciones")
    print("   ‚Ä¢ Actualizaci√≥n trimestral de perfil")
    print("   ‚Ä¢ Verificaci√≥n de conflictos de inter√©s")
    print("   ‚Ä¢ Seguimiento de patrimonio declarado")

    # Guardar lista en CSV
    criticos[['CI', 'NOMBRE', 'CARGO', 'ORGANISMO', 'NIVEL_RIESGO']].to_csv(
        'pep_alto_riesgo_finanzas.csv',
        index=False
    )
    print("\n‚úÖ Lista exportada: pep_alto_riesgo_finanzas.csv")

else:
    print("No se encontraron PEPs de Alto Riesgo en instituciones financieras.")


üö® AN√ÅLISIS CR√çTICO: Alto Riesgo en Finanzas

‚ö†Ô∏è  TOTAL DE CASOS CR√çTICOS: 4

Estos son PEPs de Alto Riesgo que trabajan EN instituciones financieras.
Requieren M√ÅXIMA diligencia seg√∫n Ley 19.574


LISTA COMPLETA DE CASOS CR√çTICOS:
------------------------------------------------------------

üë§ AMORIN BATLLE JOSE GERARDO
   üìã Cargo: PRESIDENTE
   üèõÔ∏è  Organismo: BANCO DE SEGUROS DEL ESTADO (BSE)
   ‚ö†Ô∏è  Nivel de Riesgo: Alto - Ejecutivo/Legislativo
   üìÖ Rango Edad: Mayor 50 a√±os
   üÜî CI: 11676993

üë§ BATALLA GARCIA DA ROSA ALFONSINA
   üìã Cargo: VICEPRESIDENTE
   üèõÔ∏è  Organismo: BANCO DE SEGUROS DEL ESTADO (BSE)
   ‚ö†Ô∏è  Nivel de Riesgo: Alto - Ejecutivo/Legislativo
   üìÖ Rango Edad: Menor 35 a√±os
   üÜî CI: 42453065

üë§ BORRELLI MARCHI ROBERTO
   üìã Cargo: SECRETARIO GENERAL
   üèõÔ∏è  Organismo: BANCO DE LA REPUBLICA ORIENTAL DEL URUGUAY (BROU)
   ‚ö†Ô∏è  Nivel de Riesgo: Alto - Ejecutivo/Legislativo
   üìÖ Rango Edad: Mayor 50 a√±o

## üìà 5.4 - An√°lisis Detallado: Sector Financiero
## üìã 5.5 - Registro: Medio Riesgo en Finanzas



In [28]:
print("=" * 80)
print("üìä REGISTRO: OTROS PEPs EN INSTITUCIONES FINANCIERAS")
print("=" * 80)

fin_todas = df[df['TIPO_ORGANISMO'] == 'Instituciones Financieras']
# Define fin_resto: personas en instituciones financieras que NO son de 'Alto' riesgo
fin_resto = fin_todas[~fin_todas['NIVEL_RIESGO'].str.contains('Alto')]

# Niveles que quedan (sin los "Alto")
niveles_orden = [
    'Medio-Alto - Diplom√°tico/Policial',
    'Medio - Direcci√≥n/Gerencia',
    'Medio - Representaci√≥n Local',
    'Otros'
]

contador_general = 1

for nivel in niveles_orden:
    personas_nivel = fin_resto[fin_resto['NIVEL_RIESGO'] == nivel]

    if len(personas_nivel) == 0:
        continue

    print("\n" + "‚ñà" * 80)
    print(f"‚ïë NIVEL DE RIESGO: {nivel}")
    print(f"‚ïë Total: {len(personas_nivel)} persona(s)")
    print("‚ñà" * 80)

    # Ordenar por organismo y nombre
    personas_ordenado = personas_nivel.sort_values(['ORGANISMO', 'NOMBRE'])

    organismo_actual = None

    for idx, row in personas_ordenado.iterrows():
        # Mostrar organismo cuando cambia
        if row['ORGANISMO'] != organismo_actual:
            organismo_actual = row['ORGANISMO']
            print(f"\n‚îå‚îÄ {organismo_actual}")
            print("‚îÇ")

        # Datos de la persona
        print(f"‚îÇ  {contador_general:2}. üë§ {row['NOMBRE']}")
        print(f"‚îÇ      üìã Cargo: {row['CARGO']}")
        print(f"‚îÇ      üÜî CI: {row['CI']}")
        print(f"‚îÇ      üìÖ Edad: {row['RANGO_EDAD']}")
        print("‚îÇ")

        contador_general += 1

print("\n" + "=" * 80)
print(f"‚úÖ TOTAL (excluyendo Alto Riesgo): {len(fin_resto)} PEPs")
print("=" * 80)

# Exportar solo los 48
columnas = ['CI', 'NOMBRE', 'CARGO', 'ORGANISMO', 'NIVEL_RIESGO', 'RANGO_EDAD']
export = fin_resto[columnas].copy()
export = export.sort_values(['NIVEL_RIESGO', 'ORGANISMO', 'NOMBRE'])
export.to_csv('REGISTRO_48_PEPs_MEDIO_RIESGO_FINANZAS.csv', index=False)

print("\n‚úÖ Archivo: REGISTRO_48_PEPs_MEDIO_RIESGO_FINANZAS.csv")
print("   (Los 48 restantes, sin los 4 cr√≠ticos)")

üìä REGISTRO: OTROS PEPs EN INSTITUCIONES FINANCIERAS

‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà
‚ïë NIVEL DE RIESGO: Medio - Direcci√≥n/Gerencia
‚ïë Total: 46 persona(s)
‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà

‚îå‚îÄ BANCO CENTRAL DEL URUGUAY (BCU)
‚îÇ
‚îÇ   1. üë§ AHARONIAN FRANZINI CRISTINA
‚îÇ      üìã Cargo: GERENTE DE AREA
‚îÇ      üÜî CI: 15263831
‚îÇ      üìÖ Edad: Mayor 50 a√±os
‚îÇ
‚îÇ   2. üë§ ALLO ARRIETA ALFREDO MIGUEL
‚îÇ      üìã Cargo: GERENTE
‚îÇ      üÜî CI: 17935789
‚îÇ      üìÖ Edad: Mayor 50 a√±os
‚îÇ
‚îÇ   3. üë§ ARTECONA GULLA DANIEL EDUARDO
‚îÇ      üìã Carg

---
# üìÑ PASO 6: COMUNICACI√ìN Y EXPORTACI√ìN

## üìù 6.1 - Reporte Ejecutivo Final


In [29]:
print("=" * 70)
print(" " * 15 + "REPORTE EJECUTIVO FINAL")
print("=" * 70)

# Calcular estad√≠sticas clave
alto_total = len(df[df['NIVEL_RIESGO'].str.contains('Alto')])
medio_total = len(df[df['NIVEL_RIESGO'].str.contains('Medio')])
fin_todas = df[df['TIPO_ORGANISMO'] == 'Instituciones Financieras']
criticos = df[(df['NIVEL_RIESGO'].str.contains('Alto')) &
              (df['TIPO_ORGANISMO'] == 'Instituciones Financieras')]
fin_resto = fin_todas[~fin_todas['NIVEL_RIESGO'].str.contains('Alto')]

resumen = f"""
‚ïî‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïó
‚ïë        AN√ÅLISIS DE PERSONAS POL√çTICAMENTE EXPUESTAS (PEP)           ‚ïë
‚ïë                    URUGUAY - DICIEMBRE 2025                          ‚ïë
‚ïë                 Prevenci√≥n de Lavado de Activos                      ‚ïë
‚ïö‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïù

üìä DATOS GENERALES
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
‚Ä¢ Total de PEPs registrados: {len(df):,}
‚Ä¢ Organismos distintos: {df['ORGANISMO'].nunique()}
‚Ä¢ Cargos distintos: {df['CARGO'].nunique()}
‚Ä¢ Fuente: SENACLAFT - Cat√°logo de Datos Abiertos
‚Ä¢ Marco legal: Ley N¬∞ 19.574 (Prevenci√≥n de Lavado de Activos)

üéØ DISTRIBUCI√ìN POR NIVEL DE RIESGO
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
"""

# Mostrar niveles ordenados
niveles_ordenados = [
    'Alto - Ejecutivo/Legislativo',
    'Alto - Poder Judicial',
    'Alto - Direcci√≥n General',
    'Medio-Alto - Diplom√°tico/Policial',
    'Medio - Direcci√≥n/Gerencia',
    'Medio - Representaci√≥n Local',
    'Otros'
]

for nivel in niveles_ordenados:
    cant = len(df[df['NIVEL_RIESGO'] == nivel])
    if cant > 0:
        pct = (cant/len(df)*100)
        resumen += f"‚Ä¢ {nivel:40} {cant:3} ({pct:5.1f}%)\n"

resumen += f"\n  ‚Üí TOTAL ALTO RIESGO: {alto_total} ({alto_total/len(df)*100:.1f}%)\n"
resumen += f"  ‚Üí TOTAL MEDIO RIESGO: {medio_total} ({medio_total/len(df)*100:.1f}%)\n"

resumen += f"""
üèõÔ∏è  DISTRIBUCI√ìN POR TIPO DE ORGANISMO
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
"""

for tipo, cant in df['TIPO_ORGANISMO'].value_counts().items():
    pct = (cant/len(df)*100)
    resumen += f"‚Ä¢ {tipo:30} {cant:3} ({pct:5.1f}%)\n"

resumen += f"""
üë• PERFIL ETARIO (Estimado por CI)
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
"""

for edad in ['Menor 35 a√±os', '35-50 a√±os', 'Mayor 50 a√±os']:
    cant = len(df[df['RANGO_EDAD'] == edad])
    pct = (cant/len(df)*100)
    resumen += f"‚Ä¢ {edad:20} {cant:3} ({pct:5.1f}%)\n"

resumen += f"""
üö® CASOS CR√çTICOS: Alto Riesgo en Instituciones Financieras
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
‚Ä¢ Total identificados: {len(criticos)}
‚Ä¢ Requieren debida diligencia REFORZADA seg√∫n Art. 8 Ley 19.574

Distribuci√≥n por instituci√≥n:
"""

for org in sorted(criticos['ORGANISMO'].unique()):
    cant = len(criticos[criticos['ORGANISMO'] == org])
    # Mostrar cargos espec√≠ficos
    cargos = criticos[criticos['ORGANISMO'] == org]['CARGO'].tolist()
    org_corto = org.replace('BANCO DE LA REPUBLICA ORIENTAL DEL URUGUAY', 'BROU').replace('BANCO DE SEGUROS DEL ESTADO', 'BSE').replace('BANCO HIPOTECARIO DEL URUGUAY', 'BHU')
    resumen += f"  ‚Ä¢ {org_corto}: {cant} PEP(s)\n"
    for cargo in cargos:
        resumen += f"      - {cargo}\n"

resumen += f"""
üìä CONTEXTO: Instituciones Financieras (Todos los niveles)
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
‚Ä¢ Total de PEPs en sector financiero: {len(fin_todas)} ({len(fin_todas)/len(df)*100:.1f}% del total)
‚Ä¢ Alto Riesgo: {len(criticos)} ({len(criticos)/len(fin_todas)*100:.1f}% del sector)
‚Ä¢ Medio Riesgo: {len(fin_resto)} ({len(fin_resto)/len(fin_todas)*100:.1f}% del sector)

Distribuci√≥n por instituci√≥n:
  ‚Ä¢ BPS (Previsi√≥n Social): {len(fin_todas[fin_todas['ORGANISMO'].str.contains('BPS')])} PEPs
  ‚Ä¢ BSE (Seguros): {len(fin_todas[fin_todas['ORGANISMO'].str.contains('BSE')])} PEPs
  ‚Ä¢ BROU (Banca Comercial): {len(fin_todas[fin_todas['ORGANISMO'].str.contains('BROU')])} PEPs
  ‚Ä¢ BCU (Banca Central): {len(fin_todas[fin_todas['ORGANISMO'].str.contains('BCU')])} PEPs
  ‚Ä¢ BHU (Hipotecario): {len(fin_todas[fin_todas['ORGANISMO'].str.contains('BHU')])} PEPs

üìã RECOMENDACIONES PARA SUJETOS OBLIGADOS
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
1. PRIORIZACI√ìN DE RECURSOS
   ‚Ä¢ Foco inmediato: {len(criticos)} casos cr√≠ticos (Alto Riesgo en finanzas)
   ‚Ä¢ Monitoreo reforzado: {alto_total} PEPs de Alto Riesgo total
   ‚Ä¢ Seguimiento est√°ndar: {medio_total} PEPs de Medio Riesgo

2. MONITOREO CONTINUO
   ‚Ä¢ Actualizaci√≥n trimestral desde fuente oficial (catalogodatos.gub.uy)
   ‚Ä¢ Verificaci√≥n autom√°tica por CI en proceso de onboarding
   ‚Ä¢ Cross-check con familiares directos (c√≥nyuge, hijos, padres)
   ‚Ä¢ Alertas por cambios de cargo o instituci√≥n

3. DEBIDA DILIGENCIA REFORZADA (Art. 8 Ley 19.574)
   Para PEPs de Alto Riesgo:
   ‚Ä¢ Aprobaci√≥n de alta direcci√≥n para iniciar relaci√≥n comercial
   ‚Ä¢ Identificaci√≥n del origen de fondos y patrimonio
   ‚Ä¢ Monitoreo continuo de transacciones
   ‚Ä¢ Revisi√≥n anual del perfil de riesgo

   Especial atenci√≥n a:
   ‚Ä¢ {len(df[df['NIVEL_RIESGO'] == 'Alto - Poder Judicial'])} PEPs en Poder Judicial
   ‚Ä¢ {len(df[df['NIVEL_RIESGO'] == 'Alto - Ejecutivo/Legislativo'])} PEPs Ejecutivo/Legislativo
   ‚Ä¢ {len(criticos)} PEPs de Alto Riesgo DENTRO de instituciones financieras

4. GESTI√ìN DOCUMENTAL
   ‚Ä¢ Mantener expediente actualizado de cada PEP
   ‚Ä¢ Justificar por escrito decisiones sobre relaciones de alto riesgo
   ‚Ä¢ Registrar transacciones inusuales en sistema de alertas
   ‚Ä¢ Reporte mensual a Oficial de Cumplimiento
   ‚Ä¢ Archivo de evidencia para inspecciones SENACLAFT

5. CAPACITACI√ìN DEL PERSONAL
   ‚Ä¢ Entrenamiento anual en identificaci√≥n de PEPs
   ‚Ä¢ Actualizaci√≥n sobre cambios en lista oficial
   ‚Ä¢ Casos pr√°cticos de se√±ales de alerta
   ‚Ä¢ Procedimientos de escalamiento

‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
üìÅ ARCHIVOS GENERADOS:
   ‚Ä¢ Dataset completo enriquecido con categor√≠as de an√°lisis
   ‚Ä¢ Lista de {len(criticos)} casos cr√≠ticos para seguimiento inmediato
   ‚Ä¢ Registro de {len(fin_resto)} PEPs de medio riesgo en finanzas
   ‚Ä¢ Tablas resumen para integraci√≥n con sistemas KYC/AML

üí° VALOR DEL AN√ÅLISIS:
   Este estudio permite a las instituciones financieras cumplir eficientemente
   con la normativa de prevenci√≥n de lavado de activos, priorizando recursos
   en los casos de mayor exposici√≥n y automatizando la verificaci√≥n de PEPs.

‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
Analista: Federico Ramos
Formaci√≥n: Analista de Datos Jr. - Fundaci√≥n Telef√≥nica/UCU (300hs)
Fecha: {pd.Timestamp.now().strftime('%d de %B de %Y')}
Herramientas: Python 3.x, Pandas, Google Colab
Fuente datos: SENACLAFT - https://catalogodatos.gub.uy/
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
"""

print(resumen)

# Guardar en archivo de texto
with open('REPORTE_EJECUTIVO_PEP.txt', 'w', encoding='utf-8')  as f:
    f.write(resumen)

print("\n‚úÖ Reporte guardado: REPORTE_EJECUTIVO_PEP.txt")
print("   Este archivo puede imprimirse o enviarse por email a stakeholders")


               REPORTE EJECUTIVO FINAL

‚ïî‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïó
‚ïë        AN√ÅLISIS DE PERSONAS POL√çTICAMENTE EXPUESTAS (PEP)           ‚ïë
‚ïë                    URUGUAY - DICIEMBRE 2025                          ‚ïë
‚ïë                 Prevenci√≥n de Lavado de Activos                      ‚ïë
‚ïö‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïê‚ïù

üìä DATOS GENERALES
‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ
‚Ä¢ Total de PEPs registrados: 857
‚Ä¢ Organismos distintos:

---
# ‚úÖ PROYECTO COMPLETADO

üìä **857 PEPs analizados y categorizados**  
üö® **4 casos cr√≠ticos identificados**  
üì¶ **Archivos exportados para uso operativo**

*Federico Ramos - Diciembre 2025*

In [30]:
import os

print("=" * 60)
print("üì¶ ARCHIVOS GENERADOS EN ESTE PROYECTO")
print("=" * 60)

archivos_csv = [f for f in os.listdir() if f.endswith('.csv')]
archivos_txt = [f for f in os.listdir() if f.endswith('.txt')]

print("\nüìÑ Archivos CSV:")
for archivo in sorted(archivos_csv):
    size = os.path.getsize(archivo) / 1024
    print(f"  ‚Ä¢ {archivo} ({size:.1f} KB)")

print("\nüìù Archivos TXT:")
for archivo in sorted(archivos_txt):
    size = os.path.getsize(archivo) / 1024
    print(f"  ‚Ä¢ {archivo} ({size:.1f} KB)")

print("\n‚úÖ Proyecto completado exitosamente")


üì¶ ARCHIVOS GENERADOS EN ESTE PROYECTO

üìÑ Archivos CSV:
  ‚Ä¢ REGISTRO_48_PEPs_MEDIO_RIESGO_FINANZAS.csv (6.1 KB)
  ‚Ä¢ lista-actualizada-de-pep.csv (71.2 KB)
  ‚Ä¢ pep_alto_riesgo_finanzas.csv (0.5 KB)
  ‚Ä¢ tabla_cruzada_pep.csv (0.5 KB)

üìù Archivos TXT:
  ‚Ä¢ REPORTE_EJECUTIVO_PEP.txt (7.0 KB)

‚úÖ Proyecto completado exitosamente
