# Extracción de Menciones de Artículos

Este notebook extrae menciones de artículos en documentos legales:
- Artículos individuales (artículo 50)
- Múltiples artículos con conectores (artículos 50 y 325)
- Rangos de artículos (artículos del 10 al 15)
- Referencias relativas (artículo anterior, siguiente, precedente, etc.)

Estas menciones se utilizarán para mapear relaciones entre artículos y documentos legales.


In [1]:
# Importar librerías
import pandas as pd
import sys

# Importar funciones de extracción
sys.path.append('../functions')
from article_mention_functions import extract_article_mentions


## 1. Cargar datos procesados

In [2]:
# Cargar el archivo generado en el paso anterior (hash_creation.ipynb)
df = pd.read_csv('../../data/03_extracted/legal_documents_with_ids.csv')

print(f"Total de artículos cargados: {len(df)}")
print(f"\nColumnas disponibles: {list(df.columns)}")
df.head()


Total de artículos cargados: 30351

Columnas disponibles: ['art_id', 'doc_id', 'Archivo', 'document_name', 'article_name', 'art_num', 'text']


Unnamed: 0,art_id,doc_id,Archivo,document_name,article_name,art_num,text
0,6D0C4493_1,6D0C4493,RGTO_DE_LA_LEY_DE_CENTROS_PENITENCIARIOS_DE_LA...,Reglamento de la Ley de Centros Penitenciarios...,Artículo 1,1,Las disposiciones contenidas en este Reglament...
1,6D0C4493_2,6D0C4493,RGTO_DE_LA_LEY_DE_CENTROS_PENITENCIARIOS_DE_LA...,Reglamento de la Ley de Centros Penitenciarios...,Artículo 2,2,La aplicación del presente Reglamento correspo...
2,6D0C4493_3,6D0C4493,RGTO_DE_LA_LEY_DE_CENTROS_PENITENCIARIOS_DE_LA...,Reglamento de la Ley de Centros Penitenciarios...,Artículo 3,3,"Para los efectos del presente Reglamento, adem..."
3,6D0C4493_4,6D0C4493,RGTO_DE_LA_LEY_DE_CENTROS_PENITENCIARIOS_DE_LA...,Reglamento de la Ley de Centros Penitenciarios...,Artículo 4,4,Sin perjuicio de los principios que prevén los...
4,6D0C4493_5,6D0C4493,RGTO_DE_LA_LEY_DE_CENTROS_PENITENCIARIOS_DE_LA...,Reglamento de la Ley de Centros Penitenciarios...,Artículo 5,5,El tratamiento para la persona privada de su l...


## 2. Ejecutar extracción de menciones de artículos

In [3]:
# Ejecutar extracción de menciones de artículos
article_mentions_df = extract_article_mentions(df)

print(f"\nRESUMEN FINAL: Se encontraron {len(article_mentions_df)} menciones de artículos")


Iniciando extracción de MENCIONES DE ARTÍCULOS a las 00:23:59
Progreso: 100/30351 (0.3%) | Menciones encontradas: 11 | Tiempo: 0.0s
Progreso: 200/30351 (0.7%) | Menciones encontradas: 27 | Tiempo: 0.0s
Progreso: 300/30351 (1.0%) | Menciones encontradas: 35 | Tiempo: 0.0s
Progreso: 400/30351 (1.3%) | Menciones encontradas: 55 | Tiempo: 0.1s
Progreso: 500/30351 (1.6%) | Menciones encontradas: 78 | Tiempo: 0.1s
Progreso: 600/30351 (2.0%) | Menciones encontradas: 97 | Tiempo: 0.1s
Progreso: 700/30351 (2.3%) | Menciones encontradas: 199 | Tiempo: 0.3s
Progreso: 800/30351 (2.6%) | Menciones encontradas: 226 | Tiempo: 0.3s
Progreso: 900/30351 (3.0%) | Menciones encontradas: 237 | Tiempo: 0.4s
Progreso: 1000/30351 (3.3%) | Menciones encontradas: 273 | Tiempo: 0.4s
Progreso: 1100/30351 (3.6%) | Menciones encontradas: 315 | Tiempo: 0.4s
Progreso: 1200/30351 (4.0%) | Menciones encontradas: 358 | Tiempo: 0.4s
Progreso: 1300/30351 (4.3%) | Menciones encontradas: 375 | Tiempo: 0.4s
Progreso: 1400/30

## 3. Mostrar estadísticas y ejemplos

In [4]:
# Mostrar distribución por tipo de mención
print(f"\nPattern Group: {article_mentions_df['pattern_group'].unique()[0]}")

print("\nDistribución por entity_label (tipo de mención):")
print(article_mentions_df['entity_label'].value_counts())

print("\n" + "="*70)
print("EJEMPLOS DE CADA TIPO DE MENCIÓN")
print("="*70)

for label in article_mentions_df['entity_label'].unique():
    print(f"\n{label}:")
    examples = article_mentions_df[article_mentions_df['entity_label'] == label]['entity_text'].unique()[:5]
    for i, example in enumerate(examples, 1):
        print(f"  {i}. {example}")

print("\nPrimeras filas del resultado:")
article_mentions_df.head()



Pattern Group: ARTICLE_MENTIONS

Distribución por entity_label (tipo de mención):
entity_label
ARTICLE_MULTI       7348
ARTICLE_RELATIVE    1033
ARTICLE_SINGLE       288
ARTICLE_RANGE         18
Name: count, dtype: int64

EJEMPLOS DE CADA TIPO DE MENCIÓN

ARTICLE_MULTI:
  1. artículos 21
  2. artículo 4 d
  3. artículo 18
  4. artículo 22 d
  5. artículo 19 d

ARTICLE_RELATIVE:
  1. artículo anterior
  2. los artículos anteriores
  3. los artículos precedentes
  4. artículo siguiente
  5. artículo precedente

ARTICLE_SINGLE:
  1. artículos 42
  2. artículos 76
  3. ARTÍCULOS 1
  4. ARTÍCULOS 466
  5. ARTÍCULOS 472

ARTICLE_RANGE:
  1. artículos 15 al 17 d
  2. artículos 73 al 143 d
  3. Artículos 17 al 20 d
  4. artículos 213 al 216
  5. Artículos 219 al 233 d

Primeras filas del resultado:


Unnamed: 0,doc_id,art_id,document_name,article_name,entity_text,entity_label,pattern_group,before_context,after_context,full_context,words_before_count,words_after_count
0,6D0C4493,6D0C4493_4,Reglamento de la Ley de Centros Penitenciarios...,Artículo 4,artículos 21,ARTICLE_MULTI,ARTICLE_MENTIONS,Sin perjuicio de los principios que prevén los,", párrafo noveno de la Constitución Federal , ...",Sin perjuicio de los principios que prevén los...,8,30
1,6D0C4493,6D0C4493_4,Reglamento de la Ley de Centros Penitenciarios...,Artículo 4,artículo 4 d,ARTICLE_MULTI,ARTICLE_MENTIONS,la Constitución local la actuación del persona...,"la Ley Nacional , los cuales son : Dignidad ; ...",la Constitución local la actuación del persona...,30,29
2,6D0C4493,6D0C4493_5,Reglamento de la Ley de Centros Penitenciarios...,Artículo 5,artículo 18,ARTICLE_MULTI,ARTICLE_MENTIONS,El tratamiento para la persona privada de su l...,", fracción II , de la Ley de Centros Penitenci...",El tratamiento para la persona privada de su l...,14,30
3,6D0C4493,6D0C4493_7,Reglamento de la Ley de Centros Penitenciarios...,Artículo 7,artículo 22 d,ARTICLE_MULTI,ARTICLE_MENTIONS,"implique el uso de la violencia , discriminaci...","la Constitución Federal , o que menoscabe los ...","implique el uso de la violencia , discriminaci...",30,30
4,6D0C4493,6D0C4493_30,Reglamento de la Ley de Centros Penitenciarios...,Artículo 30,artículo 19 d,ARTICLE_MULTI,ARTICLE_MENTIONS,el que por determinación del Juez de Control s...,"la Constitución Federal , o en su caso , dentr...",el que por determinación del Juez de Control s...,30,30


## 4. Guardar resultados


In [5]:
# Reorganizar columnas (estandarizadas para todos los extractores)
columns_order = [
    'doc_id', 
    'art_id', 
    'entity_text', 
    'entity_label', 
    'pattern_group',
    'full_context',
    'words_before_count', 
    'words_after_count'
]

article_mentions_df = article_mentions_df[columns_order]
#article_mentions_df.head()
# Guardar resultado completo
output_file = '../../data/03_extracted/article_mentions_extracted.csv'
article_mentions_df.to_csv(output_file, index=False, encoding='utf-8-sig')
