In [10]:
import pandas as pd
import matplotlib.pyplot as plt
import requests
import io
from io import BytesIO

In [None]:
# Lista de enlaces
urls = [
    "https://www.policia.gov.co/sites/default/files/delitos-impacto/Amenazas_5.xlsx",
    "https://www.policia.gov.co/sites/default/files/delitos-impacto/Amenazas2024_0.xlsx",
    "https://www.policia.gov.co/sites/default/files/delitos-impacto/amenzas..xlsx",
    "https://www.policia.gov.co/sites/default/files/delitos-impacto/amenazas_13.xls",
    "https://www.policia.gov.co/sites/default/files/delitos-impacto/amenazas_11.xls",
    "https://www.policia.gov.co/sites/default/files/delitos-impacto/amenazas_2020.xlsx",
    "https://www.policia.gov.co/sites/default/files/delitos-impacto/amenazas_2019_1.xlsx",
    "https://www.policia.gov.co/sites/default/files/delitos-impacto/amenazas_2018_1.xlsx"
]

In [36]:
# Función de descarga de las bases:

def load_excel_from_url(url):
    try:
        response = requests.get(url)
        response.raise_for_status()  # Raise an exception for bad status codes
        file_extension = url.split('.')[-1]
        if file_extension == 'xlsx':
            df = pd.read_excel(BytesIO(response.content))
        elif file_extension == 'xls':
            df = pd.read_excel(BytesIO(response.content))
        else:
            print(f"Unsupported file format for URL: {url}")
            return None
        return df
    except requests.exceptions.RequestException as e:
        print(f"Error downloading {url}: {e}")
        return None
    except Exception as e:
        print(f"Error processing {url}: {e}")
        return None

# Dictionary to store dataframes
amenazas_dataframes = {}

# Load dataframes from URLs
for i, url in enumerate(urls):
    df = load_excel_from_url(url)
    if df is not None:
        dataframe_name = f"amenazas_{i+1}"
        amenazas_dataframes[dataframe_name] = df
        print(f"Successfully loaded {dataframe_name} from {url}")
    else:
        print(f"Failed to load data from {url}")

# You can access the dataframes using the dictionary, e.g., amenazas_dataframes['amenazas_1']
# To display the first dataframe:
if 'amenazas_1' in amenazas_dataframes:
    display(amenazas_dataframes['amenazas_1'].head())

Successfully loaded amenazas_1 from https://www.policia.gov.co/sites/default/files/delitos-impacto/Amenazas_5.xlsx
Successfully loaded amenazas_2 from https://www.policia.gov.co/sites/default/files/delitos-impacto/Amenazas2024_0.xlsx
Successfully loaded amenazas_3 from https://www.policia.gov.co/sites/default/files/delitos-impacto/amenzas..xlsx
Successfully loaded amenazas_4 from https://www.policia.gov.co/sites/default/files/delitos-impacto/amenazas_13.xls
Successfully loaded amenazas_5 from https://www.policia.gov.co/sites/default/files/delitos-impacto/amenazas_11.xls
Successfully loaded amenazas_6 from https://www.policia.gov.co/sites/default/files/delitos-impacto/amenazas_2020.xlsx
Successfully loaded amenazas_7 from https://www.policia.gov.co/sites/default/files/delitos-impacto/amenazas_2019_1.xlsx
Error downloading https://www.policia.gov.co/sites/default/files/delitos-impacto/amenazas_2018_1.xlsx: ('Connection broken: IncompleteRead(771885 bytes read, 1213643 more expected)', In

Unnamed: 0,MINISTERIO DE DEFENSA NACIONAL,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7
0,POLICÍA NACIONAL,,,,,,,
1,,,,,,,,
2,,,,,,,,
3,,,,,,,,
4,,,,,,,,


In [37]:
type(amenazas_dataframes)

dict

In [38]:
amenazas_dataframes.keys()

dict_keys(['amenazas_1', 'amenazas_2', 'amenazas_3', 'amenazas_4', 'amenazas_5', 'amenazas_6', 'amenazas_7'])

### Ubicación de encabezados:

In [39]:
# Ubicar el encabezado de las columnas en la base 1:
display(amenazas_dataframes['amenazas_1'].head(10))

Unnamed: 0,MINISTERIO DE DEFENSA NACIONAL,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7
0,POLICÍA NACIONAL,,,,,,,
1,,,,,,,,
2,,,,,,,,
3,,,,,,,,
4,,,,,,,,
5,DIRECCIÓN DE INVESTIGACIÓN CRIMINAL E INTERPOL,,,,,,,
6,GRUPO DE INFORMACIÓN DE CRIMINALIDAD,,,,,,,
7,AMENAZAS,,,,,,,
8,PERÍODO DEL 01 DE ENERO AL 31 DE JULIO DEL 2025,,,,,,,
9,ARMAS MEDIOS,DEPARTAMENTO,MUNICIPIO,FECHA HECHO,GENERO,*AGRUPA EDAD PERSONA*,CODIGO DANE,CANTIDAD


Base 1: 9

In [40]:
# Ubicar el encabezado de las columnas en la base 2:
display(amenazas_dataframes['amenazas_2'].head(10))

Unnamed: 0,MINISTERIO DE DEFENSA NACIONAL,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7
0,POLICÍA NACIONAL,,,,,,,
1,,,,,,,,
2,,,,,,,,
3,,,,,,,,
4,DIRECCIÓN DE INVESTIGACIÓN CRIMINAL E INTERPOL,,,,,,,
5,GRUPO DE INFORMACIÓN DE CRIMINALIDAD,,,,,,,
6,AMENAZAS,,,,,,,
7,PERÍODO DEL 01 DE ENERO AL 31 DE DICIEMBRE DEL...,,,,,,,
8,ARMAS MEDIOS,DEPARTAMENTO,MUNICIPIO,FECHA HECHO,GENERO,*AGRUPA EDAD PERSONA*,CODIGO DANE,CANTIDAD
9,ARMA BLANCA / CORTOPUNZANTE,AMAZONAS,Puerto Nariño,2024-07-21 00:00:00,MASCULINO,ADULTOS,91540000,1


Base 2: 8

In [41]:
# Ubicar el encabezado de las columnas en la base 3:
display(amenazas_dataframes['amenazas_3'].head(10))

Unnamed: 0,MINISTERIO DE DEFENSA NACIONAL,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7
0,POLICÍA NACIONAL,,,,,,,
1,,,,,,,,
2,,,,,,,,
3,,,,,,,,
4,DIRECCIÓN DE INVESTIGACIÓN CRIMINAL E INTERPOL,,,,,,,
5,GRUPO DE INFORMACIÓN DE CRIMINALIDAD,,,,,,,
6,AMENAZAS,,,,,,,
7,PERÍODO DEL 01 DE ENERO AL 31 DE DICIEMBRE DE...,,,,,,,
8,ARMA MEDIO,DEPARTAMENTO,MUNICIPIO,FECHA HECHO,GENERO,*AGRUPA_EDAD_PERSONA,CODIGO DANE,CANTIDAD
9,ARMA BLANCA / CORTOPUNZANTE,AMAZONAS,Leticia (CT),2023-06-13 00:00:00,MASCULINO,ADULTOS,91001000,1


Base 3: 8

In [42]:
# Ubicar el encabezado de las columnas en la base 4:
display(amenazas_dataframes['amenazas_4'].head(10))

Unnamed: 0,MINISTERIO DE DEFENSA NACIONAL,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7
0,POLICÍA NACIONAL,,,,,,,
1,,,,,,,,
2,,,,,,,,
3,,,,,,,,
4,DIRECCIÓN DE INVESTIGACIÓN CRIMINAL E INTERPOL,,,,,,,
5,GRUPO DE INFORMACIÓN DE CRIMINALIDAD,,,,,,,
6,AMENAZAS,,,,,,,
7,PERÍODO DEL 01 DE ENERO AL 31 DE DICIEMBRE DEL...,,,,,,,
8,ARMAS_MEDIOS,DEPARTAMENTO,MUNICIPIO,FECHA,GENERO,*AGRUPA_EDAD_PERSONA,CODIGO_DANE,CANTIDAD
9,ARMA BLANCA / CORTOPUNZANTE,AMAZONAS,Leticia (CT),2022-09-08 00:00:00,MASCULINO,ADULTOS,91798000,1


Base 4: 8

In [43]:
# Ubicar el encabezado de las columnas en la base 5:
display(amenazas_dataframes['amenazas_5'].head(10))

Unnamed: 0,MINISTERIO DE DEFENSA NACIONAL,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7
0,POLICÍA NACIONAL,,,,,,,
1,,,,,,,,
2,,,,,,,,
3,,,,,,,,
4,DIRECCIÓN DE INVESTIGACIÓN CRIMINAL E INTERPOL,,,,,,,
5,GRUPO DE INFORMACIÓN DE CRIMINALIDAD,,,,,,,
6,AMENAZAS,,,,,,,
7,PERÍODO DEL 01 ENERO AL 31 DE DICIEMBRE DEL A...,,,,,,,
8,ARMAS_MEDIOS,DEPARTAMENTO,MUNICIPIO,FECHA,GENERO,*AGRUPA_EDAD_PERSONA,CODIGO_DANE,CANTIDAD
9,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,AMAGÁ,2021-01-21 00:00:00,MASCULINO,ADULTOS,05030000,1


Base 5: 8

In [44]:
# Ubicar el encabezado de las columnas en la base 6:
display(amenazas_dataframes['amenazas_6'].head(10))

Unnamed: 0,MINISTERIO DE DEFENSA NACIONAL,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7
0,POLICÍA NACIONAL,,,,,,,
1,,,,,,,,
2,,,,,,,,
3,,,,,,,,
4,DIRECCIÓN DE INVESTIGACIÓN CRIMINAL E INTERPOL,,,,,,,
5,GRUPO DE INFORMACION DE CRIMINALIDAD,,,,,,,
6,AMENAZAS,,,,,,,
7,PERÍODO DEL 01 DE ENERO AL 31 DE DICIEMBRE AÑO...,,,,,,,
8,,,,,,,,
9,DEPARTAMENTO,MUNICIPIO,CODIGO DANE,ARMAS MEDIOS,FECHA HECHO,GENERO,AGRUPA EDAD PERSONA,CANTIDAD


Base 6: 9

In [45]:
# Ubicar el encabezado de las columnas en la base 7:
display(amenazas_dataframes['amenazas_7'].head(10))

Unnamed: 0,MINISTERIO DE DEFENSA NACIONAL,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7
0,POLICÍA NACIONAL,,,,,,,
1,,,,,,,,
2,,,,,,,,
3,,,,,,,,
4,DIRECCIÓN DE INVESTIGACIÓN CRIMINAL E INTERPOL,,,,,,,
5,GRUPO DE INFORMACION DE CRIMINALIDAD,,,,,,,
6,AMENAZAS,,,,,,,
7,PERÍODO DEL 01 DE ENERO AL 31 DE DICIEMBRE AÑO...,,,,,,,
8,,,,,,,,
9,DEPARTAMENTO,MUNICIPIO,CODIGO DANE,ARMAS MEDIOS,FECHA HECHO,GENERO,AGRUPA EDAD PERSONA,CANTIDAD


Base 7: 9

# Task
Load the datasets from the list `urls`, naming each sequentially as "amenazas_1", "amenazas_2", etc. For each loaded dataset, identify the row that should serve as the column header, set that row as the header, and remove all rows above it. Additionally, remove any trailing rows that are not part of the data. Finally, display the head and tail of each processed dataframe.

## Identify header rows

### Subtask:
For each dataframe in the `amenazas_dataframes` dictionary, determine the index of the row that contains the correct column headers. Based on the previous outputs, it seems this index varies between dataframes.


**Reasoning**:
Based on the previous outputs, I have identified the header row index for each dataframe. I will note down these indices in a markdown cell for future reference as per the instructions.



In [47]:
# Header row indices for each dataframe:
# amenazas_1: 9
# amenazas_2: 8
# amenazas_3: 8
# amenazas_4: 8
# amenazas_5: 8
# amenazas_6: 9
# amenazas_7: 9

## Define a function to clean dataframes

### Subtask:
Create a function that takes a dataframe and the header row index as input. This function will set the specified row as the column header, remove the rows above the header, and remove any irrelevant rows at the end (like footers or source information).


**Reasoning**:
Define a function to clean the dataframes by setting the header, removing rows above the header, and removing trailing rows.



In [48]:
def clean_dataframe(df, header_row_index):
    """
    Cleans a dataframe by setting the header row, removing rows above,
    and removing trailing rows.

    Args:
        df (pd.DataFrame): The input dataframe.
        header_row_index (int): The 0-based index of the header row.

    Returns:
        pd.DataFrame: The cleaned dataframe.
    """
    # Set the header row
    new_header = df.iloc[header_row_index]
    df = df[header_row_index + 1:].copy()
    df.columns = new_header

    # Remove trailing rows with summary information or footers
    # Identify rows where the first column contains keywords like "FUENTE:", "Elaborado:", etc.
    footer_keywords = ["FUENTE:", "Elaborado:", "Revisado:", "Autorizado:"]
    initial_column_name = df.columns[0] # Get the name of the first column after setting the header

    if initial_column_name is not None:
        footer_mask = df[initial_column_name].astype(str).str.contains('|'.join(footer_keywords), na=False)
        df = df[~footer_mask].copy()

    # Also remove rows with a high percentage of missing values, which are likely footers
    # Calculate the percentage of missing values for each row
    missing_percentage = df.isnull().mean(axis=1)
    # Define a threshold for considering a row as a footer (e.g., 80% missing)
    missing_threshold = 0.8
    df = df[missing_percentage < missing_threshold].copy()


    return df

## Apply the cleaning function to each dataframe

### Subtask:
Apply the cleaning function to each dataframe in the `amenazas_dataframes` dictionary using the correct header row index for each, and store the cleaned dataframes back into the dictionary.


**Reasoning**:
Apply the cleaning function to each dataframe in the `amenazas_dataframes` dictionary using the correct header row index for each, and store the cleaned dataframes back into the dictionary.



In [52]:
# Define the header indices for each dataframe
header_indices = {
    'amenazas_1': 9,
    'amenazas_2': 8,
    'amenazas_3': 8,
    'amenazas_4': 8,
    'amenazas_5': 8,
    'amenazas_6': 9,
    'amenazas_7': 9
}

# Iterate through the dictionary and clean each dataframe
for name, df in amenazas_dataframes.items():
    if name in header_indices:
        header_index = header_indices[name]
        amenazas_dataframes[name] = clean_dataframe(df, header_index)
        print(f"Cleaned dataframe: {name}")
    else:
        print(f"No header index found for {name}. Skipping cleaning.")

# Display head and tail of each cleaned dataframe
for name, df in amenazas_dataframes.items():
    print(f"\n--- Head of {name} ---")
    display(df.head())
    print(f"\n--- Tail of {name} ---")
    display(df.tail())

Cleaned dataframe: amenazas_1
Cleaned dataframe: amenazas_2
Cleaned dataframe: amenazas_3
Cleaned dataframe: amenazas_4
Cleaned dataframe: amenazas_5
Cleaned dataframe: amenazas_6
Cleaned dataframe: amenazas_7

--- Head of amenazas_1 ---


29,ARMA BLANCA / CORTOPUNZANTE,HUILA,Neiva (CT),16/01/2025,FEMENINO,ADULTOS,41001000,1
30,ARMA BLANCA / CORTOPUNZANTE,CÓRDOBA,Montelíbano,03/02/2025,FEMENINO,ADULTOS,23466000,1
31,ARMA BLANCA / CORTOPUNZANTE,CESAR,El Paso,12/01/2025,MASCULINO,ADULTOS,20250000,1
32,ARMA BLANCA / CORTOPUNZANTE,VALLE,Ginebra,03/01/2025,MASCULINO,ADULTOS,76306000,1
33,ARMA BLANCA / CORTOPUNZANTE,CUNDINAMARCA,Bogotá D.C. (CT),24/01/2025,MASCULINO,ADULTOS,11001000,1
34,ARMA BLANCA / CORTOPUNZANTE,CÓRDOBA,Chinú,19/01/2025,MASCULINO,ADULTOS,23182000,1



--- Tail of amenazas_1 ---


29,ARMA BLANCA / CORTOPUNZANTE,HUILA,Neiva (CT),16/01/2025,FEMENINO,ADULTOS,41001000,1
25327,SIN EMPLEO DE ARMAS,ATLÁNTICO,Barranquilla (CT),25/07/2025,FEMENINO,ADULTOS,8001000,1
25328,SIN EMPLEO DE ARMAS,ATLÁNTICO,Barranquilla (CT),25/07/2025,MASCULINO,ADULTOS,8001000,1
25329,SIN EMPLEO DE ARMAS,ATLÁNTICO,Barranquilla (CT),25/07/2025,FEMENINO,ADULTOS,8001000,1
25330,SIN EMPLEO DE ARMAS,ATLÁNTICO,Barranquilla (CT),25/07/2025,MASCULINO,ADULTOS,8001000,1
25331,SIN EMPLEO DE ARMAS,ATLÁNTICO,Barranquilla (CT),25/07/2025,MASCULINO,ADULTOS,8001000,1



--- Head of amenazas_2 ---


26,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Envigado,2024-11-15 00:00:00,MASCULINO,ADULTOS,05266000,1
27,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Guarne,2024-12-04 00:00:00,MASCULINO,ADULTOS,5318000,1
28,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Guatapé,2024-05-26 00:00:00,MASCULINO,ADULTOS,5321000,1
29,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Ituango,2024-03-02 00:00:00,MASCULINO,ADULTOS,5361000,1
30,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Ituango,2024-03-17 00:00:00,MASCULINO,ADULTOS,5361000,1
31,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Ituango,2024-06-30 00:00:00,FEMENINO,ADULTOS,5361000,1



--- Tail of amenazas_2 ---


26,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Envigado,2024-11-15 00:00:00,MASCULINO,ADULTOS,05266000,1
34532,-,BOLÍVAR,Magangué,2024-11-28 00:00:00,MASCULINO,ADULTOS,13430000.0,1
34533,-,CHOCÓ,Quibdó (CT),2024-05-21 00:00:00,FEMENINO,ADULTOS,27001000.0,1
34534,-,CUNDINAMARCA,Bogotá D.C. (CT),2024-08-10 00:00:00,FEMENINO,ADULTOS,11001000.0,1
34535,-,NORTE DE SANTANDER,Villa del Rosario,2024-09-01 00:00:00,MASCULINO,ADULTOS,54874000.0,1
34536,TOTAL,,,,,,,56300



--- Head of amenazas_3 ---


26,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Giraldo,2023-01-19 00:00:00,MASCULINO,ADULTOS,05306000,1
27,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Gómez Plata,2023-10-15 00:00:00,MASCULINO,ADULTOS,5310000,1
28,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Guarne,2023-01-19 00:00:00,MASCULINO,ADULTOS,5318000,1
29,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Guarne,2023-11-22 00:00:00,MASCULINO,ADULTOS,5318000,1
30,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Guarne,2023-12-09 00:00:00,FEMENINO,ADULTOS,5318000,1
31,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Itagui,2023-01-18 00:00:00,MASCULINO,ADULTOS,5360000,1



--- Tail of amenazas_3 ---


26,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Giraldo,2023-01-19 00:00:00,MASCULINO,ADULTOS,05306000,1
38898,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2023-08-18 00:00:00,MASCULINO,ADULTOS,99001000.0,1
38899,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2023-09-07 00:00:00,MASCULINO,ADULTOS,99001000.0,1
38900,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2023-09-22 00:00:00,MASCULINO,ADULTOS,99001000.0,1
38901,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2023-12-11 00:00:00,MASCULINO,ADULTOS,99001000.0,1
38902,TOTAL,,,,,,,64639



--- Head of amenazas_4 ---


26,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Guadalupe,2022-10-20 00:00:00,FEMENINO,ADULTOS,05315000,1
27,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Guarne,2022-04-22 00:00:00,MASCULINO,ADULTOS,5318000,1
28,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Guarne,2022-05-22 00:00:00,MASCULINO,ADULTOS,5318000,1
29,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Marinilla,2022-08-20 00:00:00,MASCULINO,ADULTOS,5440000,1
30,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Medellín (CT),2022-02-11 00:00:00,MASCULINO,ADULTOS,5001000,1
31,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Medellín (CT),2022-02-12 00:00:00,FEMENINO,ADULTOS,5001000,1



--- Tail of amenazas_4 ---


26,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Guadalupe,2022-10-20 00:00:00,FEMENINO,ADULTOS,05315000,1
39071,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2022-10-07 00:00:00,MASCULINO,ADULTOS,99001000.0,1
39072,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2022-10-24 00:00:00,MASCULINO,ADULTOS,99001000.0,1
39073,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2022-11-04 00:00:00,MASCULINO,ADULTOS,99001000.0,1
39074,SIN EMPLEO DE ARMAS,VICHADA,Santa Rosalía,2022-02-10 00:00:00,MASCULINO,ADULTOS,99624000.0,1
39075,TOTAL,,,,,,,65135



--- Head of amenazas_5 ---


26,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,GUARNE,2021-08-29 00:00:00,MASCULINO,ADULTOS,05318000,1
27,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,GUARNE,2021-11-08 00:00:00,MASCULINO,ADULTOS,5318000,1
28,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,ITAGUI,2021-10-23 00:00:00,MASCULINO,ADULTOS,5360000,1
29,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,ITUANGO,2021-09-05 00:00:00,FEMENINO,ADULTOS,5361000,1
30,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,JARDÍN,2021-05-06 00:00:00,FEMENINO,ADULTOS,5364000,1
31,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,LIBORINA,2021-06-25 00:00:00,FEMENINO,ADULTOS,5411000,1



--- Tail of amenazas_5 ---


26,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,GUARNE,2021-08-29 00:00:00,MASCULINO,ADULTOS,05318000,1
35255,SIN EMPLEO DE ARMAS,VICHADA,PUERTO CARREÑO (CT),2021-11-22 00:00:00,MASCULINO,ADULTOS,99001000.0,1
35256,SIN EMPLEO DE ARMAS,VICHADA,PUERTO CARREÑO (CT),2021-11-28 00:00:00,FEMENINO,ADULTOS,99001000.0,1
35257,SIN EMPLEO DE ARMAS,VICHADA,PUERTO CARREÑO (CT),2021-12-02 00:00:00,MASCULINO,ADULTOS,99001000.0,1
35258,SIN EMPLEO DE ARMAS,VICHADA,PUERTO CARREÑO (CT),2021-12-28 00:00:00,MASCULINO,ADULTOS,99001000.0,1
35259,TOTAL,,,,,,,61898



--- Head of amenazas_6 ---


29,ANTIOQUIA,BELLO,05088000,ARMA BLANCA / CORTOPUNZANTE,2020-10-26 00:00:00,MASCULINO,ADULTOS,1
30,ANTIOQUIA,BELLO,5088000,ARMA BLANCA / CORTOPUNZANTE,2020-11-05 00:00:00,FEMENINO,ADULTOS,1
31,ANTIOQUIA,CALDAS,5129000,ARMA BLANCA / CORTOPUNZANTE,2020-05-23 00:00:00,MASCULINO,ADULTOS,1
32,ANTIOQUIA,CALDAS,5129000,ARMA BLANCA / CORTOPUNZANTE,2020-06-01 00:00:00,MASCULINO,ADULTOS,1
33,ANTIOQUIA,CALDAS,5129000,ARMA BLANCA / CORTOPUNZANTE,2020-12-05 00:00:00,MASCULINO,ADULTOS,1
34,ANTIOQUIA,CAMPAMENTO,5134000,ARMA BLANCA / CORTOPUNZANTE,2020-09-05 00:00:00,MASCULINO,ADULTOS,1



--- Tail of amenazas_6 ---


29,ANTIOQUIA,BELLO,05088000,ARMA BLANCA / CORTOPUNZANTE,2020-10-26 00:00:00,MASCULINO,ADULTOS,1
28104,VICHADA,PUERTO CARREÑO (CT),99001000.0,SIN EMPLEO DE ARMAS,2020-05-22 00:00:00,FEMENINO,ADULTOS,1
28105,VICHADA,PUERTO CARREÑO (CT),99001000.0,SIN EMPLEO DE ARMAS,2020-07-07 00:00:00,MASCULINO,ADULTOS,1
28106,VICHADA,PUERTO CARREÑO (CT),99001000.0,SIN EMPLEO DE ARMAS,2020-10-22 00:00:00,MASCULINO,ADULTOS,1
28107,VICHADA,PUERTO CARREÑO (CT),99001000.0,SIN EMPLEO DE ARMAS,2020-11-02 00:00:00,MASCULINO,ADULTOS,1
28108,TOTAL,,,,,,,42276



--- Head of amenazas_7 ---


29,CUNDINAMARCA,BOGOTÁ D.C. (CT),11001000,NaN,2019-03-23 00:00:00,FEMENINO,MENORES,1
30,CUNDINAMARCA,BOGOTÁ D.C. (CT),11001000,,2019-05-30 00:00:00,FEMENINO,MENORES,1
31,CUNDINAMARCA,BOGOTÁ D.C. (CT),11001000,,2019-05-31 00:00:00,FEMENINO,MENORES,1
32,MAGDALENA,ARACATACA,47053000,SIN EMPLEO DE ARMAS,2019-07-15 00:00:00,FEMENINO,MENORES,1
33,GUAINÍA,INÍRIDA (CT),94001000,ARMA BLANCA / CORTOPUNZANTE,2019-02-25 00:00:00,MASCULINO,MENORES,1
34,BOLÍVAR,CARTAGENA (CT),13001000,ARMA BLANCA / CORTOPUNZANTE,2019-06-01 00:00:00,MASCULINO,MENORES,1



--- Tail of amenazas_7 ---


29,CUNDINAMARCA,BOGOTÁ D.C. (CT),11001000,NaN,2019-03-23 00:00:00,FEMENINO,MENORES,1
46990,VAUPÉS,CARURU,97161000.0,SIN EMPLEO DE ARMAS,2019-11-08 00:00:00,MASCULINO,,1
46991,HUILA,RIVERA,41615000.0,CONTUNDENTES,2019-12-08 00:00:00,MASCULINO,,1
46992,ATLÁNTICO,BARRANQUILLA (CT),8001000.0,SIN EMPLEO DE ARMAS,2019-08-01 00:00:00,,,1
46993,ANTIOQUIA,APARTADÓ,5045000.0,,2019-08-20 00:00:00,MASCULINO,,1
46994,TOTAL,,,,,,,48679


## Verify cleaned dataframes

### Subtask:
Verify cleaned dataframes by displaying the head and tail of each processed dataframe to ensure the column headers are set correctly and the irrelevant rows have been removed.


**Reasoning**:
Iterate through the dictionary and display the head and tail of each dataframe to verify the cleaning process.



In [50]:
# Display head and tail of each cleaned dataframe
for name, df in amenazas_dataframes.items():
    print(f"\n--- Head of {name} ---")
    display(df.head())
    print(f"\n--- Tail of {name} ---")
    display(df.tail())


--- Head of amenazas_1 ---


9,ARMAS MEDIOS,DEPARTAMENTO,MUNICIPIO,FECHA HECHO,GENERO,*AGRUPA EDAD PERSONA*,CODIGO DANE,CANTIDAD
10,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Medellín (CT),01/01/2025,MASCULINO,ADULTOS,5001000,1
11,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Medellín (CT),01/01/2025,FEMENINO,ADULTOS,5001000,1
12,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Medellín (CT),01/01/2025,MASCULINO,ADULTOS,5001000,1
13,ARMA BLANCA / CORTOPUNZANTE,SANTANDER,Landázuri,27/01/2025,MASCULINO,ADULTOS,68385000,1
14,ARMA BLANCA / CORTOPUNZANTE,HUILA,Oporapa,14/01/2025,FEMENINO,ADULTOS,41503000,1



--- Tail of amenazas_1 ---


9,ARMAS MEDIOS,DEPARTAMENTO,MUNICIPIO,FECHA HECHO,GENERO,*AGRUPA EDAD PERSONA*,CODIGO DANE,CANTIDAD
25327,SIN EMPLEO DE ARMAS,ATLÁNTICO,Barranquilla (CT),25/07/2025,FEMENINO,ADULTOS,8001000,1
25328,SIN EMPLEO DE ARMAS,ATLÁNTICO,Barranquilla (CT),25/07/2025,MASCULINO,ADULTOS,8001000,1
25329,SIN EMPLEO DE ARMAS,ATLÁNTICO,Barranquilla (CT),25/07/2025,FEMENINO,ADULTOS,8001000,1
25330,SIN EMPLEO DE ARMAS,ATLÁNTICO,Barranquilla (CT),25/07/2025,MASCULINO,ADULTOS,8001000,1
25331,SIN EMPLEO DE ARMAS,ATLÁNTICO,Barranquilla (CT),25/07/2025,MASCULINO,ADULTOS,8001000,1



--- Head of amenazas_2 ---


8,ARMAS MEDIOS,DEPARTAMENTO,MUNICIPIO,FECHA HECHO,GENERO,*AGRUPA EDAD PERSONA*,CODIGO DANE,CANTIDAD
9,ARMA BLANCA / CORTOPUNZANTE,AMAZONAS,Puerto Nariño,2024-07-21 00:00:00,MASCULINO,ADULTOS,91540000,1
10,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Amagá,2024-01-28 00:00:00,MASCULINO,ADULTOS,5030000,1
11,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Amagá,2024-05-12 00:00:00,FEMENINO,ADULTOS,5030000,1
12,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Amagá,2024-07-21 00:00:00,MASCULINO,ADULTOS,5030000,1
13,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Amagá,2024-07-22 00:00:00,MASCULINO,ADULTOS,5030000,1



--- Tail of amenazas_2 ---


8,ARMAS MEDIOS,DEPARTAMENTO,MUNICIPIO,FECHA HECHO,GENERO,*AGRUPA EDAD PERSONA*,CODIGO DANE,CANTIDAD
34532,-,BOLÍVAR,Magangué,2024-11-28 00:00:00,MASCULINO,ADULTOS,13430000.0,1
34533,-,CHOCÓ,Quibdó (CT),2024-05-21 00:00:00,FEMENINO,ADULTOS,27001000.0,1
34534,-,CUNDINAMARCA,Bogotá D.C. (CT),2024-08-10 00:00:00,FEMENINO,ADULTOS,11001000.0,1
34535,-,NORTE DE SANTANDER,Villa del Rosario,2024-09-01 00:00:00,MASCULINO,ADULTOS,54874000.0,1
34536,TOTAL,,,,,,,56300



--- Head of amenazas_3 ---


8,ARMA MEDIO,DEPARTAMENTO,MUNICIPIO,FECHA HECHO,GENERO,*AGRUPA_EDAD_PERSONA,CODIGO DANE,CANTIDAD
9,ARMA BLANCA / CORTOPUNZANTE,AMAZONAS,Leticia (CT),2023-06-13 00:00:00,MASCULINO,ADULTOS,91001000,1
10,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Amagá,2023-06-26 00:00:00,FEMENINO,ADULTOS,5030000,1
11,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Andes,2023-09-06 00:00:00,FEMENINO,ADULTOS,5034000,1
12,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Angostura,2023-05-05 00:00:00,MASCULINO,ADULTOS,5038000,1
13,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Bello,2023-02-23 00:00:00,FEMENINO,ADULTOS,5088000,1



--- Tail of amenazas_3 ---


8,ARMA MEDIO,DEPARTAMENTO,MUNICIPIO,FECHA HECHO,GENERO,*AGRUPA_EDAD_PERSONA,CODIGO DANE,CANTIDAD
38898,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2023-08-18 00:00:00,MASCULINO,ADULTOS,99001000.0,1
38899,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2023-09-07 00:00:00,MASCULINO,ADULTOS,99001000.0,1
38900,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2023-09-22 00:00:00,MASCULINO,ADULTOS,99001000.0,1
38901,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2023-12-11 00:00:00,MASCULINO,ADULTOS,99001000.0,1
38902,TOTAL,,,,,,,64639



--- Head of amenazas_4 ---


8,ARMAS_MEDIOS,DEPARTAMENTO,MUNICIPIO,FECHA,GENERO,*AGRUPA_EDAD_PERSONA,CODIGO_DANE,CANTIDAD
9,ARMA BLANCA / CORTOPUNZANTE,AMAZONAS,Leticia (CT),2022-09-08 00:00:00,MASCULINO,ADULTOS,91798000,1
10,ARMA BLANCA / CORTOPUNZANTE,AMAZONAS,Leticia (CT),2022-10-17 00:00:00,MASCULINO,ADULTOS,91001000,1
11,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Amagá,2022-07-06 00:00:00,MASCULINO,ADULTOS,5030000,1
12,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Amagá,2022-11-22 00:00:00,FEMENINO,ADULTOS,5030000,1
13,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,Angostura,2022-11-17 00:00:00,MASCULINO,ADULTOS,5038000,1



--- Tail of amenazas_4 ---


8,ARMAS_MEDIOS,DEPARTAMENTO,MUNICIPIO,FECHA,GENERO,*AGRUPA_EDAD_PERSONA,CODIGO_DANE,CANTIDAD
39071,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2022-10-07 00:00:00,MASCULINO,ADULTOS,99001000.0,1
39072,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2022-10-24 00:00:00,MASCULINO,ADULTOS,99001000.0,1
39073,SIN EMPLEO DE ARMAS,VICHADA,Puerto Carreño (CT),2022-11-04 00:00:00,MASCULINO,ADULTOS,99001000.0,1
39074,SIN EMPLEO DE ARMAS,VICHADA,Santa Rosalía,2022-02-10 00:00:00,MASCULINO,ADULTOS,99624000.0,1
39075,TOTAL,,,,,,,65135



--- Head of amenazas_5 ---


8,ARMAS_MEDIOS,DEPARTAMENTO,MUNICIPIO,FECHA,GENERO,*AGRUPA_EDAD_PERSONA,CODIGO_DANE,CANTIDAD
9,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,AMAGÁ,2021-01-21 00:00:00,MASCULINO,ADULTOS,5030000,1
10,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,ANDES,2021-09-06 00:00:00,MASCULINO,ADULTOS,5034000,1
11,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,ANGOSTURA,2021-12-12 00:00:00,FEMENINO,ADULTOS,5038000,1
12,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,ANORÍ,2021-06-21 00:00:00,FEMENINO,ADULTOS,5040000,1
13,ARMA BLANCA / CORTOPUNZANTE,ANTIOQUIA,BARBOSA,2021-03-13 00:00:00,MASCULINO,ADULTOS,5079000,1



--- Tail of amenazas_5 ---


8,ARMAS_MEDIOS,DEPARTAMENTO,MUNICIPIO,FECHA,GENERO,*AGRUPA_EDAD_PERSONA,CODIGO_DANE,CANTIDAD
35255,SIN EMPLEO DE ARMAS,VICHADA,PUERTO CARREÑO (CT),2021-11-22 00:00:00,MASCULINO,ADULTOS,99001000.0,1
35256,SIN EMPLEO DE ARMAS,VICHADA,PUERTO CARREÑO (CT),2021-11-28 00:00:00,FEMENINO,ADULTOS,99001000.0,1
35257,SIN EMPLEO DE ARMAS,VICHADA,PUERTO CARREÑO (CT),2021-12-02 00:00:00,MASCULINO,ADULTOS,99001000.0,1
35258,SIN EMPLEO DE ARMAS,VICHADA,PUERTO CARREÑO (CT),2021-12-28 00:00:00,MASCULINO,ADULTOS,99001000.0,1
35259,TOTAL,,,,,,,61898



--- Head of amenazas_6 ---


9,DEPARTAMENTO,MUNICIPIO,CODIGO DANE,ARMAS MEDIOS,FECHA HECHO,GENERO,AGRUPA EDAD PERSONA,CANTIDAD
10,AMAZONAS,LETICIA (CT),91001000,ARMA BLANCA / CORTOPUNZANTE,2020-06-17 00:00:00,MASCULINO,ADULTOS,1
11,AMAZONAS,LETICIA (CT),91001000,ARMA BLANCA / CORTOPUNZANTE,2020-08-18 00:00:00,MASCULINO,ADULTOS,1
12,AMAZONAS,LETICIA (CT),91001000,ARMA BLANCA / CORTOPUNZANTE,2020-10-24 00:00:00,MASCULINO,ADULTOS,1
13,ANTIOQUIA,ABRIAQUÍ,5004000,ARMA BLANCA / CORTOPUNZANTE,2020-10-24 00:00:00,MASCULINO,ADULTOS,1
14,ANTIOQUIA,AMAGÁ,5030000,ARMA BLANCA / CORTOPUNZANTE,2020-01-29 00:00:00,MASCULINO,ADULTOS,1



--- Tail of amenazas_6 ---


9,DEPARTAMENTO,MUNICIPIO,CODIGO DANE,ARMAS MEDIOS,FECHA HECHO,GENERO,AGRUPA EDAD PERSONA,CANTIDAD
28104,VICHADA,PUERTO CARREÑO (CT),99001000.0,SIN EMPLEO DE ARMAS,2020-05-22 00:00:00,FEMENINO,ADULTOS,1
28105,VICHADA,PUERTO CARREÑO (CT),99001000.0,SIN EMPLEO DE ARMAS,2020-07-07 00:00:00,MASCULINO,ADULTOS,1
28106,VICHADA,PUERTO CARREÑO (CT),99001000.0,SIN EMPLEO DE ARMAS,2020-10-22 00:00:00,MASCULINO,ADULTOS,1
28107,VICHADA,PUERTO CARREÑO (CT),99001000.0,SIN EMPLEO DE ARMAS,2020-11-02 00:00:00,MASCULINO,ADULTOS,1
28108,TOTAL,,,,,,,42276



--- Head of amenazas_7 ---


9,DEPARTAMENTO,MUNICIPIO,CODIGO DANE,ARMAS MEDIOS,FECHA HECHO,GENERO,AGRUPA EDAD PERSONA,CANTIDAD
10,CESAR,VALLEDUPAR (CT),20001000,,2019-12-17 00:00:00,FEMENINO,MENORES,1
11,QUINDÍO,ARMENIA (CT),63001000,SIN EMPLEO DE ARMAS,2019-03-17 00:00:00,FEMENINO,MENORES,1
12,SANTANDER,BARRANCABERMEJA,68081000,,2019-08-25 00:00:00,MASCULINO,MENORES,1
13,TOLIMA,IBAGUÉ (CT),73001000,,2019-04-25 00:00:00,MASCULINO,MENORES,1
14,TOLIMA,IBAGUÉ (CT),73001000,,2019-12-22 00:00:00,MASCULINO,MENORES,1



--- Tail of amenazas_7 ---


9,DEPARTAMENTO,MUNICIPIO,CODIGO DANE,ARMAS MEDIOS,FECHA HECHO,GENERO,AGRUPA EDAD PERSONA,CANTIDAD
46990,VAUPÉS,CARURU,97161000.0,SIN EMPLEO DE ARMAS,2019-11-08 00:00:00,MASCULINO,,1
46991,HUILA,RIVERA,41615000.0,CONTUNDENTES,2019-12-08 00:00:00,MASCULINO,,1
46992,ATLÁNTICO,BARRANQUILLA (CT),8001000.0,SIN EMPLEO DE ARMAS,2019-08-01 00:00:00,,,1
46993,ANTIOQUIA,APARTADÓ,5045000.0,,2019-08-20 00:00:00,MASCULINO,,1
46994,TOTAL,,,,,,,48679


## Summary:

### Data Analysis Key Findings

*   The header row index varied across the dataframes: `amenazas_1`, `amenazas_6`, and `amenazas_7` had the header at index 9, while `amenazas_2`, `amenazas_3`, `amenazas_4`, and `amenazas_5` had the header at index 8.
*   The custom `clean_dataframe` function successfully set the correct header row and removed the rows above it for all dataframes.
*   The cleaning process for removing trailing rows was not entirely successful, as some trailing rows, including 'TOTAL' rows, were not removed from all dataframes.

### Insights or Next Steps

*   Refine the `clean_dataframe` function to more effectively identify and remove various types of trailing rows, including 'TOTAL' rows, potentially using more robust pattern matching or data characteristics.
*   Further inspect the dataframes for any remaining inconsistencies or irrelevant rows that were not removed by the current cleaning process.
