# Exploratory Data Analysis (EDA) of CGN Dataset - Economy and Finance

![image.png](attachment:image.png)

In [1]:
# Import required libraries
import pandas as pd
import os
from dotenv import load_dotenv

# Load environment variables
load_dotenv()  # Loads from .env by default

## Define base path (adjust if notebook is in different location)
BASE_PATH = os.getenv('BASE_PATH')

# Verify base path exists
if not BASE_PATH or not os.path.exists(BASE_PATH):
    raise ValueError(f"Invalid BASE_PATH: {BASE_PATH}. Check your .env file and directory structure")

In [2]:
raw = pd.read_parquet(os.path.join(BASE_PATH, 'data/1_Bronze/cgn.parquet'))

In [3]:
df = raw.copy()

In [4]:
df.head()

Unnamed: 0,Codigo contable,Nombre cuenta,Saldo inicial,Movimiento debito,Movimiento credito,Saldo final,Corriente,No corriente
0,100000,ACTIVOS,218881000000000.0,50428980000000.0,48872860000000.0,220437100000000.0,12512530000000.0,207924600000000.0
1,110000,EFECTIVO Y EQUIVALENTES AL EFECTIVO,5334106000000.0,22359230000000.0,23601710000000.0,4091626000000.0,4091626000000.0,0.0
2,110500,CAJA,491693700.0,152519500000.0,152504200000.0,507026800.0,507026800.0,0.0
3,110501,Caja principal,0.0,152429100000.0,152429100000.0,0.0,0.0,0.0
4,110502,Caja menor,491693700.0,90427060.0,75093970.0,507026800.0,507026800.0,0.0


In [5]:
# list all the unique valies of Nombre cuenta column
df['Nombre cuenta'].unique()

array(['ACTIVOS', 'EFECTIVO Y EQUIVALENTES AL EFECTIVO', 'CAJA',
       'Caja principal', 'Caja menor',
       'DEPÓSITOS EN INSTITUCIONES FINANCIERAS', 'Cuenta corriente',
       'Cuenta de ahorro', 'Depósitos en el exterior',
       'Depósitos para fondos de solidaridad y redistribución del ingreso',
       'FONDOS EN TRÁNSITO', 'Red bancaria', 'Otros depósitos',
       'EFECTIVO DE USO RESTRINGIDO', 'Caja',
       'Depósitos en Instituciones Financieras',
       'EQUIVALENTES AL EFECTIVO', 'Certificados de Depósito a término',
       'Otros equivalentes al efectivo',
       'INVERSIONES E INSTRUMENTOS DERIVADOS',
       'INVERSIONES DE ADMINISTRACIÓN DE LIQUIDEZ A VALOR DE MERCADO (VALOR RAZONABLE) CON CAMBIOS EN EL RESULTADO',
       'Certificados de depósito a término (CDT)',
       'Bonos y títulos emitidos por entidades del exterior',
       'INVERSIONES DE ADMINISTRACIÓN DE LIQUIDEZ A VALOR DE MERCADO (VALOR RAZONABLE) CON CAMBIOS EN EL PATRIMONIO (OTRO RESULTADO INTEGRAL)',
  

## Transportation related values

Impuesto sobre vehículos automotores
Vehicle Motor Tax
(Related to the taxation of vehicles, which affects the transportation sector.)

Derechos de tránsito
Traffic Fees
(Associated with regulating and charging for the use of public roads.)

Participación en el transporte por oleoductos
Participation in Oil Pipeline Transportation
(Linked to the transportation of fuels via pipelines.)

Equipos de transporte, tracción y elevación
Transportation, Traction, and Lifting Equipment
(Includes assets intended for mobility, with subdivisions such as “Terrestrial”, “Maritime and Fluvial”, “Traction”, and “Lifting”.)

Cofinanciación del sistema de transporte masivo de pasajeros
Cofinancing of the Mass Passenger Transport System
(Directly related to the funding and support of urban mobility systems.)

In [9]:
target_accounts = [
    "Impuesto sobre vehículos automotores",
    "Derechos de tránsito",
    "Participación en el transporte por oleoductos",
    "Equipos de transporte, tracción y elevación",
    "Cofinanciación del sistema de transporte masivo de pasajeros"
]

# Filter the DataFrame using .isin()
filtered_df = df[df['Nombre cuenta'].isin(target_accounts)]


In [10]:
filtered_df

Unnamed: 0,Codigo contable,Nombre cuenta,Saldo inicial,Movimiento debito,Movimiento credito,Saldo final,Corriente,No corriente
40,130533,Impuesto sobre vehículos automotores,114530000.0,545023700000.0,409734400000.0,135403800000.0,135403800000.0,0.0
52,131112,Participación en el transporte por oleoductos,0.0,4751707.0,4751707.0,0.0,0.0,0.0
132,162008,"Equipos de transporte, tracción y elevación",0.0,1364670000.0,0.0,1364670000.0,0.0,1364670000.0
142,163505,"Equipos de transporte, tracción y elevación",15001830000.0,10552750000.0,14209470000.0,11345110000.0,0.0,11345110000.0
154,163711,"Equipos de transporte, tracción y elevación",563408100.0,6458581000.0,5634468000.0,1387522000.0,0.0,1387522000.0
232,168309,"Equipos de transporte, tracción y elevación",178060200.0,0.0,0.0,178060200.0,0.0,178060200.0
242,168508,"Equipos de transporte, tracción y elevación",-5786788000.0,10973320.0,2120381000.0,-7896195000.0,0.0,-7896195000.0
514,410533,Impuesto sobre vehículos automotores,155363100000.0,38632950000.0,545023700000.0,661753900000.0,0.0,661753900000.0
526,411025,Participación en el transporte por oleoductos,0.0,0.0,4751707.0,4751707.0,0.0,4751707.0
528,411034,Derechos de tránsito,14299650000.0,3554054.0,13866770000.0,28162870000.0,0.0,28162870000.0


# (END)