In [39]:
import pandas as pd
import numpy as np
import streamlit as st
import matplotlib.pyplot as plt
import seaborn as sns
import altair as alt
import plotly.express as px
import geopandas as gpd
import contextily as ctx
import folium 

# Definir los nombres de las columnas
Variables= ['cod_reg', 'cod_dep', 'cod_loc', 'pad', 'block', 'EP', 'uni', 'sup_predio','sup_edificada', 'V_cat_terreno',
            'V_cat_mejoras',  'V_cat_total', 'V_impuestos', 'Fecha_UDJ', 'Vigencia_UDJ']  

# Especificar los tipos de datos para las columnas
dtypes = {
    'cod_reg': str,
    'cod_dep': str,
    'cod_loc': str,  # O str, dependiendo de tus datos
    'pad': int,
    'block': str,
    'EP': str,
    'uni': int,
    'sup_predio': int,
    'sup_edificada': int,
    'V_cat_terreno': int,
    'V_cat_mejoras': int,
    'V_cat_total': int,
    'V_impuestos': int,
    'Fecha_UDJ': bool,
    'Vigencia_UDJ': bool
}

P_Urbanos = pd.read_csv('C:/Users/Nico/Desktop/Python/DatosAbiertosDNC(2024-09)/Padrones Urbanos.csv',
sep=',', encoding='cp1252', header=None, names=Variables, dtype={4: str, 5: str}  )

# Mostrar las primeras filas del archivo
P_Urbanos.head(8)



Unnamed: 0,cod_reg,cod_dep,cod_loc,pad,block,EP,uni,sup_predio,sup_edificada,V_cat_terreno,V_cat_mejoras,V_cat_total,V_impuestos,Fecha_UDJ,Vigencia_UDJ
0,CO,A,AA,1,,,0,1473,438,396202,1644448,2040650,2040650,/ /,/ /
1,CO,A,AA,2,,,0,246,112,149880,640149,790029,790029,/ /,/ /
2,CO,A,AA,3,,,0,123,99,70630,489035,559665,559665,/ /,/ /
3,CO,A,AA,4,,,0,234,54,132215,220728,352943,352943,/ /,/ /
4,CO,A,AA,6,,,0,505,75,274276,431225,705501,705501,/ /,/ /
5,CO,A,AA,10,,,0,462,283,303908,1339819,1643727,1643727,/ /,/ /
6,CO,A,AA,11,,,0,440,139,290376,584098,874474,874474,/ /,/ /
7,CO,A,AA,12,,,0,470,152,308792,454518,763310,763310,/ /,/ /


In [40]:
# Filtrar filas donde 'cod_dep' es igual a 'V' que es Montevideo
filtro_dep = P_Urbanos[P_Urbanos['cod_dep'] == 'V']


# Mostrar el DataFrame filtrado
filtro_dep.head()

Unnamed: 0,cod_reg,cod_dep,cod_loc,pad,block,EP,uni,sup_predio,sup_edificada,V_cat_terreno,V_cat_mejoras,V_cat_total,V_impuestos,Fecha_UDJ,Vigencia_UDJ
812667,CO,V,AA,5,,,0,130,138,669500,374348,1043848,1043848,/ /,/ /
812668,CO,V,AA,7,,,0,206,168,873257,319436,1192693,1192693,/ /,/ /
812669,CO,V,AA,8,,,0,175,341,596274,3670770,4267044,4267044,28/11/2018,28/11/2023
812670,CO,V,AA,9,,,0,171,143,583071,543110,1126181,1126181,/ /,/ /
812671,CO,V,AA,14,,,0,196,303,893558,325618,1219176,1219176,/ /,/ /


In [41]:
# Eliminar los apartamentos duplicados y quedarte solo con un registro por padrón
filtro_dep = filtro_dep.drop_duplicates(subset='pad').reset_index(drop=True)

# Mostrar el DataFrame filtrado
filtro_dep.head()

Unnamed: 0,cod_reg,cod_dep,cod_loc,pad,block,EP,uni,sup_predio,sup_edificada,V_cat_terreno,V_cat_mejoras,V_cat_total,V_impuestos,Fecha_UDJ,Vigencia_UDJ
0,CO,V,AA,5,,,0,130,138,669500,374348,1043848,1043848,/ /,/ /
1,CO,V,AA,7,,,0,206,168,873257,319436,1192693,1192693,/ /,/ /
2,CO,V,AA,8,,,0,175,341,596274,3670770,4267044,4267044,28/11/2018,28/11/2023
3,CO,V,AA,9,,,0,171,143,583071,543110,1126181,1126181,/ /,/ /
4,CO,V,AA,14,,,0,196,303,893558,325618,1219176,1219176,/ /,/ /


In [42]:
#CUantas filas tiene el archivo
num_filas = filtro_dep.shape[0]

print(num_filas)

200177


In [43]:
# Reemplazar cadenas vacías o '/  /' por NaN
filtro_dep['Fecha_UDJ'] = filtro_dep['Fecha_UDJ'].replace(['', '/  /'], pd.NA)

# Separar la columna 'Fecha' en tres nuevas columnas, manejando valores NaN
filtro_dep[['dia', 'mes', 'anio']] = filtro_dep['Fecha_UDJ'].str.split('/', expand=True)

# Convertir las nuevas columnas a tipo entero, usando fillna para evitar errores
filtro_dep['dia'] = filtro_dep['dia'].astype('Int64')  # 'Int64' permite valores NA
filtro_dep['mes'] = filtro_dep['mes'].astype('Int64')
filtro_dep['anio'] = filtro_dep['anio'].astype('Int64')

# Mostrar el DataFrame resultante
filtro_dep.head()

Unnamed: 0,cod_reg,cod_dep,cod_loc,pad,block,EP,uni,sup_predio,sup_edificada,V_cat_terreno,V_cat_mejoras,V_cat_total,V_impuestos,Fecha_UDJ,Vigencia_UDJ,dia,mes,anio
0,CO,V,AA,5,,,0,130,138,669500,374348,1043848,1043848,,/ /,,,
1,CO,V,AA,7,,,0,206,168,873257,319436,1192693,1192693,,/ /,,,
2,CO,V,AA,8,,,0,175,341,596274,3670770,4267044,4267044,28/11/2018,28/11/2023,28.0,11.0,2018.0
3,CO,V,AA,9,,,0,171,143,583071,543110,1126181,1126181,,/ /,,,
4,CO,V,AA,14,,,0,196,303,893558,325618,1219176,1219176,,/ /,,,


In [44]:
# Ver los tipos de datos de cada columna
tipos_datos = filtro_dep.dtypes

# Mostrar los tipos de datos
print(tipos_datos)

cod_reg          object
cod_dep          object
cod_loc          object
pad               int64
block            object
EP               object
uni               int64
sup_predio        int64
sup_edificada     int64
V_cat_terreno     int64
V_cat_mejoras     int64
V_cat_total       int64
V_impuestos       int64
Fecha_UDJ        object
Vigencia_UDJ     object
dia               Int64
mes               Int64
anio              Int64
dtype: object


In [45]:
filtro_dep = filtro_dep[filtro_dep['anio'] >= 1997]

# Contar la cantidad de registros por año
conteo_por_anio = filtro_dep.groupby('anio').size().reset_index(name='cantidad_registros')

print(conteo_por_anio)

    anio  cantidad_registros
0   1997                   1
1   2001                   5
2   2002                 279
3   2003                 862
4   2004                1680
5   2005                1416
6   2006                1457
7   2007                1780
8   2008                2319
9   2009                2081
10  2010                2644
11  2011                3130
12  2012                2484
13  2013                2786
14  2014                2606
15  2015                2578
16  2016                2615
17  2017                3189
18  2018                2834
19  2019                2915
20  2020                2695
21  2021                3260
22  2022                6510
23  2023                6699
24  2024                4456


In [46]:
#Permisos Intendencia Montevideo
# Leer el archivo CSV y asignar los nombres a las columnas
Permisos = pd.read_csv('C:/Users/Nico/Desktop/Python/permisos_construccion.csv', sep=';')

Permisos.rename(columns={'padron': 'pad'}, inplace=True)
# Mostrar las primeras filas del archivo
Permisos.head()

Unnamed: 0,pad,destino,area,calle,puerta,letra,anio,mes,expediente,tipo_obra
0,2,Vivienda ...,26.0,MIGUELETE ...,1420.0,,2000,9,4113-016778-00,Obra Nueva
1,8,Comercio ...,315.0,LA PAZ ...,1439.0,,2013,7,4113-007575-13,Obra Nueva
2,8,Comercio ...,5.0,LA PAZ ...,1439.0,,2019,3,2018-4113-98-001306,Regularizacion - Año
3,9,Vivienda ...,14.84,LA PAZ ...,1431.0,,1998,12,4113-016126-98,Reforma
4,15,Vivienda ...,49.85,PIEDRA ALTA ...,1779.0,,2004,3,4113-014456-00,Modificacion en Obra


In [47]:
# Ver los tipos de datos de cada columna
tipos_datos = Permisos.dtypes

# Mostrar los tipos de datos
print(tipos_datos)

pad             int64
destino        object
area          float64
calle          object
puerta        float64
letra          object
anio            int64
mes             int64
expediente     object
tipo_obra      object
dtype: object


In [48]:
#Crear en permisos la variable cod_dep
Permisos['cod_dep'] = 'V'
Permisos.head()

Unnamed: 0,pad,destino,area,calle,puerta,letra,anio,mes,expediente,tipo_obra,cod_dep
0,2,Vivienda ...,26.0,MIGUELETE ...,1420.0,,2000,9,4113-016778-00,Obra Nueva,V
1,8,Comercio ...,315.0,LA PAZ ...,1439.0,,2013,7,4113-007575-13,Obra Nueva,V
2,8,Comercio ...,5.0,LA PAZ ...,1439.0,,2019,3,2018-4113-98-001306,Regularizacion - Año,V
3,9,Vivienda ...,14.84,LA PAZ ...,1431.0,,1998,12,4113-016126-98,Reforma,V
4,15,Vivienda ...,49.85,PIEDRA ALTA ...,1779.0,,2004,3,4113-014456-00,Modificacion en Obra,V


In [49]:
# Calcular la suma total de 'conteo_destino'
conteo_pad = Permisos['pad'].count()

# Mostrar la suma total
print(f"Suma total de conteo_pad: {conteo_pad}")

Suma total de conteo_pad: 39511


In [50]:
### Saber cantidad de filas y columnas
Permisos.shape

(39511, 11)

In [51]:
# Ordenar el DataFrame por Padron (ascendente), anio, mes, area en orden descendente me quedo con el ùltimo permiso aprobado para ese padron y el area màs grande de esa fecha.
Permisos_ordenado = Permisos.sort_values(by=['pad','anio', 'mes', 'area'], ascending=[True,False, False, False])

# Mostrar el DataFrame ordenado
Permisos_ordenado.head(15)


Unnamed: 0,pad,destino,area,calle,puerta,letra,anio,mes,expediente,tipo_obra,cod_dep
0,2,Vivienda ...,26.0,MIGUELETE ...,1420.0,,2000,9,4113-016778-00,Obra Nueva,V
2,8,Comercio ...,5.0,LA PAZ ...,1439.0,,2019,3,2018-4113-98-001306,Regularizacion - Año,V
1,8,Comercio ...,315.0,LA PAZ ...,1439.0,,2013,7,4113-007575-13,Obra Nueva,V
3,9,Vivienda ...,14.84,LA PAZ ...,1431.0,,1998,12,4113-016126-98,Reforma,V
4,15,Vivienda ...,49.85,PIEDRA ALTA ...,1779.0,,2004,3,4113-014456-00,Modificacion en Obra,V
6,27,Comercio ...,284.0,LA PAZ ...,1461.0,,2021,9,2021-4113-98-000660,Reforma a Regularizar,V
5,27,Comercio ...,320.0,LA PAZ ...,1461.0,,2014,9,2016-4118-98-000212,Obra Nueva,V
8,32,Comercio ...,353.0,PIEDRA ALTA ...,1771.0,,2008,4,2016-4113-98-001655,Regularizacion - Año,V
7,32,Comercio ...,36.0,PIEDRA ALTA ...,1771.0,,2008,4,2016-4113-98-001655,Obra Nueva,V
9,43,"Vivienda,Comercio,Otros ...",147.0,MINAS ...,1803.0,,2022,11,2022-4113-98-001048,Incorporacion A.P.H.,V


In [52]:
# Primero, eliminamos duplicados por padròn para quedarnos con el ùtimo registro en año para ese padròn.
p_sin_duplicados = Permisos_ordenado.drop_duplicates(subset=['pad','anio','mes'])

p_sin_duplicados.head(15)

Unnamed: 0,pad,destino,area,calle,puerta,letra,anio,mes,expediente,tipo_obra,cod_dep
0,2,Vivienda ...,26.0,MIGUELETE ...,1420.0,,2000,9,4113-016778-00,Obra Nueva,V
2,8,Comercio ...,5.0,LA PAZ ...,1439.0,,2019,3,2018-4113-98-001306,Regularizacion - Año,V
1,8,Comercio ...,315.0,LA PAZ ...,1439.0,,2013,7,4113-007575-13,Obra Nueva,V
3,9,Vivienda ...,14.84,LA PAZ ...,1431.0,,1998,12,4113-016126-98,Reforma,V
4,15,Vivienda ...,49.85,PIEDRA ALTA ...,1779.0,,2004,3,4113-014456-00,Modificacion en Obra,V
6,27,Comercio ...,284.0,LA PAZ ...,1461.0,,2021,9,2021-4113-98-000660,Reforma a Regularizar,V
5,27,Comercio ...,320.0,LA PAZ ...,1461.0,,2014,9,2016-4118-98-000212,Obra Nueva,V
8,32,Comercio ...,353.0,PIEDRA ALTA ...,1771.0,,2008,4,2016-4113-98-001655,Regularizacion - Año,V
9,43,"Vivienda,Comercio,Otros ...",147.0,MINAS ...,1803.0,,2022,11,2022-4113-98-001048,Incorporacion A.P.H.,V
12,52,Vivienda ...,50.0,LA PAZ ...,1577.0,,2005,2,4113-000339-05,Reforma,V


In [53]:
#Eliminamos fechas anteriores a 1999
p_sin_duplicados = p_sin_duplicados[p_sin_duplicados['anio'] >= 1997]

# Contar cuántos registros hay por 'anio' y 'mes'
resultado = p_sin_duplicados.groupby(['anio']).size().reset_index(name ='Cantidad_de_registros')

# Mostrar el resultado
print(resultado)

    anio  Cantidad_de_registros
0   1997                     19
1   1998                   1044
2   1999                   1237
3   2000                   1088
4   2001                    655
5   2002                    688
6   2003                    986
7   2004                   1115
8   2005                   1358
9   2006                   1224
10  2007                   1309
11  2008                   1430
12  2009                   1340
13  2010                   1330
14  2011                   1249
15  2012                   1156
16  2013                   1071
17  2014                   1169
18  2015                   1003
19  2016                    662
20  2017                    963
21  2018                    794
22  2019                    798
23  2020                    559
24  2021                    706
25  2022                    784
26  2023                    626
27  2024                    316


In [54]:
print(resultado.columns)


Index(['anio', 'Cantidad_de_registros'], dtype='object')


In [55]:
# Machear los DataFrames usando un left join
cat_per = pd.merge(filtro_dep, Permisos, on=['anio','mes','pad'], how='left')

# Machear los DataFrames usando un left join
per_cat = pd.merge(p_sin_duplicados,filtro_dep, on=['anio','mes','pad'], how='left')

In [56]:
#Mostrar cantidad de filas y columnas del primer Dataframe resultante
cat_per.shape

(63986, 26)

In [57]:
#Mosstrar el segundo Dataframe resultante
per_cat.shape

(26679, 26)

In [58]:
# Guardar el DataFrame macheado como CSV de catastro
cat_per.to_csv('C:/Users/Nico/Desktop/Python/cat_per.csv', index=False)

In [59]:
# Guardar el DataFrame macheado como CSV de permisos
per_cat.to_csv('C:/Users/Nico/Desktop/Python/per_cat.csv', index=False)

In [60]:
#Caluclar la proporcion y cantidad de registros por regimen
conteo_codreg = per_cat.groupby('cod_reg').size().reset_index(name='cantidad_expedientes')
conteo_codreg['porcentaje'] = ((conteo_codreg['cantidad_expedientes'] / conteo_codreg['cantidad_expedientes'].sum()) * 100).round(2)
conteo_codreg

Unnamed: 0,cod_reg,cantidad_expedientes,porcentaje
0,CO,1071,93.29
1,PH,77,6.71


In [61]:
#Caluclar la proporcion y cantidad de registros por destino
conteo_destino = per_cat.groupby('destino').size().reset_index(name='cantidades por destino')
conteo_destino['porcentaje_destino'] = ((conteo_destino['cantidades por destino'] / conteo_destino['cantidades por destino'].sum()) * 100).round(2)
conteo_destino

Unnamed: 0,destino,cantidades por destino,porcentaje_destino
0,Comercio ...,4567,17.12
1,"Comercio, Industria, Otros ...",3,0.01
2,"Comercio,Industria ...",22,0.08
3,"Comercio,Otros ...",102,0.38
4,Desconocido ...,1468,5.5
5,Industria ...,828,3.1
6,"Industria,Otros ...",26,0.1
7,Otros ...,835,3.13
8,Vivienda ...,16692,62.57
9,"Vivienda, Industria, Otros ...",5,0.02


In [62]:
#Ver todos los destinos
print(per_cat['destino'].unique())

['Vivienda                                          '
 'Comercio                                          '
 'Vivienda,Comercio,Otros                           '
 'Vivienda,Otros                                    '
 'Otros                                             '
 'Industria                                         '
 'Desconocido                                       '
 'Comercio,Industria                                '
 'Vivienda,Comercio                                 '
 'Comercio,Otros                                    '
 'Vivienda,Industria                                '
 'Industria,Otros                                   '
 'Vivienda, Industria, Otros                        '
 'Comercio, Industria, Otros                        '
 'Vivienda,Comercio,Industria                       ']


In [63]:
per_cat['destino'] = per_cat['destino'].str.strip()

In [64]:
#Recodificar destinos
mapeo_destinos = {
    'Comercio': 'Comercio',
    'Comercio, Industria, Otros': 'Varios destinos',
    'Comercio,Industria': 'Varios destinos',
    'Comercio,Otros': 'Varios destinos',
    'Industria': 'Industria',
    'Industria,Otros': 'Varios destinos',
    'Vivienda': 'Vivienda',
    'Vivienda, Industria, Otros': 'Varios destinos',
    'Vivienda,Comercio': 'Varios destinos',
    'Vivienda,Comercio,Industria': 'Varios destinos',
    'Vivienda,Comercio,Otros': 'Varios destinos',
    'Vivienda,Industria': 'Varios destinos',
    'Vivienda,Otros': 'Varios destinos',
    'Desconocido' : 'Sin destino definido',
    'Otros': 'Sin destino definido'         
}

per_cat['Nuevo_Destino'] = per_cat['destino'].map(mapeo_destinos)

per_cat.head()

Unnamed: 0,pad,destino,area,calle,puerta,letra,anio,mes,expediente,tipo_obra,...,sup_predio,sup_edificada,V_cat_terreno,V_cat_mejoras,V_cat_total,V_impuestos,Fecha_UDJ,Vigencia_UDJ,dia,Nuevo_Destino
0,2,Vivienda,26.0,MIGUELETE ...,1420.0,,2000,9,4113-016778-00,Obra Nueva,...,,,,,,,,,,Vivienda
1,8,Comercio,5.0,LA PAZ ...,1439.0,,2019,3,2018-4113-98-001306,Regularizacion - Año,...,,,,,,,,,,Comercio
2,8,Comercio,315.0,LA PAZ ...,1439.0,,2013,7,4113-007575-13,Obra Nueva,...,,,,,,,,,,Comercio
3,9,Vivienda,14.84,LA PAZ ...,1431.0,,1998,12,4113-016126-98,Reforma,...,,,,,,,,,,Vivienda
4,15,Vivienda,49.85,PIEDRA ALTA ...,1779.0,,2004,3,4113-014456-00,Modificacion en Obra,...,,,,,,,,,,Vivienda


In [65]:
#ver los nuevos deestinos
print(per_cat['Nuevo_Destino'].unique())

# Agrupar por la nueva categoría
conteo_Nuevo_Destino = per_cat.groupby('Nuevo_Destino').size().reset_index(name='cantidades por destino')
conteo_Nuevo_Destino

['Vivienda' 'Comercio' 'Varios destinos' 'Sin destino definido'
 'Industria']


Unnamed: 0,Nuevo_Destino,cantidades por destino
0,Comercio,4567
1,Industria,828
2,Sin destino definido,2303
3,Varios destinos,2289
4,Vivienda,16692


In [66]:
conteo_Nuevo_Destino['porcentaje_Nuevo_Destino'] = ((conteo_Nuevo_Destino['cantidades por destino'] / conteo_Nuevo_Destino['cantidades por destino'].sum()) * 100).round(2)
conteo_Nuevo_Destino

Unnamed: 0,Nuevo_Destino,cantidades por destino,porcentaje_Nuevo_Destino
0,Comercio,4567,17.12
1,Industria,828,3.1
2,Sin destino definido,2303,8.63
3,Varios destinos,2289,8.58
4,Vivienda,16692,62.57


In [67]:
#Ver destinos y sus cantidades
conteo_tipo_obra = per_cat.groupby('tipo_obra').size().reset_index(name='cantidad por tipo de obra')
conteo_tipo_obra

Unnamed: 0,tipo_obra,cantidad por tipo de obra
0,A regularizar,22
1,Autorizada,79
2,Cielo A. Autorizada,5
3,Demolicion,60
4,Desconocido,1109
5,Estacionamiento,42
6,Galpon,49
7,Incorporacion A.P.H.,748
8,Incorporación a PH,15
9,Marquesina,16


In [68]:
tabla_Regimen_tipoObra = pd.pivot_table(per_cat, index='tipo_obra', columns='cod_reg', aggfunc='size', fill_value=0)
tabla_Regimen_tipoObra

cod_reg,CO,PH
tipo_obra,Unnamed: 1_level_1,Unnamed: 2_level_1
Demolicion,1,0
Desconocido,1,0
Incorporacion A.P.H.,3,1
Incorporación a PH,1,0
Modificacion en Obra,0,1
Obra Nueva,453,17
Obra nueva / ampliación,1,0
Reciclaje,0,1
Reforma,281,13
Reforma a Regularizar,3,4


In [69]:
from dbfread import DBF
import pandas as pd

# Ruta del archivo .dbf
dbf_file = 'C:/Users/Nico/Desktop/Python/v_ce_permisos_construccion_geom/v_ce_permisos_construccion_geom.dbf'

# Leer el archivo DBF
dbf_table = DBF(dbf_file, encoding='latin1')

# Convertir a un DataFrame de pandas
df = pd.DataFrame(iter(dbf_table))

# Guardar el DataFrame como un archivo CSV
df.to_csv('C:/Users/Nico/Desktop/Python/v_ce_permisos_construccion_geom/v_ce_permisos_construccion_geom.csv', index=False, sep=';')

df

Unnamed: 0,GID,EXPEDIENTE,FECHA_INI,FECHA_APRO,PADRON,UNIDAD,DSC_TIPO_T,DSC_DESTIN,DSC_REGIME,DSC_TIPO_O,DSC_CATEGO,CONSTRUCTO,AREA_EDIF
0,25807875,2017-4113-98-000263,2017-03-29,2017-03-09,123696,,OBRAS/CONSTRUCCIONES,Comercio,ComÃºn,Obra Nueva,Mediano,Desconocido,602.00
1,25807875,2017-4113-98-000263,2017-03-29,2017-03-09,123696,,OBRAS/CONSTRUCCIONES,Comercio,ComÃºn,Regularizacion - AÃ±o,Mediano,Desconocido,88.00
2,25807881,4113-000138-14,2014-01-30,2014-01-29,123697,,OBRAS/CONSTRUCCIONES,Vivienda,ComÃºn,Obra Nueva,Mediano,Desconocido,117.00
3,25807910,2016-4113-98-001590,2015-11-13,2016-02-04,123687,,OBRAS/CONSTRUCCIONES,"Vivienda,Otros",ComÃºn,Regularizacion - AÃ±o,Mediano,Desconocido,260.70
4,25807942,4113-001589-05,2005-03-15,2005-03-18,96475,,OBRAS/CONSTRUCCIONES,Comercio,ComÃºn,Obra Nueva,EconÃ³mico o Sencillo,TRAMIL SA,1672.00
...,...,...,...,...,...,...,...,...,...,...,...,...,...
40781,93662058,2016-4197-98-000081,2015-12-29,2016-02-11,405569,FRACCION D,OBRAS/CONSTRUCCIONES,"Vivienda,Otros",Propiedad Horizontal,Obra Nueva,Mediano,Desconocido,338.80
40782,93662058,2016-4197-98-000082,2015-12-29,2016-02-11,405569,FRACCION E,OBRAS/CONSTRUCCIONES,Vivienda,Propiedad Horizontal,Obra Nueva,Mediano,Desconocido,2339.98
40783,96963329,GERPC-7-873360,2024-04-26,2024-09-18,432276,,OBRAS/CONSTRUCCIONES,Desconocido,Desconocido,Obra nueva / ampliaciÃ³n,Desconocido,Desconocido,7574.00
40784,109087693,2016-4113-98-000278,2016-03-17,2016-03-17,65231,,OBRAS/CONSTRUCCIONES,Comercio,ComÃºn,Reforma,Mediano,Desconocido,9.00


In [70]:
#Levantar nuevo archivo descargado de la intendencia con catastro incorporado
Cat_Permisos = pd.read_csv('C:/Users/Nico/Desktop/Python/v_ce_permisos_construccion_geom/v_ce_permisos_construccion_geom.csv', sep=';' , encoding='cp1252')

Cat_Permisos


Unnamed: 0,GID,EXPEDIENTE,FECHA_INI,FECHA_APRO,PADRON,UNIDAD,DSC_TIPO_T,DSC_DESTIN,DSC_REGIME,DSC_TIPO_O,DSC_CATEGO,CONSTRUCTO,AREA_EDIF
0,25807875,2017-4113-98-000263,2017-03-29,2017-03-09,123696,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Obra Nueva,Mediano,Desconocido,602.00
1,25807875,2017-4113-98-000263,2017-03-29,2017-03-09,123696,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Regularizacion - AÃƒÂ±o,Mediano,Desconocido,88.00
2,25807881,4113-000138-14,2014-01-30,2014-01-29,123697,,OBRAS/CONSTRUCCIONES,Vivienda,ComÃƒÂºn,Obra Nueva,Mediano,Desconocido,117.00
3,25807910,2016-4113-98-001590,2015-11-13,2016-02-04,123687,,OBRAS/CONSTRUCCIONES,"Vivienda,Otros",ComÃƒÂºn,Regularizacion - AÃƒÂ±o,Mediano,Desconocido,260.70
4,25807942,4113-001589-05,2005-03-15,2005-03-18,96475,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Obra Nueva,EconÃƒÂ³mico o Sencillo,TRAMIL SA,1672.00
...,...,...,...,...,...,...,...,...,...,...,...,...,...
40781,93662058,2016-4197-98-000081,2015-12-29,2016-02-11,405569,FRACCION D,OBRAS/CONSTRUCCIONES,"Vivienda,Otros",Propiedad Horizontal,Obra Nueva,Mediano,Desconocido,338.80
40782,93662058,2016-4197-98-000082,2015-12-29,2016-02-11,405569,FRACCION E,OBRAS/CONSTRUCCIONES,Vivienda,Propiedad Horizontal,Obra Nueva,Mediano,Desconocido,2339.98
40783,96963329,GERPC-7-873360,2024-04-26,2024-09-18,432276,,OBRAS/CONSTRUCCIONES,Desconocido,Desconocido,Obra nueva / ampliaciÃƒÂ³n,Desconocido,Desconocido,7574.00
40784,109087693,2016-4113-98-000278,2016-03-17,2016-03-17,65231,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Reforma,Mediano,Desconocido,9.00


In [71]:
# Ver los tipos de datos de cada columna
tipos_datos = Cat_Permisos.dtypes

# Mostrar los tipos de datos
print(tipos_datos)


GID             int64
EXPEDIENTE     object
FECHA_INI      object
FECHA_APRO     object
PADRON          int64
UNIDAD         object
DSC_TIPO_T     object
DSC_DESTIN     object
DSC_REGIME     object
DSC_TIPO_O     object
DSC_CATEGO     object
CONSTRUCTO     object
AREA_EDIF     float64
dtype: object


In [33]:
# Convertir a formato datetime
Cat_Permisos['FECHA_APRO'] = pd.to_datetime(df['FECHA_APRO'], format='%Y/%m/%d')

# Convertir la columna FECHA_INI a datetime utilizando .loc[]
Cat_Permisos['FECHA_INI'] = pd.to_datetime(df['FECHA_INI'], format='%Y/%m/%d')

# Extraer el año
Cat_Permisos['ANIO_APRO'] = Cat_Permisos['FECHA_APRO'].dt.year

# Extraer el mes
Cat_Permisos['MES_APRO'] = Cat_Permisos['FECHA_APRO'].dt.month

Cat_Permisos

Unnamed: 0,GID,EXPEDIENTE,FECHA_INI,FECHA_APRO,PADRON,UNIDAD,DSC_TIPO_T,DSC_DESTIN,DSC_REGIME,DSC_TIPO_O,DSC_CATEGO,CONSTRUCTO,AREA_EDIF,ANIO_APRO,MES_APRO
0,25807875,2017-4113-98-000263,2017-03-29,2017-03-09,123696,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Obra Nueva,Mediano,Desconocido,602.00,2017,3
1,25807875,2017-4113-98-000263,2017-03-29,2017-03-09,123696,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Regularizacion - AÃƒÂ±o,Mediano,Desconocido,88.00,2017,3
2,25807881,4113-000138-14,2014-01-30,2014-01-29,123697,,OBRAS/CONSTRUCCIONES,Vivienda,ComÃƒÂºn,Obra Nueva,Mediano,Desconocido,117.00,2014,1
3,25807910,2016-4113-98-001590,2015-11-13,2016-02-04,123687,,OBRAS/CONSTRUCCIONES,"Vivienda,Otros",ComÃƒÂºn,Regularizacion - AÃƒÂ±o,Mediano,Desconocido,260.70,2016,2
4,25807942,4113-001589-05,2005-03-15,2005-03-18,96475,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Obra Nueva,EconÃƒÂ³mico o Sencillo,TRAMIL SA,1672.00,2005,3
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
40781,93662058,2016-4197-98-000081,2015-12-29,2016-02-11,405569,FRACCION D,OBRAS/CONSTRUCCIONES,"Vivienda,Otros",Propiedad Horizontal,Obra Nueva,Mediano,Desconocido,338.80,2016,2
40782,93662058,2016-4197-98-000082,2015-12-29,2016-02-11,405569,FRACCION E,OBRAS/CONSTRUCCIONES,Vivienda,Propiedad Horizontal,Obra Nueva,Mediano,Desconocido,2339.98,2016,2
40783,96963329,GERPC-7-873360,2024-04-26,2024-09-18,432276,,OBRAS/CONSTRUCCIONES,Desconocido,Desconocido,Obra nueva / ampliaciÃƒÂ³n,Desconocido,Desconocido,7574.00,2024,9
40784,109087693,2016-4113-98-000278,2016-03-17,2016-03-17,65231,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Reforma,Mediano,Desconocido,9.00,2016,3


In [34]:
#Filtro años anteriores superiores a 1997
Cat_Permisos = Cat_Permisos[Cat_Permisos['ANIO_APRO'] >= 1997]

In [35]:
Cat_Permisos.head(3)

Unnamed: 0,GID,EXPEDIENTE,FECHA_INI,FECHA_APRO,PADRON,UNIDAD,DSC_TIPO_T,DSC_DESTIN,DSC_REGIME,DSC_TIPO_O,DSC_CATEGO,CONSTRUCTO,AREA_EDIF,ANIO_APRO,MES_APRO
0,25807875,2017-4113-98-000263,2017-03-29,2017-03-09,123696,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Obra Nueva,Mediano,Desconocido,602.0,2017,3
1,25807875,2017-4113-98-000263,2017-03-29,2017-03-09,123696,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Regularizacion - AÃƒÂ±o,Mediano,Desconocido,88.0,2017,3
2,25807881,4113-000138-14,2014-01-30,2014-01-29,123697,,OBRAS/CONSTRUCCIONES,Vivienda,ComÃƒÂºn,Obra Nueva,Mediano,Desconocido,117.0,2014,1


In [None]:
Cat_Permisos['T_Demora'] = (Cat_Permisos['FECHA_APRO'] - Cat_Permisos['FECHA_INI']).dt.days
Cat_Permisos['año_ini'] = Cat_Permisos['FECHA_INI'].dt.year


Cat_Permisos

In [37]:
print(Cat_Permisos['AREA_EDIF'].dtype)

float64


In [38]:
#Fecha de aprobado el permiso y fecha de inicio del mismo
Cat_Permisos.shape

Cat_Permisos

Unnamed: 0,GID,EXPEDIENTE,FECHA_INI,FECHA_APRO,PADRON,UNIDAD,DSC_TIPO_T,DSC_DESTIN,DSC_REGIME,DSC_TIPO_O,DSC_CATEGO,CONSTRUCTO,AREA_EDIF,ANIO_APRO,MES_APRO,T_Demora,año_ini
0,25807875,2017-4113-98-000263,2017-03-29,2017-03-09,123696,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Obra Nueva,Mediano,Desconocido,602.00,2017,3,-20,2017
1,25807875,2017-4113-98-000263,2017-03-29,2017-03-09,123696,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Regularizacion - AÃƒÂ±o,Mediano,Desconocido,88.00,2017,3,-20,2017
2,25807881,4113-000138-14,2014-01-30,2014-01-29,123697,,OBRAS/CONSTRUCCIONES,Vivienda,ComÃƒÂºn,Obra Nueva,Mediano,Desconocido,117.00,2014,1,-1,2014
3,25807910,2016-4113-98-001590,2015-11-13,2016-02-04,123687,,OBRAS/CONSTRUCCIONES,"Vivienda,Otros",ComÃƒÂºn,Regularizacion - AÃƒÂ±o,Mediano,Desconocido,260.70,2016,2,83,2015
4,25807942,4113-001589-05,2005-03-15,2005-03-18,96475,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Obra Nueva,EconÃƒÂ³mico o Sencillo,TRAMIL SA,1672.00,2005,3,3,2005
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
40781,93662058,2016-4197-98-000081,2015-12-29,2016-02-11,405569,FRACCION D,OBRAS/CONSTRUCCIONES,"Vivienda,Otros",Propiedad Horizontal,Obra Nueva,Mediano,Desconocido,338.80,2016,2,44,2015
40782,93662058,2016-4197-98-000082,2015-12-29,2016-02-11,405569,FRACCION E,OBRAS/CONSTRUCCIONES,Vivienda,Propiedad Horizontal,Obra Nueva,Mediano,Desconocido,2339.98,2016,2,44,2015
40783,96963329,GERPC-7-873360,2024-04-26,2024-09-18,432276,,OBRAS/CONSTRUCCIONES,Desconocido,Desconocido,Obra nueva / ampliaciÃƒÂ³n,Desconocido,Desconocido,7574.00,2024,9,145,2024
40784,109087693,2016-4113-98-000278,2016-03-17,2016-03-17,65231,,OBRAS/CONSTRUCCIONES,Comercio,ComÃƒÂºn,Reforma,Mediano,Desconocido,9.00,2016,3,0,2016


In [39]:
PROM_DEMORA_por_año = Cat_Permisos.groupby('año_ini')['T_Demora'].mean().reset_index()

PROM_DEMORA_por_año.rename(columns={'T_Demora': 'Promedio_T_Demora'}, inplace=True)

PROM_DEMORA_por_año['Promedio_T_Demora'] = PROM_DEMORA_por_año['Promedio_T_Demora'].astype(int)

PROM_DEMORA_por_año

Unnamed: 0,año_ini,Promedio_T_Demora
0,1997,714
1,1998,732
2,1999,665
3,2000,700
4,2001,721
5,2002,229
6,2003,37
7,2004,29
8,2005,25
9,2006,28


In [40]:
#VER CONTENIDO DE LAS VARIABLES
print(Cat_Permisos['DSC_REGIME'].unique())
print(Cat_Permisos['DSC_CATEGO'].unique())
print(Cat_Permisos['DSC_DESTIN'].unique())

['ComÃƒÂºn' 'Desconocido' 'Propiedad Horizontal' 'IncorporaciÃƒÂ³n']
['Mediano' 'EconÃƒÂ³mico o Sencillo' 'Confortable' 'Desconocido'
 'SUNTUOSO']
['Comercio' 'Vivienda' 'Vivienda,Otros' 'Industria' 'Otros'
 'Vivienda,Comercio' 'Desconocido' 'Industria,Otros' 'Vivienda,Industria'
 'Comercio,Industria' 'Vivienda,Comercio,Industria' 'Comercio,Otros'
 'Vivienda, Industria, Otros' 'Comercio, Industria, Otros'
 'Vivienda,Comercio,Otros']


In [None]:
#Recodificar Tipo de obra
mapeo_DSC_REGIME = {
    'ComÃƒÂºn': 'PC',
    'IncorporaciÃƒÂ³n': 'PH',
    'Propiedad Horizontal': 'PH',
    'Desconocido': 'Desconocido'     
}

Cat_Permisos['DSC_REGIME'] = Cat_Permisos['DSC_REGIME'].map(mapeo_DSC_REGIME)

print(Cat_Permisos['DSC_REGIME'].unique())

In [None]:
#Recodificar destinos
mapeo_DSC_DESTIN = {
    'Comercio': 'Comercio',
    'Comercio, Industria, Otros': 'Varios destinos',
    'Comercio,Industria': 'Varios destinos',
    'Comercio,Otros': 'Varios destinos',
    'Industria': 'Industria',
    'Industria,Otros': 'Varios destinos',
    'Vivienda': 'Vivienda',
    'Vivienda, Industria, Otros': 'Varios destinos',
    'Vivienda,Comercio': 'Varios destinos',
    'Vivienda,Comercio,Industria': 'Varios destinos',
    'Vivienda,Comercio,Otros': 'Varios destinos',
    'Vivienda,Industria': 'Varios destinos',
    'Vivienda,Otros': 'Varios destinos',
    'Desconocido' : 'Sin destino definido',
    'Otros': 'Sin destino definido'         
}

Cat_Permisos['Nuevo_Destino'] = Cat_Permisos['DSC_DESTIN'].map(mapeo_DSC_DESTIN)

print(Cat_Permisos['Nuevo_Destino'].unique())

In [43]:
Cat_Permisos

Unnamed: 0,GID,EXPEDIENTE,FECHA_INI,FECHA_APRO,PADRON,UNIDAD,DSC_TIPO_T,DSC_DESTIN,DSC_REGIME,DSC_TIPO_O,DSC_CATEGO,CONSTRUCTO,AREA_EDIF,ANIO_APRO,MES_APRO,T_Demora,año_ini,Nuevo_Destino
0,25807875,2017-4113-98-000263,2017-03-29,2017-03-09,123696,,OBRAS/CONSTRUCCIONES,Comercio,PC,Obra Nueva,Mediano,Desconocido,602.00,2017,3,-20,2017,Comercio
1,25807875,2017-4113-98-000263,2017-03-29,2017-03-09,123696,,OBRAS/CONSTRUCCIONES,Comercio,PC,Regularizacion - AÃƒÂ±o,Mediano,Desconocido,88.00,2017,3,-20,2017,Comercio
2,25807881,4113-000138-14,2014-01-30,2014-01-29,123697,,OBRAS/CONSTRUCCIONES,Vivienda,PC,Obra Nueva,Mediano,Desconocido,117.00,2014,1,-1,2014,Vivienda
3,25807910,2016-4113-98-001590,2015-11-13,2016-02-04,123687,,OBRAS/CONSTRUCCIONES,"Vivienda,Otros",PC,Regularizacion - AÃƒÂ±o,Mediano,Desconocido,260.70,2016,2,83,2015,Varios destinos
4,25807942,4113-001589-05,2005-03-15,2005-03-18,96475,,OBRAS/CONSTRUCCIONES,Comercio,PC,Obra Nueva,EconÃƒÂ³mico o Sencillo,TRAMIL SA,1672.00,2005,3,3,2005,Comercio
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
40781,93662058,2016-4197-98-000081,2015-12-29,2016-02-11,405569,FRACCION D,OBRAS/CONSTRUCCIONES,"Vivienda,Otros",PH,Obra Nueva,Mediano,Desconocido,338.80,2016,2,44,2015,Varios destinos
40782,93662058,2016-4197-98-000082,2015-12-29,2016-02-11,405569,FRACCION E,OBRAS/CONSTRUCCIONES,Vivienda,PH,Obra Nueva,Mediano,Desconocido,2339.98,2016,2,44,2015,Vivienda
40783,96963329,GERPC-7-873360,2024-04-26,2024-09-18,432276,,OBRAS/CONSTRUCCIONES,Desconocido,Desconocido,Obra nueva / ampliaciÃƒÂ³n,Desconocido,Desconocido,7574.00,2024,9,145,2024,Sin destino definido
40784,109087693,2016-4113-98-000278,2016-03-17,2016-03-17,65231,,OBRAS/CONSTRUCCIONES,Comercio,PC,Reforma,Mediano,Desconocido,9.00,2016,3,0,2016,Comercio


In [None]:
#Recodificar Tipo de obra
mapeo_DSC_TIPO_O = {
    'Obra Nueva': 'Obra Nueva',
    'Regularizacion - Año' : 'Regularización',
    'Modificacion en Obra' : 'Otros',
    'Reforma': 'Reforma',
    'Reforma a Regularizar': 'Regularización',
    'Incorporacion A.P.H.': 'Incorporacion P.H.',
    'Pilotaje': 'Otros',
    'Estacionamiento': 'Otros',
    'Obra nueva / ampliaci??n': 'Obra Nueva',
    'Demolicion': 'Demolición',
    'A regularizar': 'Regularización',
    'Autorizada': 'Otros',
    'Reciclaje': 'Otros',
    'Regularizaci??n de reforma': 'Regularización',
    'Desconocido' : 'Sin tipo de obra definido',
    'Galpon' : 'Otros',
    'Marquesina':'Otros',
    'Toldo':'Otros',
    'A ocupar':'Otros',
    'Cielo A. Autorizada':'Otros',
    'Cielo A. A regularizar':'Otros',
    '       ':'Sin tipo de obra definido',
    'Incorporaci??n a PH': 'Incorporacion P.H.'         
}

Cat_Permisos['Tipo_Obra'] = Cat_Permisos['DSC_TIPO_O'].map(mapeo_DSC_TIPO_O)

print(Cat_Permisos['Tipo_Obra'].unique())

Cat_Permisos['Cantidad'] = 1

Cat_Permisos


In [45]:
print(Cat_Permisos.columns)  # Para ver todas las columnas del DataFrame

Index(['GID', 'EXPEDIENTE', 'FECHA_INI', 'FECHA_APRO', 'PADRON', 'UNIDAD',
       'DSC_TIPO_T', 'DSC_DESTIN', 'DSC_REGIME', 'DSC_TIPO_O', 'DSC_CATEGO',
       'CONSTRUCTO', 'AREA_EDIF', 'ANIO_APRO', 'MES_APRO', 'T_Demora',
       'año_ini', 'Nuevo_Destino', 'Tipo_Obra', 'Cantidad'],
      dtype='object')


In [46]:
# Agrupamos por 'ANIO_APRO', 'MES_APRO', 'Nuevo_Destino', 'Tipo_Obra' y sumamos 'AREA_EDIF' y 'Cantidad'
Tipo_de_obra = Cat_Permisos.groupby(['ANIO_APRO', 'MES_APRO', 'Nuevo_Destino', 'Tipo_Obra'])[['AREA_EDIF', 'Cantidad']].sum().reset_index()

# Renombramos las columnas directamente al hacer el reset_index
Tipo_de_obra.columns = ['ANIO_APRO', 'MES_APRO', 'Nuevo_Destino', 'Tipo_Obra', 'Suma_Area_Edificada', 'Suma_Cantidad']

# Mostramos el DataFrame con los nuevos nombres
print(Tipo_de_obra)


      ANIO_APRO  MES_APRO         Nuevo_Destino                  Tipo_Obra  \
0          1997        10             Industria  Sin tipo de obra definido   
1          1997        10              Vivienda  Sin tipo de obra definido   
2          1997        11              Comercio  Sin tipo de obra definido   
3          1997        11             Industria  Sin tipo de obra definido   
4          1997        11              Vivienda  Sin tipo de obra definido   
...         ...       ...                   ...                        ...   
4156       2024         9  Sin destino definido             Regularización   
4157       2024         9              Vivienda             Regularización   
4158       2024        10  Sin destino definido                      Otros   
4159       2024        10  Sin destino definido                    Reforma   
4160       2024        10  Sin destino definido             Regularización   

      Suma_Area_Edificada  Suma_Cantidad  
0                   

In [50]:
plt.figure(figsize=(10,6))
sns.scatterplot(data=Tipo_de_obra, x='Tipo_Obra', y='Suma_Area_Edificada', hue='Nuevo_Destino')

# Añadir título y etiquetas a los ejes
plt.title("Área de Edificación por Tipo de Construcción")
plt.xlabel("Tipo de Construcción")
plt.ylabel("Área Edificada")

# Rotar las etiquetas del eje X
plt.xticks(rotation=45, ha='right')

# Mostrar el gráfico
plt.tight_layout()
plt.show()

  plt.show()


In [48]:
resultado

Unnamed: 0,anio,Cantidad_de_registros
0,1997,19
1,1998,1044
2,1999,1237
3,2000,1088
4,2001,655
5,2002,688
6,2003,986
7,2004,1115
8,2005,1358
9,2006,1224
