In [1]:
%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go

In [2]:
df = pd.read_csv('tb_medida_estaciones.csv')

In [3]:
df.head(10) 

Unnamed: 0,FECHA_CORTE,N_SEC,UBIGEO,REG_NAT,DEPARTAMENTO,PROVINCIA,DISTRITO,POB_TOTAL,POB_URBANA,POB_RURAL,QRESIDUOS_DOM,PERIODO
0,9/01/2023,1,10101,SELVA,AMAZONAS,CHACHAPOYAS,CHACHAPOYAS,28423,27548,875,485750,2014
1,9/01/2023,2,10102,SELVA,AMAZONAS,CHACHAPOYAS,ASUNCION,291,151,140,3356,2014
2,9/01/2023,3,10103,SIERRA,AMAZONAS,CHACHAPOYAS,BALSAS,1615,299,1316,4896,2014
3,9/01/2023,4,10104,SIERRA,AMAZONAS,CHACHAPOYAS,CHETO,597,388,209,6359,2014
4,9/01/2023,5,10105,SIERRA,AMAZONAS,CHACHAPOYAS,CHILIQUIN,737,197,540,3238,2014
5,9/01/2023,6,10106,SIERRA,AMAZONAS,CHACHAPOYAS,CHUQUIBAMBA,2096,630,1466,10325,2014
6,9/01/2023,7,10107,SELVA,AMAZONAS,CHACHAPOYAS,GRANADA,395,133,262,2946,2014
7,9/01/2023,8,10108,SIERRA,AMAZONAS,CHACHAPOYAS,HUANCAS,1240,1231,9,20184,2014
8,9/01/2023,9,10109,SELVA,AMAZONAS,CHACHAPOYAS,LA JALCA,5551,2442,3109,54265,2014
9,9/01/2023,10,10110,SELVA,AMAZONAS,CHACHAPOYAS,LEIMEBAMBA,4200,1991,2209,44234,2014


In [4]:
# Convertir la columna "QRESIDUOS_DOM" a tipo numérico
df['QRESIDUOS_DOM'] = df['QRESIDUOS_DOM'].replace(',', '.', regex=True).astype(float)


In [5]:
# Seleccionar las columnas que nos interesan
df1 = df[['DEPARTAMENTO', 'PERIODO', 'QRESIDUOS_DOM']]
df1.head() 


Unnamed: 0,DEPARTAMENTO,PERIODO,QRESIDUOS_DOM
0,AMAZONAS,2014,4857.5
1,AMAZONAS,2014,33.56
2,AMAZONAS,2014,48.96
3,AMAZONAS,2014,63.59
4,AMAZONAS,2014,32.38


In [6]:
# Filtrar datos para omitir el valor "LIMA"
df1 = df1[df1['DEPARTAMENTO'] != 'LIMA']

In [7]:
# Agrupar por 'DEPARTAMENTO' y 'PERIODO', y sumar las columnas especificadas
df2 = df1.groupby(['DEPARTAMENTO', 'PERIODO']).sum().reset_index()
# Calcula las nuevas columnas en K miles de toneladas redondeada 
df2['KQRESIDUOS_DOM'] = (df2['QRESIDUOS_DOM'] / 1000).round().astype(int)
print(df2)

    DEPARTAMENTO  PERIODO  QRESIDUOS_DOM  KQRESIDUOS_DOM
0       AMAZONAS     2014       36687.48              37
1       AMAZONAS     2015       35408.14              35
2       AMAZONAS     2016       35698.25              36
3       AMAZONAS     2017       36003.39              36
4       AMAZONAS     2018       38118.39              38
..           ...      ...            ...             ...
187      UCAYALI     2017       91231.51              91
188      UCAYALI     2018      101089.44             101
189      UCAYALI     2019      101925.17             102
190      UCAYALI     2020      104509.04             105
191      UCAYALI     2021      108558.34             109

[192 rows x 4 columns]


In [8]:
# Ordenar DataFrame basado en el valor acumulado en orden descendente
df3 = df2.sort_values(by=["DEPARTAMENTO", "PERIODO"])  # Ordenar por departamento y periodo
df3["KQRESIDUOS_DOM_ACUM"] = df3.groupby("DEPARTAMENTO")["KQRESIDUOS_DOM"].cumsum()


In [15]:
fig = px.bar(df3, 
             x="KQRESIDUOS_DOM_ACUM", 
             y="DEPARTAMENTO", 
           #  color="DEPARTAMENTO", 
             animation_frame="PERIODO",
             labels={'KQRESIDUOS_DOM_ACUM': ''},
             orientation='h',
             range_x=[df3['KQRESIDUOS_DOM_ACUM'].min() - 10, df3['KQRESIDUOS_DOM_ACUM'].max() + 10 ]
             )

fig.update_layout(showlegend=False)
fig.update_traces(marker_color='blue',texttemplate='%{x:,.0f}KTM', textposition='outside', selector=dict(type='bar'))
fig.update_layout(yaxis=dict(categoryorder='total ascending', title_text=""),
                  xaxis=dict(showticklabels=False))
fig.update_layout(height=900)  # Ajusta el valor según sea necesario
fig.update_layout(
    xaxis=dict(
        showgrid=False,  # Esto desactiva la cuadrícula en el eje X
        showticklabels=False
    ),
    yaxis=dict(
        showgrid=False,  # Esto desactiva la cuadrícula en el eje Y
        categoryorder='total ascending', 
        title_text=""
    ),
    title={
        'text': "Generación residuos sólidos domiciliarios acumulados 2014-2021<br><span style='color: blue;'>Excluye Lima con 18,084 KTM(Miles de Toneladas Métricas)</span>",
        'y':0.97,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'
    }
)
fig.show()


In [19]:
fig = px.bar(df3, 
             x="KQRESIDUOS_DOM_ACUM", 
             y="DEPARTAMENTO", 
           #  color="DEPARTAMENTO", 
             animation_frame="PERIODO",
             labels={'KQRESIDUOS_DOM_ACUM': ''},
             orientation='h',
             range_x=[df3['KQRESIDUOS_DOM_ACUM'].min() - 10, df3['KQRESIDUOS_DOM_ACUM'].max() + 10 ]
             )

fig.update_layout(showlegend=False)
fig.update_traces(marker_color='blue',texttemplate='%{x:,.0f}KTM', textposition='outside', selector=dict(type='bar'))
fig.update_layout(yaxis=dict(categoryorder='total ascending', title_text=""),
                  xaxis=dict(showticklabels=False))
fig.update_layout(height=900)  # Ajusta el valor según sea necesario
fig.update_layout(
    xaxis=dict(
        showgrid=False,  # Esto desactiva la cuadrícula en el eje X
        showticklabels=False
    ),
    yaxis=dict(
        showgrid=False,  # Esto desactiva la cuadrícula en el eje Y
        categoryorder='total ascending', 
        title_text=""
    ),
    title={
        'text': "Generación de residuos sólidos domiciliarios acumulados 2014-2021<br><span style='color: blue;'>Excluye Lima con 18,084 KTM(Miles de Toneladas Métricas)</span>",
        'y':0.97,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'
    }
)
plot(fig, filename='my_plotly_graph.html')

'my_plotly_graph.html'