<a href="https://colab.research.google.com/github/fralfaro/MAT306/blob/main/docs/labs/lab_04.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# MAT306 - Laboratorio N°04


**Objetivo**: Aplicar técnicas intermedias y avanzadas de análisis de datos con pandas utilizando un caso real: el Índice de Libertad de Prensa. Este laboratorio incluye operaciones de limpieza, transformación, combinación de datos, y análisis exploratorio usando `merge`, `groupby`, `concat` y otras funciones fundamentales.




**Descripción del Dataset**

El presente conjunto de datos está orientado al análisis del **Índice de Libertad de Prensa**, una métrica internacional que evalúa el nivel de libertad del que gozan periodistas y medios de comunicación en distintos países. Este índice es recopilado anualmente por la organización **Reporteros sin Fronteras**.

La base de datos contempla observaciones por país y año, e incluye tanto el valor del índice como el ranking correspondiente. A menor puntaje en el índice, mayor nivel de libertad de prensa.

**Diccionario de variables**

| Variable     | Clase    | Descripción                                                                          |
| ------------ | -------- | ------------------------------------------------------------------------------------ |
| `codigo_iso` | carácter | Código ISO 3166-1 alfa-3 que representa a cada país.                                 |
| `pais`       | carácter | Nombre oficial del país.                                                             |
| `anio`       | entero   | Año en que se registró la medición del índice.                                       |
| `indice`     | numérico | Valor numérico del Índice de Libertad de Prensa (menor valor indica mayor libertad). |
| `ranking`    | entero   | Posición relativa del país en el ranking mundial de libertad de prensa.              |


**Fuente original y adaptación pedagógica**

* **Fuente original**: [Reporteros sin Fronteras](https://www.rsf-es.org/), recopilado y publicado a través del portal del [Banco Mundial](https://tcdata360.worldbank.org/indicators/h3f86901f?country=BRA&indicator=32416&viz=line_chart&years=2001,2019).
* **Adaptación educativa**: Los archivos han sido modificados intencionalmente para incorporar desafíos técnicos que permiten aplicar los contenidos abordados en clases, tales como limpieza de datos, normalización, detección de duplicados, y combinación de fuentes.


**Descripción de los archivos disponibles**

* **`libertad_prensa_codigo.csv`**: Contiene los pares `codigo_iso` y `pais`. Incluye intencionalmente un código ISO con dos nombres distintos de país para efectos de limpieza y validación de datos.

* **`libertad_prensa_01.csv`**: Contiene registros de los años **anteriores a 2010**. Incluye las variables `PAIS`, `ANIO`, `INDICE`, y `RANKING` con nombres de columna en **mayúsculas**.

* **`libertad_prensa_02.csv`**: Contiene registros de los años **desde 2010 en adelante**. Estructura similar al archivo anterior, con nombres de columna también en **mayúsculas**.





In [11]:
import numpy as np
import pandas as pd

# lectura de datos
archivos_anio = [
    'https://raw.githubusercontent.com/fralfaro/MAT306/main/docs/labs/data/libertad_prensa_01.csv',
    'https://raw.githubusercontent.com/fralfaro/MAT306/main/docs/labs/data/libertad_prensa_02.csv'
 ]
df_codigos = pd.read_csv('https://raw.githubusercontent.com/fralfaro/MAT306/main/docs/labs/data/libertad_prensa_codigo.csv')



### 1. Consolidación y limpieza de datos

A partir de los archivos disponibles, realice los siguientes pasos:

**a)** Cree un DataFrame llamado `df_anio` que consolide la información proveniente de los archivos **`libertad_prensa_01.csv`** y **`libertad_prensa_02.csv`**, correspondientes a distintas ventanas de tiempo. Recuerde que ambos archivos tienen nombres de columnas en mayúscula, por lo que debe normalizarlas a **minúscula** para asegurar consistencia.

**b)** Explore el archivo **`libertad_prensa_codigo.csv`** e identifique el código ISO que aparece asociado a dos nombres de país distintos. Elimine el registro que corresponda a un valor incorrecto o inconsistente, conservando solo el que considere válido.

**c)** Una vez preparados los archivos, cree un nuevo DataFrame llamado `df` que combine `df_anio` con `df_codigos`, utilizando la columna `codigo_iso` como clave. Asegúrese de realizar una unión que conserve únicamente los registros que tengan coincidencia en ambas fuentes.

> **Sugerencia**:
>
> * Para unir los archivos por filas (años), utilice la función `pd.concat([...])`.
> * Para combinar información por columnas (variables), utilice `pd.merge(...)` especificando `on='codigo_iso'`.



In [12]:
# a)
# lectura de archivos
df_anio_1=pd.read_csv(archivos_anio[0])
df_anio_2=pd.read_csv(archivos_anio[1])
# normalizar columnas a minuscula
df_anio_1.columns = df_anio_1.columns.str.lower()
df_anio_2.columns = df_anio_2.columns.str.lower()
# creacion de archivo
df_anio=pd.concat([df_anio_1,df_anio_2])
display(df_anio)

Unnamed: 0,codigo_iso,anio,indice,ranking
0,AFG,2001,35.50,59.0
1,AGO,2001,30.20,50.0
2,ALB,2001,,
3,AND,2001,,
4,ARE,2001,,
...,...,...,...,...
1435,WSM,2019,18.25,22.0
1436,YEM,2019,61.66,168.0
1437,ZAF,2019,22.19,31.0
1438,ZMB,2019,36.38,119.0


In [13]:
# b)
display(df_codigos)
# Identificar y mostrar los códigos ISO duplicados antes de eliminar la fila con 'malo'
print("Filas con codigo_iso duplicado en df_codigos original:")
display(df_codigos[df_codigos.duplicated(subset=['codigo_iso'], keep=False)])

# Eliminar la fila donde la columna 'pais' sea 'malo'
df_codigos = df_codigos[df_codigos['pais'] != 'malo']
display(df_codigos)

Unnamed: 0,codigo_iso,pais
0,AFG,Afghanistán
1,AGO,Angola
2,ALB,Albania
3,AND,Andorra
4,ARE,Emiratos Árabes Unidos
...,...,...
176,YEM,Yemen
177,ZAF,Sudáfrica
178,ZMB,Zambia
179,ZWE,Zimbabue


Unnamed: 0,codigo_iso,pais
0,AFG,Afghanistán
1,AGO,Angola
2,ALB,Albania
3,AND,Andorra
4,ARE,Emiratos Árabes Unidos
...,...,...
175,WSM,Samoa
176,YEM,Yemen
177,ZAF,Sudáfrica
178,ZMB,Zambia


Notamos que df_codigos tiene hay dos codigos ISO iguales con diferente pais, uno es "malo" el cual se elimina.

In [17]:
#c) Creamos un merge de los 3 df
df = pd.merge(df_anio, df_codigos, on='codigo_iso')
display(df)

Unnamed: 0,codigo_iso,anio,indice,ranking,pais
0,AFG,2001,35.50,59.0,Afghanistán
1,AGO,2001,30.20,50.0,Angola
2,ALB,2001,,,Albania
3,AND,2001,,,Andorra
4,ARE,2001,,,Emiratos Árabes Unidos
...,...,...,...,...,...
3055,WSM,2019,18.25,22.0,Samoa
3056,YEM,2019,61.66,168.0,Yemen
3057,ZAF,2019,22.19,31.0,Sudáfrica
3058,ZMB,2019,36.38,119.0,Zambia




### 2. Exploración inicial del conjunto de datos

Una vez que hayas consolidado el DataFrame final `df`, realiza un análisis exploratorio básico respondiendo las siguientes preguntas:

#### **Estructura del DataFrame**

* ¿Cuántas **filas (observaciones)** contiene el conjunto de datos?
* ¿Cuántas **columnas** tiene el DataFrame?
* ¿Cuáles son los **nombres de las columnas**?
* ¿Qué **tipo de datos** tiene cada columna?
* ¿Hay columnas con un tipo de dato inesperado (por ejemplo, fechas como strings)?

#### **Resumen estadístico**

* Genera un resumen estadístico del conjunto de datos con `.describe()`.
  ¿Qué observas sobre los valores de `indice` y `ranking`?
* ¿Qué valores mínimo, máximo y promedio tiene la columna `indice`?
* ¿Qué países presentan los valores extremos en `indice` y `ranking`?

#### **Datos faltantes**

* ¿Cuántos valores nulos hay en cada columna?
* ¿Qué proporción de observaciones tienen valores faltantes?
* ¿Hay columnas con más del 30% de datos faltantes?

#### **Unicidad y duplicados**

* ¿Cuántos países distintos (`pais`) hay en el DataFrame?
* ¿Cuántos años distintos (`anio`) hay representados?
* ¿Existen filas duplicadas (exactamente iguales)? ¿Cuántas?

#### **Validación cruzada de columnas**

* ¿Hay inconsistencias entre el país (`pais`) y su código (`codigo_iso`)?
  (por ejemplo, un mismo código ISO asociado a más de un país)

> **Sugerencia**: Apoya tu análisis con funciones como `.info()`, `.nunique()`, `.isnull().sum()`, `.duplicated()`, `.value_counts()`, entre otras.



    

In [20]:
# Estructura del data frame
#establecemos la cantidad de filas y columnas
num_obs, num_column = df.shape
print("Número de observaciones: {0}\nNúmero de columnas: {1}".format(num_obs,num_column))
# printea nombre de las columnas y datatype de las mismas
columnas = df.columns.tolist()
print("Nombre de las columnas: {0}".format(columnas))
tipoDatosColumnas = df.dtypes.tolist()
print("Tipo de dato de cada columna: {0}".format(tipoDatosColumnas))

Número de observaciones: 3060
Número de columnas: 5
Nombre de las columnas: ['codigo_iso', 'anio', 'indice', 'ranking', 'pais']
Tipo de dato de cada columna: [dtype('O'), dtype('int64'), dtype('float64'), dtype('float64'), dtype('O')]


In [21]:
#resumen estadistico
df.describe()

Unnamed: 0,anio,indice,ranking
count,3060.0,2664.0,2837.0
mean,2009.941176,205.782316,477.930913
std,5.786024,2695.525264,6474.935347
min,2001.0,0.0,1.0
25%,2005.0,15.295,34.0
50%,2009.0,28.0,70.0
75%,2015.0,41.2275,110.0
max,2019.0,64536.0,121056.0


Notemos que la recopilacion de datos es desde el 2001 al 2019. Ademas, el promedio del indice de libertad de la prensa es de 205 aprox, sin embargo la desviacion estandar es demasiado alta, asi, el promedio no es un buen indicador.

Para los datos faltantes y el resto de lo que se pide, se realizara un resumen donde se incluya todo lo pedido

In [28]:
#dato faltantes y valores duplicados

# respuesta
def resumen_df(df):
    ## Funcion que genera lo que se ha pedido
    ## Input: Dataframe
    ## Output: Dataframe resumen con información adicional

    nombres = df.columns
    result = pd.DataFrame({'nombres': nombres})

    result['elementos_distintos'] = df.nunique().values


    result['elementos_vacios'] = df.isnull().sum().values


    num_filas_duplicadas = df.duplicated().sum()

    num_paises_distintos = df['pais'].nunique() if 'pais' in df.columns else 'N/A'
    num_anios_distintos = df['anio'].nunique() if 'anio' in df.columns else 'N/A'

    additional_info = pd.DataFrame({
        'nombres': ['Total Filas Duplicadas', 'Países Distintos', 'Años Distintos'],
        'elementos_distintos': [num_filas_duplicadas, num_paises_distintos, num_anios_distintos],
        'elementos_vacios': [0, 0, 0] # No aplica para estos cálculos a nivel de DataFrame
    })

    result = pd.concat([result, additional_info], ignore_index=True)


    return result
display(resumen_df(df))

porcentaje_faltantes = (df.isnull().sum() / len(df)) * 100
display(porcentaje_faltantes)

Unnamed: 0,nombres,elementos_distintos,elementos_vacios
0,codigo_iso,180,0
1,anio,17,0
2,indice,1550,396
3,ranking,193,223
4,pais,179,0
5,Total Filas Duplicadas,0,0
6,Países Distintos,179,0
7,Años Distintos,17,0


Unnamed: 0,0
codigo_iso,0.0
anio,0.0
indice,12.941176
ranking,7.287582
pais,0.0


Veamos si hay incosistencias entre columnas codigo_ISO y pais

In [29]:
inconsistencias = df.groupby('codigo_iso')['pais'].nunique()

# Filtrar los codigo_iso que tienen más de un pais asociado
codigos_inconsistentes = inconsistencias[inconsistencias > 1]

if not codigos_inconsistentes.empty:
    print("Se encontraron inconsistencias entre 'codigo_iso' y 'pais':")
    # Mostrar los detalles de las inconsistencias encontradas
    for codigo in codigos_inconsistentes.index:
        print(f"\nCodigo ISO: {codigo}")
        display(df[df['codigo_iso'] == codigo][['codigo_iso', 'pais']].drop_duplicates())
else:
    print("No se encontraron inconsistencias entre 'codigo_iso' y 'pais'.")

No se encontraron inconsistencias entre 'codigo_iso' y 'pais'.





### 3. Comparación regional: países latinoamericanos

En esta sección se busca identificar cuáles son los países de América Latina que han presentado los valores extremos del **Índice de Libertad de Prensa** en cada año observado.

> Recuerda que un menor puntaje en `indice` implica mayor libertad de prensa.

#### **Tareas:**

**a)** Utilizando un ciclo `for`, recorre cada año del conjunto de datos filtrado por países latinoamericanos, y determina para cada año:

* El país con el menor valor de `indice` (mayor libertad de prensa).
* El país con el mayor valor de `indice` (menor libertad de prensa).

**b)** Resuelve la misma tarea del punto anterior utilizando un enfoque vectorizado con `groupby`, sin usar ciclos explícitos.



#### **Lista de países latinoamericanos considerada:**

```python
america = ['ARG', 'ATG', 'BLZ', 'BOL', 'BRA', 'CAN', 'CHL', 'COL', 'CRI',
           'CUB', 'DOM', 'ECU', 'GRD', 'GTM', 'GUY', 'HND', 'HTI', 'JAM',
           'MEX', 'NIC', 'PAN', 'PER', 'PRY', 'SLV', 'SUR', 'TTO', 'URY',
           'USA', 'VEN']
```

> Puedes usar esta lista para filtrar el DataFrame final por la columna `codigo_iso`.



In [35]:
# respuesta

america = ['ARG', 'ATG', 'BLZ', 'BOL', 'BRA', 'CAN', 'CHL', 'COL', 'CRI',
       'CUB', 'DOM', 'ECU', 'GRD', 'GTM', 'GUY', 'HND', 'HTI', 'JAM',
       'MEX', 'NIC', 'PAN', 'PER', 'PRY', 'SLV', 'SUR', 'TTO', 'URY',
       'USA', 'VEN']
# a) Usando un ciclo for
anio=df['anio'].unique()
resultados = []
for i in anio:
       df_filtrado = df.loc[(df['anio'] == i) & (df['codigo_iso'].isin(america))] #dataframe fila coincide con el nombre anio y los paises de america
       df_mayoranking = df_filtrado.sort_values(by='indice',ascending=False)
       df_menoranking = df_filtrado.sort_values(by='indice',ascending=True)
       resultados.append({'codigo_iso': df_mayoranking.iloc[0]['codigo_iso'],'anio': i,'pais': df_mayoranking.iloc[0]['pais'], 'mayor indice': df_mayoranking.iloc[0]['indice']})
       resultados.append({'codigo_iso': df_menoranking.iloc[0]['codigo_iso'],'anio': i,'pais': df_menoranking.iloc[0]['pais'], 'menor indice': df_menoranking.iloc[0]['indice']})

df_resultado=pd.DataFrame(resultados)
df_resultado



Unnamed: 0,codigo_iso,anio,pais,mayor indice,menor indice
0,CUB,2001,Cuba,90.3,
1,CAN,2001,Canadá,,0.8
2,CUB,2002,Cuba,97.83,
3,TTO,2002,Trinidad y Tobago,,1.0
4,ARG,2003,Argentina,35826.0,
5,TTO,2003,Trinidad y Tobago,,2.0
6,CUB,2004,Cuba,87.0,
7,TTO,2004,Trinidad y Tobago,,2.0
8,CUB,2005,Cuba,95.0,
9,BOL,2005,Bolivia,,4.5


In [36]:
#b) Usando groupby
df_america = df.loc[df['codigo_iso'].isin(america)].dropna() #se filtra los paises y se omiten las filas con NA
# Agrupar por año para encontrar el índice máximo y mínimo
df_agrupado = df_america.groupby('anio')['indice'].agg(indice_maximo='max', indice_minimo='min').reset_index()

# Hacer un merge con el DataFrame original para obtener el país con el índice máximo
df_max = pd.merge(df_agrupado, df_america, how='left', left_on=['anio', 'indice_maximo'], right_on=['anio', 'indice'])
df_max = df_max[['anio', 'indice_maximo', 'pais']].rename(columns={'pais': 'pais_max'})

# Hacer un merge con el DataFrame original para obtener el país con el índice mínimo
df_min = pd.merge(df_agrupado, df_america, how='left', left_on=['anio', 'indice_minimo'], right_on=['anio', 'indice'])
df_min = df_min[['anio', 'indice_minimo', 'pais']].rename(columns={'pais': 'pais_min'})

# Unir ambos resultados en un solo DataFrame
df_resultado = pd.merge(df_max, df_min, on='anio')

print(df_resultado)

    anio  indice_maximo   pais_max  indice_minimo           pais_min
0   2001          90.30       Cuba           0.80             Canadá
1   2002          97.83       Cuba           1.00  Trinidad y Tobago
2   2003       35826.00  Argentina           2.00  Trinidad y Tobago
3   2004          87.00       Cuba           2.00  Trinidad y Tobago
4   2005          95.00       Cuba           4.50            Bolivia
5   2005          95.00       Cuba           4.50             Canadá
6   2006          96.17       Cuba           4.88             Canadá
7   2007          88.33       Cuba           3.33             Canadá
8   2008          94.00       Cuba           3.70             Canadá
9   2009          78.00       Cuba           6.75     Estados Unidos
10  2012          71.64       Cuba           9.88            Jamaica
11  2013          70.92       Cuba          10.90            Jamaica
12  2014          70.21       Cuba          10.99             Canadá
13  2015          70.23       Cuba

### 4. Análisis anual del índice por país

En esta sección se busca analizar la evolución del **índice máximo** de libertad de prensa alcanzado por cada país a lo largo del tiempo.

#### **Tarea principal:**

* Construye una tabla dinámica (`pivot_table`) donde las **filas** correspondan a los países, las **columnas** a los años (`anio`) y los **valores** sean el `indice` máximo alcanzado por cada país en ese año.
* Asegúrate de reemplazar los valores nulos resultantes con `0`.

> **Hint**: Puedes utilizar el parámetro `fill_value=0` en `pd.pivot_table(...)`.



#### **Preguntas adicionales:**

**a)** ¿Qué país tiene el mayor valor de `indice` en toda la tabla resultante? ¿Y cuál tiene el menor (distinto de cero)?
**b)** ¿Qué años presentan en promedio los valores de `indice` más altos? ¿Y los más bajos?

> (Pista: usa `.mean(axis=0)` sobre la tabla pivot)

**c)** ¿Qué país muestra mayor **variabilidad** (diferencia entre su máximo y mínimo `indice` a lo largo del tiempo)?

> (Pista: aplica `.max(axis=1) - .min(axis=1)`)

**d)** ¿Existen países con índice constante a lo largo de todos los años registrados? ¿Cuáles?

**e)** ¿Qué países no tienen ningún dato (es decir, quedaron con todos los valores igual a 0)? ¿Podrías explicar por qué?





In [43]:
pivot_df = df.fillna(0).pivot_table(index='pais',columns='anio',values='indice',aggfunc='max')
display(pivot_df)



anio,2001,2002,2003,2004,2005,2006,2007,2008,2009,2012,2013,2014,2015,2016,2017,2018,2019
pais,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1
Afghanistán,35.5,40.17,28.25,39.17,44.25,56.50,59.25,54.25,51.67,37.36,37.07,37.44,37.75,0.0,39.46,37.28,36.55
Albania,0.0,6.50,11.50,14.17,18.00,25.50,16.00,21.75,21.50,30.88,29.92,28.77,29.92,0.0,29.92,29.49,29.84
Alemania,1.5,1.33,2.00,4.00,5.50,5.75,4.50,3.50,4.25,10.24,10.23,11.47,14.80,0.0,14.97,14.39,14.60
Algeria,31.0,33.00,43.50,40.33,40.00,40.50,31.33,49.56,47.33,36.54,36.26,36.63,41.69,0.0,42.83,43.13,45.75
Andorra,0.0,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,6.82,6.82,19.87,19.87,0.0,21.03,22.21,24.63
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Vietnam,81.3,89.17,86.88,73.25,67.25,79.25,86.17,81.67,75.75,71.78,72.36,72.63,74.27,0.0,73.96,75.05,74.93
West Bank y Gaza,0.0,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.00,0.0,42.90,42.96,44.68
Yemen,34.8,41.83,48.00,46.25,54.00,56.67,59.00,83.38,82.13,69.22,67.26,66.36,67.07,0.0,65.80,62.23,61.66
Zambia,26.8,23.25,29.75,23.00,22.50,21.50,15.50,26.75,22.00,27.93,30.89,34.35,35.08,0.0,36.48,35.36,36.38


In [46]:
pivot_df = df.fillna(0).pivot_table(index='pais',columns='anio',values='indice',aggfunc='max')


#a)
pais_mayor_indice_general = pivot_df.stack().idxmax()[0]
valor_mayor_indice_general = pivot_df.stack().max()
print(f"\nEl país con el mayor valor de índice general es: {pais_mayor_indice_general} (Indice: {valor_mayor_indice_general})")

indice_stack_no_cero = pivot_df.stack()
indice_stack_no_cero = indice_stack_no_cero[indice_stack_no_cero > 0]

if not indice_stack_no_cero.empty:
    pais_menor_indice_general = indice_stack_no_cero.idxmin()[0]
    valor_menor_indice_general = indice_stack_no_cero.min()
    print(f"El país con el menor valor de índice general (distinto de cero) es: {pais_menor_indice_general} (Indice: {valor_menor_indice_general})")
else:
    print("\nNo hay valores de índice mayores que cero en la tabla pivot.")


#b)
promedio_por_anio = pivot_df.mean(axis=0)

# Encontrar el año con el promedio de índice más alto
anio_mayor_promedio = promedio_por_anio.idxmax()
valor_mayor_promedio_anio = promedio_por_anio.max()
print(f"\nEl año con el promedio de índice más alto es: {anio_mayor_promedio} (Promedio: {valor_mayor_promedio_anio:.2f})")

# Encontrar el año con el promedio de índice más bajo
anio_menor_promedio = promedio_por_anio.idxmin()
valor_menor_promedio_anio = promedio_por_anio.min()
print(f"El año con el promedio de índice más bajo es: {anio_menor_promedio} (Promedio: {valor_menor_promedio_anio:.2f})")


El país con el mayor valor de índice general es: Kosovo (Indice: 64536.0)
El país con el menor valor de índice general (distinto de cero) es: Austria (Indice: 0.5)

El año con el promedio de índice más alto es: 2013 (Promedio: 449.11)
El año con el promedio de índice más bajo es: 2016 (Promedio: 0.00)


In [48]:

# c)
variabilidad_por_pais = pivot_df.max(axis=1) - pivot_df.min(axis=1)


pais_mayor_variabilidad = variabilidad_por_pais.idxmax()
valor_mayor_variabilidad = variabilidad_por_pais.max()

print(f"\nc) El país con mayor variabilidad en el índice a lo largo del tiempo es: {pais_mayor_variabilidad} (Variabilidad: {valor_mayor_variabilidad:.2f})")

# d)
paises_indice_constante = variabilidad_por_pais[variabilidad_por_pais == 0]

paises_indice_constante_distinto_cero = paises_indice_constante[pivot_df.max(axis=1) > 0]

if not paises_indice_constante_distinto_cero.empty:
    print("\nd) Países con índice constante (distinto de cero) a lo largo de los años:")
    for pais in paises_indice_constante_distinto_cero.index:
        print(f"- {pais}")
else:
    print("\nd) No se encontraron países con índice constante (distinto de cero) a lo largo de los años.")


# e)
paises_sin_datos = pivot_df[(pivot_df == 0).all(axis=1)].index.tolist()

if paises_sin_datos:
    print("\ne) Países que quedaron con todos los valores de índice igual a 0:")
    for pais in paises_sin_datos:
        print(f"- {pais}")
    print("\nPosible explicación: Estos países podrían no tener datos disponibles en los archivos originales para ninguno de los años considerados (2001-2019), o sus datos eran nulos y fueron reemplazados por 0 durante la creación de la tabla pivot.")
else:
    print("\ne) No se encontraron países con todos los valores de índice igual a 0 en la tabla pivot.")


c) El país con mayor variabilidad en el índice a lo largo del tiempo es: Kosovo (Variabilidad: 64536.00)

d) No se encontraron países con índice constante (distinto de cero) a lo largo de los años.

e) No se encontraron países con todos los valores de índice igual a 0 en la tabla pivot.
