In [10]:
import pandas as pd
import numpy as np

In [11]:
# Carregando o arquivo CSV
df = pd.read_csv('data/human-development-index.csv')

In [12]:
# Exibindo as primeiras linhas do DataFrame
df.head()

Unnamed: 0,Rank,País,IDH,IDH Ajustado à Desigualdade (IDHAD),Índice de Desenvolvimento Humano por Género,Índice de Desigualdade de Género,Índice de Pobreza Multidimensional,IDH ajustado à pressão sobre o planeta,Perda Global (%),Diferença do IDH (%)
0,1,Suíça,0.967,0.891,0.971,0.018,.,.,14.6,0.826
1,2,Noruega,0.966,0.903,0.986,0.012,.,.,16.4,0.808
2,3,Islândia,0.959,0.91,0.975,0.039,.,.,16.0,0.806
3,4,Hong Kong China (RAE),0.956,0.84,0.972,.,.,.,.,0.745
4,5,Dinamarca,0.952,0.898,0.981,0.009,.,.,11.9,0.839


In [13]:
# Substituindo '.' por NaN
df.replace('.', np.nan, inplace=True)

# Lista de colunas numéricas
colunas_numericas = ['IDH', 'IDH Ajustado à Desigualdade (IDHAD)',
                     'Índice de Desenvolvimento Humano por Género',
                     'Índice de Desigualdade de Género',
                     'Índice de Pobreza Multidimensional',
                     'IDH ajustado à pressão sobre o planeta',
                     'Perda Global (%)', 'Diferença do IDH (%)']

# Convertendo colunas para numérico
for coluna in colunas_numericas:
    df[coluna] = pd.to_numeric(df[coluna], errors='coerce')

# Removendo linhas duplicadas
df.drop_duplicates(inplace=True)

# Removendo linhas com IDH NaN
df_idh = df[['País', 'IDH']].dropna()

# Ordenando os países pelo IDH (decrescente)
top10_idh = df_idh.sort_values(by='IDH', ascending=False).head(10)
print("Top 10 países pelo Índice de Desenvolvimento Humano (IDH):\n")
print(top10_idh.to_string(index=False))
# Salvando em CSV
top10_idh.to_csv('result/top-10-idh.csv', index=False)

# Salvando em Excel
top10_idh.to_excel('result/top-10-idh.xlsx', index=False)

Top 10 países pelo Índice de Desenvolvimento Humano (IDH):

                 País   IDH
                Suíça 0.967
              Noruega 0.966
             Islândia 0.959
Hong Kong China (RAE) 0.956
            Dinamarca 0.952
               Suécia 0.952
             Alemanha 0.950
              Irlanda 0.950
            Singapura 0.949
            Austrália 0.946


In [14]:
# Removendo linhas com IDHAD NaN
df_idhad = df[['País', 'IDH Ajustado à Desigualdade (IDHAD)']].dropna()

# Ordenando os países pelo IDHAD (decrescente)
top10_idhad = df_idhad.sort_values(by='IDH Ajustado à Desigualdade (IDHAD)', ascending=False).head(10)

print("Top 10 países pelo IDH Ajustado à Desigualdade (IDHAD):\n")
print(top10_idhad.to_string(index=False))

# Salvando em CSV
top10_idhad.to_csv('result/top-10-idhad.csv', index=False)

# Salvando em Excel
top10_idhad.to_excel('result/top-10-idhad.xlsx', index=False)

Top 10 países pelo IDH Ajustado à Desigualdade (IDHAD):

         País  IDH Ajustado à Desigualdade (IDHAD)
     Islândia                                0.910
      Noruega                                0.903
    Dinamarca                                0.898
        Suíça                                0.891
      Irlanda                                0.886
    Finlândia                                0.886
Países Baixos                                0.885
    Eslovénia                                0.882
     Alemanha                                0.881
       Suécia                                0.878


In [15]:
# Removendo linhas com índice NaN
df_idh_genero = df[['País', 'Índice de Desenvolvimento Humano por Género']].dropna()

# Ordenando os países (decrescente)
top10_idh_genero = df_idh_genero.sort_values(by='Índice de Desenvolvimento Humano por Género', ascending=False).head(10)
print("Top 10 países pelo Índice de Desenvolvimento Humano por Género:\n")
print(top10_idh_genero.to_string(index=False))
# Salvando em CSV
top10_idh_genero.to_csv('result/top-10-idh-genero.csv', index=False)

# Salvando em Excel
top10_idh_genero.to_excel('result/top-10-idh-genero.xlsx', index=False)

Top 10 países pelo Índice de Desenvolvimento Humano por Género:

                   País  Índice de Desenvolvimento Humano por Género
                Andorra                                        8.400
              Seicheles                                        1.064
      Trindade e Tobago                                        1.037
                  Nauru                                        1.037
Moldávia (República da)                                        1.033
               Mongólia                                        1.032
               Barbados                                        1.030
   República Dominicana                                        1.029
               Lituânia                                        1.028
                  Catar                                        1.027


In [16]:
# Removendo linhas com índice NaN
df_pobreza = df[['País', 'Índice de Pobreza Multidimensional']].dropna()

# Verificando se há dados disponíveis
if not df_pobreza.empty:
    # Ordenando os países (crescente - menor pobreza)
    top10_pobreza = df_pobreza.sort_values(by='Índice de Pobreza Multidimensional', ascending=True).head(10)

    # Exibindo os Top 10 países
    print("Top 10 países pelo Índice de Pobreza Multidimensional (menor para maior):\n")
    print(top10_pobreza.to_string(index=False))

    # Salvando os resultados
    top10_pobreza.to_csv('result/top-10-pobreza-multidimensional.csv', index=False)
    top10_pobreza.to_excel('result/top-10-pobreza-multidimensional.xlsx', index=False)
else:
    print("Não há dados disponíveis para o Índice de Pobreza Multidimensional.")

Top 10 países pelo Índice de Pobreza Multidimensional (menor para maior):

                 País  Índice de Pobreza Multidimensional
              Ucrânia                                 0.2
              Geórgia                                 0.3
             Jordânia                                 0.4
   Macedónia do Norte                                 0.4
        Quirguizistão                                 0.4
           Costa Rica                                 0.5
Palestina (Estado da)                                 0.6
                 Cuba                                 0.7
              Tunísia                                 0.8
             Maldivas                                 0.8


In [17]:
# Removendo linhas com índice NaN
df_idh_planeta = df[['País', 'IDH ajustado à pressão sobre o planeta']].dropna()

# Ordenando os países (decrescente)
top10_idh_planeta = df_idh_planeta.sort_values(by='IDH ajustado à pressão sobre o planeta', ascending=False).head(10)

print("Top 10 países pelo IDH ajustado à pressão sobre o planeta:\n")
print(top10_idh_planeta.to_string(index=False))

# Salvando em CSV
top10_idh_planeta.to_csv('result/top-10-idh-ajustado-planeta.csv', index=False)

# Salvando em Excel
top10_idh_planeta.to_excel('result/top-10-idh-ajustado-planeta.xlsx', index=False)

Top 10 países pelo IDH ajustado à pressão sobre o planeta:

                     País  IDH ajustado à pressão sobre o planeta
                    Níger                                    66.1
                    Chade                                    61.4
               Moçambique                                    60.0
República Centro-Africana                                    57.4
                    Guiné                                    56.4
               Madagáscar                                    56.4
               Mauritânia                                    56.0
                   Angola                                    55.3
                    Benin                                    55.0
                     Mali                                    55.0


In [18]:
# Substituindo '.' por NaN
df.replace('.', np.nan, inplace=True)

# Lista de colunas numéricas
colunas_numericas = ['IDH', 'IDH Ajustado à Desigualdade (IDHAD)',
                     'Índice de Desenvolvimento Humano por Género',
                     'Índice de Desigualdade de Género',
                     'Índice de Pobreza Multidimensional',
                     'IDH ajustado à pressão sobre o planeta',
                     'Perda Global (%)', 'Diferença do IDH (%)']

# Convertendo colunas para numérico
for coluna in colunas_numericas:
    df[coluna] = pd.to_numeric(df[coluna], errors='coerce')

# Removendo linhas duplicadas
df.drop_duplicates(inplace=True)

# Removendo linhas com IDH NaN
df_idh = df[['País', 'IDH']].dropna()

# Ordenando os países pelo IDH (crescente)
bottom20_idh = df_idh.sort_values(by='IDH', ascending=True).head(20)
print("20 piores países pelo Índice de Desenvolvimento Humano (IDH):\n")
print(bottom20_idh.to_string(index=False))
# Salvando em CSV
bottom20_idh.to_csv('result/bottom-20-idh.csv', index=False)

# Salvando em Excel
bottom20_idh.to_excel('result/bottom-20-idh.xlsx', index=False)

20 piores países pelo Índice de Desenvolvimento Humano (IDH):

                            País   IDH
                         Somália 0.380
                    Sudão do Sul 0.381
       República Centro-Africana 0.387
                           Níger 0.394
                           Chade 0.394
                            Mali 0.410
                         Burundi 0.420
                           Iémen 0.424
                  Burquina Fasso 0.438
                      Serra Leoa 0.458
                      Moçambique 0.461
                     Afeganistão 0.462
                           Guiné 0.471
Congo (República Democrática do) 0.481
                    Guiné-Bissau 0.483
                      Madagáscar 0.487
                         Libéria 0.487
                         Etiópia 0.492
                        Eritreia 0.493
                          Gâmbia 0.495


In [19]:
# Removendo linhas com IDHAD NaN
df_idhad = df[['País', 'IDH Ajustado à Desigualdade (IDHAD)']].dropna()

# Ordenando os países pelo IDHAD (crescente)
bottom20_idhad = df_idhad.sort_values(by='IDH Ajustado à Desigualdade (IDHAD)', ascending=True).head(20)

print("20 piores países pelo IDH Ajustado à Desigualdade (IDHAD):\n")
print(bottom20_idhad.to_string(index=False))

# Salvando em CSV
bottom20_idhad.to_csv('result/bottom-20-idhad.csv', index=False)

# Salvando em Excel
bottom20_idhad.to_excel('result/bottom-20-idhad.xlsx', index=False)

20 piores países pelo IDH Ajustado à Desigualdade (IDHAD):

                            País  IDH Ajustado à Desigualdade (IDHAD)
                    Sudão do Sul                                0.222
       República Centro-Africana                                0.237
                           Chade                                0.238
                  Burquina Fasso                                0.261
                           Níger                                0.262
                      Moçambique                                0.270
                         Burundi                                0.273
                      Serra Leoa                                0.277
                            Mali                                0.277
                           Guiné                                0.285
                           Iémen                                0.285
                     Afeganistão                                0.300
                           Ben

In [20]:
# Removendo linhas com índice NaN
df_idh_genero = df[['País', 'Índice de Desenvolvimento Humano por Género']].dropna()

# Ordenando os países (crescente)
bottom20_idh_genero = df_idh_genero.sort_values(by='Índice de Desenvolvimento Humano por Género', ascending=True).head(20)

print("20 piores países pelo Índice de Desenvolvimento Humano por Género:\n")
print(bottom20_idh_genero.to_string(index=False))

# Salvando em CSV
bottom20_idh_genero.to_csv('result/bottom-20-idh-genero.csv', index=False)

# Salvando em Excel
bottom20_idh_genero.to_excel('result/bottom-20-idh-genero.xlsx', index=False)

20 piores países pelo Índice de Desenvolvimento Humano por Género:

                    País  Índice de Desenvolvimento Humano por Género
                   Iémen                                        0.456
             Afeganistão                                        0.622
                 Somália                                        0.769
                   Chade                                        0.776
                  Iraque                                        0.786
República Árabe da Síria                                        0.805
                   Guiné                                        0.818
                   Níger                                        0.826
                    Mali                                        0.830
               Paquistão                                        0.834
                  Jibuti                                        0.844
                    Togo                                        0.848
                   Ben

In [21]:
# Removendo linhas com índice NaN
df_desigualdade_genero = df[['País', 'Índice de Desigualdade de Género']].dropna()

# Ordenando os países (decrescente - maior desigualdade)
bottom20_desigualdade_genero = df_desigualdade_genero.sort_values(by='Índice de Desigualdade de Género', ascending=False).head(20)

print("20 piores países pelo Índice de Desigualdade de Género (maior para menor):\n")
print(bottom20_desigualdade_genero.to_string(index=False))

# Salvando em CSV
bottom20_desigualdade_genero.to_csv('result/bottom-20-desigualdade-genero.csv', index=False)

# Salvando em Excel
bottom20_desigualdade_genero.to_excel('result/bottom-20-desigualdade-genero.xlsx', index=False)

20 piores países pelo Índice de Desigualdade de Género (maior para menor):

                            País  Índice de Desigualdade de Género
                           Iémen                             0.820
                         Nigéria                             0.677
                         Somália                             0.674
                           Chade                             0.671
                     Afeganistão                             0.665
                         Libéria                             0.656
                           Benin                             0.649
                         Comores                             0.631
                    Guiné-Bissau                             0.631
                Guiné Equatorial                             0.624
                           Haiti                             0.621
                      Serra Leoa                             0.613
                 Costa do Marfim                     

In [22]:
# Removendo linhas com índice NaN
df_pobreza = df[['País', 'Índice de Pobreza Multidimensional']].dropna()

# Verificando se há dados disponíveis
if not df_pobreza.empty:
    # Ordenando os países (decrescente - maior pobreza)
    bottom20_pobreza = df_pobreza.sort_values(by='Índice de Pobreza Multidimensional', ascending=False).head(20)

    # Exibindo os 20 piores países
    print("20 piores países pelo Índice de Pobreza Multidimensional (maior para menor):\n")
    print(bottom20_pobreza.to_string(index=False))

    # Salvando os resultados
    bottom20_pobreza.to_csv('result/bottom-20-pobreza-multidimensional.csv', index=False)
    bottom20_pobreza.to_excel('result/bottom-20-pobreza-multidimensional.xlsx', index=False)
else:
    print("Não há dados disponíveis para o Índice de Pobreza Multidimensional.")

20 piores países pelo Índice de Pobreza Multidimensional (maior para menor):

                            País  Índice de Pobreza Multidimensional
                           Níger                                91.0
                           Chade                                84.2
       República Centro-Africana                                80.4
                         Burundi                                75.1
                         Etiópia                                68.7
                      Madagáscar                                68.4
                            Mali                                68.3
                           Benin                                66.8
                  Burquina Fasso                                66.8
                           Guiné                                66.2
Congo (República Democrática do)                                64.5
                         Comores                                64.4
                    Guiné

In [23]:
# Removendo linhas com índice NaN
df_idh_planeta = df[['País', 'IDH ajustado à pressão sobre o planeta']].dropna()

# Ordenando os países (crescente)
bottom20_idh_planeta = df_idh_planeta.sort_values(by='IDH ajustado à pressão sobre o planeta', ascending=True).head(20)

print("20 piores países pelo IDH ajustado à pressão sobre o planeta:\n")
print(bottom20_idh_planeta.to_string(index=False))

# Salvando em CSV
bottom20_idh_planeta.to_csv('result/bottom-20-idh-ajustado-planeta.csv', index=False)

# Salvando em Excel
bottom20_idh_planeta.to_excel('result/bottom-20-idh-ajustado-planeta.xlsx', index=False)

20 piores países pelo IDH ajustado à pressão sobre o planeta:

                   País  IDH ajustado à pressão sobre o planeta
                  Butão                                   0.615
         Turquemenistão                                   0.662
                 Líbano                                   0.680
               Maldivas                                  34.400
                Ucrânia                                  34.400
  Palestina (Estado da)                                  35.000
            Usbequistão                                  35.300
               Jordânia                                  35.400
          Quirguizistão                                  36.300
                Tunísia                                  36.500
      Trindade e Tobago                                  36.600
                Geórgia                                  36.600
                  Líbia                                  37.100
             Costa Rica                  