# Indice de Dissimilaridade.

O Código abaixo calcula o quão não similar a empresa é em termos de diversidade, focado em etnia/raça e gênero, em relação ao IBGE.

Ou seja com ele podemos saber a diferença porcentual dos empregados de uma empresa em relação à distribuição da diversidade na população brasileira.

Esse indice nos ajuda pois com estudos como o do ID-BR, que indicam que um acréscimo de 10% na diversidade de uma empresa se obtem um aumento de por volta de 5% de produtividade. Portanto com este indice podemos calcular quanto que uma empresa pode ter de aumento de produtividade caso esta melhore sua diversidade.

In [4]:
import numpy as np

# Dados do IBGE
# Raças e suas respectivas porcentagens na população brasileira
racas = ['Pardo', 'Preto', 'Branco', 'Amarelo', 'Indígena']
dados_IBGE = [45.30, 10.20, 43.50, 0.40, 0.60]

# Dados da empresa - Raça
# Porcentagens de cada raça para diferentes níveis de cargo na empresa
dados_empresa_raca = {
    'Pardo': [47.54, 45.88, 46.23, 49.94],  # Júnior, Pleno, Sênior, Gestor
    'Preto': [9.31, 8.64, 9.15, 7.93],       # Júnior, Pleno, Sênior, Gestor
    'Branco': [42.28, 44.55, 43.17, 41.31],  # Júnior, Pleno, Sênior, Gestor
    'Amarelo': [0.44, 0.4, 0.55, 0.57],      # Júnior, Pleno, Sênior, Gestor
    'Indígena': [0.44, 0.4, 0.55, 0.57]      # Júnior, Pleno, Sênior, Gestor
}

# Dados do IBGE - Gênero
# Porcentagens de gênero na população brasileira
porcentagem_feminino_IBGE = 51.50
porcentagem_masculino_IBGE = 48.50

# Dados da empresa - Gênero
# Porcentagens de gênero para diferentes níveis de cargo na empresa
dados_empresa_genero = {
    'Pleno': [25.73, 74.27],  # Feminino, Masculino
    'Júnior': [25.96, 74.04], # Feminino, Masculino
    'Gestor': [23.68, 76.32], # Feminino, Masculino
    'Sênior': [24.77, 75.23]  # Feminino, Masculino
}

# Calcular as proporções de raça da empresa e do IBGE
# Transpor a matriz para que as dimensões coincidam
proporcoes_empresa_raca = np.array([dados_empresa_raca[raca] for raca in racas]).T / 100
proporcoes_IBGE_raca = np.array(dados_IBGE) / 100

# Calcular as proporções de gênero da empresa e do IBGE
proporcoes_empresa_genero = np.array([dados_empresa_genero[cargo] for cargo in dados_empresa_genero]) / 100
proporcoes_IBGE_genero = np.array([porcentagem_feminino_IBGE, porcentagem_masculino_IBGE]) / 100

# Calcular a diferença média absoluta para raça
diff_raca = np.abs(proporcoes_empresa_raca - proporcoes_IBGE_raca).mean()

# Calcular a diferença média absoluta para gênero
diff_genero = np.abs(proporcoes_empresa_genero - proporcoes_IBGE_genero).mean()

# Calcular o Índice de Dissimilaridade
indice_dissimilaridade = (diff_raca + diff_genero) / 2

# Imprimir o Índice de Dissimilaridade
print(f'O indice de dissimilaridade de genero é : {round(diff_genero,2)}%')
print(f'O indice de dissimilaridade de Raça é : {round(diff_raca,2)}%')
print(f'O indice de dissimilaridade geral é : {round(indice_dissimilaridade,2)}%')


O indice de dissimilaridade de genero é : 0.26%
O indice de dissimilaridade de Raça é : 0.01%
O indice de dissimilaridade geral é : 0.14%
