In [None]:
def plotar_matriz_triangular(nomes, matriz): #recebe uma lista de nomes e uma matriz de similaridade, com valores entre 0 e 1
    matriz_np = np.array(matriz) #garantindo que a matriz é um array NumPy, necessário para facilitar as operações matemáticas e criação de gráficos

    # Máscara para esconder a parte superior da matriz (acima da diagonal)
    #mask = np.triu(np.ones_like(matriz_np, dtype=bool))
    matriz_bool = np.ones_like(matriz_np, dtype=bool)
    mascara = np.triu(matriz_bool)
    

    plt.figure(figsize=(8, 6)) #módulo para criar uma figura com tamanho definido em polegadas (largura, altura)
    sns.heatmap(matriz_np, annot=True, fmt=".2f", mask=mascara,
                xticklabels=nomes, yticklabels=nomes,
                cmap="YlGnBu", linewidths=0.5, cbar_kws={"label": "Similaridade"},
                vmin=0.001, vmax=1.0)

    plt.title("Matriz de Similaridade Genômica", fontsize=16)
    plt.xticks(rotation=45, ha='right') 
    plt.yticks(rotation=0)
    plt.tight_layout()
    plt.show()

***Explicação da máscara***

Máscara para esconder a parte superior da matriz (acima da diagonal) é útil porque a matriz é simétrica — ou seja, o valor de similaridade de A com B é o mesmo que de B com A. Dessa forma, usar a máscara evita mostrar dados duplicados visualmente.

*np.ones_like(matriz_np, dtype=bool)*
Cria um array (no caso, uma matriz) com o mesmo formato da matriz_np, preenchidos com valor 1. Entretanto, como utilizamos dtype = bool, 1 é convertido para True. Portanto, a matriz é toda preenchida com True.

*np.triu* Significa "upper triangular". Dessa forma, essa função recebe uma função e retorna a parte superior dela com os valores originais e a inferior como false. Como a matriz é toda True, ela mantém True na parte triangular superior e define False na parte inferior.

***Explicação do heatmap***

Seaborn é uma biblioteca de visualização usada para criar gráficos de calor.
Os valores númericos da matriz *matriz_np* que estão na máscara como *False* serão exibidos no gráfico.

*annot = True* exibe os valores numéricos da matriz dentro de cada célula do gráfico.

*fmt=".2f"* casas decimais que serão exibidas, no caso, duas

*mask=mascara* onde em *mascara* onde está True, esconde, e onde está False exibe

*xticklabels=nomes* os nomes aparecem no eixo x, sendo que cada coluna recebe um nome de virus

*yticklabels=nomes* os nomes também aparecem no eixo y, sendo que cada linha recebe um nome de virus

*cmap="YlGnBu"* define a paleta de cores usada no gráfico:Yl = Yellow → Gn = Green → Bu = Blue. É definido cores mais claras para valores menores e mais escuras para maiores.

*linewidths=0.5* define linhas divisórias entre as células com 0.5px

*cbar_kws* significa "colorbar keyword arguments" é um argumento que recebe opções extras que serão usadas para configurar a barra de cores lateral (colorbar), que mostra a escala do heatmap. O dicionário adiciona o texto "Similaridade" à barra de cores. Esse parâmetro sempre espera um dicionário como valor.

*vmin=0.001, vmax=1.0* são os valores limites para a escala de cores.

***Explicação dos rótulos***

*xticks* função da biblioteca matplotlib.pyplot que ajusta os rótulos do eixo X (horizontal, embaixo). No caso, utilizamos:

*rotation=45* gira os textos dos rótulos em 45 graus.

*ha='right'* define o alinhamento horizontal como “à direita” (do texto em relação à posição original), então os textos ficam inclinados para cima à direita.
