In [None]:
# Heat map of p-valores
# Change the NAME.csv

import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt
from scipy.stats import f_oneway

# Carregar o arquivo CSV
df = pd.read_csv('NAME.csv')

# A primeira linha é o número de onda (colunas), e a primeira coluna é a classe (rótulo)
# As demais linhas são os espectros
wavenumbers = df.columns[1:].astype(float)
classes = df.iloc[:, 0]
spectra = df.iloc[:, 1:]

# Inicializar uma lista para armazenar os p-values para cada número de onda
p_values = []

# Realizar o teste ANOVA para cada número de onda (coluna)
# Iterar pelas colunas do DataFrame 'spectra'
for col in spectra.columns:
    # Obter os dados para o número de onda atual (coluna)
    wavenumber_data = spectra[col]
    # Agrupar os dados por classe e extrair os valores
    data_by_class = [group.values for name, group in wavenumber_data.groupby(classes)]
    # Realizar o teste ANOVA
    fvalue, pvalue = f_oneway(*data_by_class)
    p_values.append(pvalue)

# Converter a lista de p-valores em um array numpy
p_values = np.array(p_values)

# Para o heatmap, podemos usar -log10(p) para destacar valores pequenos (significativos)
# Adicionar um pequeno valor (epsilon) para evitar log(0)
epsilon = 1e-100
log_p_values = -np.log10(p_values + epsilon)

# Criar o heatmap
plt.figure(figsize=(15, 5))
sns.heatmap([log_p_values], cmap="YlGnBu", annot=False) # Use [log_p_values] para ter uma única linha no heatmap
plt.title('Heatmap de -log10(p-valores) por Número de Onda')
plt.xlabel('Índice do Número de Onda')
plt.ylabel('') # Não precisamos de rótulo no eixo y para uma única linha
plt.yticks([]) # Remover os ticks do eixo y
plt.show()

# Opcional: Para identificar as regiões com menor p-valor (maior significância estatística),
# podemos encontrar os índices dos p-valores mais baixos
significant_indices = np.argsort(p_values)[:10] # Pegar os 10 menores p-valores
print("\nRegiões do espectro (índices dos números de onda) com os menores p-valores:")
print(significant_indices)
print("Números de onda correspondentes:")
print(wavenumbers[significant_indices])

In [None]:
# Graph with wavenumber

import matplotlib.pyplot as plt
import numpy as np
# Criar o heatmap com número de onda no eixo x
plt.figure(figsize=(15, 5))
sns.heatmap([log_p_values], cmap="YlGnBu", annot=False)

# Definir os ticks do eixo x com os números de onda correspondentes aos índices
# Vamos mostrar apenas alguns ticks para não sobrecarregar o eixo
tick_indices = np.linspace(0, len(wavenumbers) - 1, 10, dtype=int)
plt.xticks(tick_indices + 0.5, [f'{wavenumbers[i]:.0f}' for i in tick_indices]) # Adiciona 0.5 para centralizar o tick entre as células

plt.title('Heatmap of -log10(p-values) by Wavenumber')
plt.xlabel('Wavenumber')
plt.ylabel('') # No need for a y-axis label for a single row
plt.yticks([]) # Remove y-axis ticks
plt.show()

# Opcional: Para identificar as regiões com menor p-valor (maior significância estatística),
# podemos encontrar os índices dos p-valores mais baixos
significant_indices = np.argsort(p_values)[:10] # Pegar os 10 menores p-valores
print("\nSpectral regions (wavenumber indices) with the lowest p-values:")
print(significant_indices)
print("Corresponding wavenumbers:")
wavenumbers[significant_indices]

In [None]:
# Regions of the spectrum with the smallest p-values ​​and the corresponding wavenumbers

import pandas as pd
# Criar um DataFrame para a tabela
# Criar um DataFrame com os menores p-valores e seus números de onda correspondentes
min_p_values = p_values[significant_indices]
min_wavenumbers = wavenumbers[significant_indices]

results_df = pd.DataFrame({
    'Número de Onda': min_wavenumbers,
    'P-valor': min_p_values
})

# Ordenar a tabela pelos p-valores (do menor para o maior)
results_df = results_df.sort_values(by='P-valor').reset_index(drop=True)

# Exibir a tabela
print("\nTabela das Regiões do Espectro com os Menores P-valores:")
results_df