In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Cargar el archivo metadata
metadata_file_path = '/content/metadata.csv'
metadata_df = pd.read_csv(metadata_file_path)

# Limpiar los nombres de las columnas
metadata_df.columns = metadata_df.columns.str.strip()

# Cargar el archivo de taxonomía
taxonomy_file_path = '/content/taxonomy_relabd.species.csv'
taxonomy_df = pd.read_csv(taxonomy_file_path)

# Obtener los grupos únicos de 'NIH Racial Category'
nih_racial_categories_unique = metadata_df['NIH Racial Category'].unique()

# Inicializar un diccionario para almacenar los resultados
nih_racial_bacteria_summary = {}

# Iterar sobre cada categoría única de 'NIH Racial Category'
for category in nih_racial_categories_unique:
    # Filtrar la metadata para la categoría actual
    category_df = metadata_df[metadata_df['NIH Racial Category'] == category]
    
    # Filtrar los datos de taxonomía para los especímenes que coinciden con la categoría actual
    filtered_taxonomy_df = taxonomy_df[taxonomy_df['specimen'].isin(category_df['specimen'])]
    
    # Calcular las bacterias más comunes
    most_common_bacteria = filtered_taxonomy_df.iloc[:, 1:].mean().sort_values(ascending=False).head(10)
    
    # Almacenar el resultado en el diccionario
    nih_racial_bacteria_summary[category] = most_common_bacteria

# Convertir el diccionario a un DataFrame para una mejor presentación
nih_racial_bacteria_summary_df = pd.DataFrame(nih_racial_bacteria_summary)

# Crear el mapa de calor con los ejes invertidos
heatmap_data = nih_racial_bacteria_summary_df.transpose()

plt.figure(figsize=(12, 8))
sns.heatmap(heatmap_data.transpose(), annot=True, fmt=".2f", cmap="Reds", linewidths=.5, annot_kws={"size": 8})
plt.title('Heatmap of Common Bacteria by NIH Racial Category')
plt.xlabel('NIH Racial Category')
plt.ylabel('Bacteria')
plt.xticks(rotation=45, ha='right')
plt.yticks(rotation=0)
plt.tight_layout()

# Mostrar el gráfico
plt.show()
