---

<div style="display: flex; align-items: center; justify-content: space-between;">
  <img src="../../.images/PNAV-logo.png" alt="Logo del PNAV" style="width: auto; max-height: 100px;">
  <img src="../../.images/MITECO-logo_background.png" alt="Logo del MITECO" style="width: auto; max-height: 100px;">
</div>

---

# Dataset sobre Consumo Energético en Inferencia

Este notebook comparte el **LLM Inference Energy Consumption Dataset**, un recurso detallado que proporciona perfiles de consumo energético de diversos LLMs en diferentes configuraciones de hardware. Este dataset es útil para investigaciones relacionadas con la eficiencia energética y la sostenibilidad en IA.

## 1. Información del dataset

- **Nombre del dataset**: LLM Inference Energy Consumption Dataset  
- **Autoría**:  
  - Erik Johannes Husom  
  - Arda Goknil  
  - Sagar Sen  
  - Lwin Khin Shar  
- **Afiliación de los autores**:  
  - Trustworthy Green IoT Software, SINTEF Digital  
  - Singapore Management University  
- **Propósito**: Comprender el consumo de energía durante la inferencia de modelos de lenguaje y comparar configuraciones diversas.  
- **Licencia**: [CC BY-SA 4.0](https://creativecommons.org/licenses/by-sa/4.0/)  
- **Alojamiento**: [Hugging Face](https://huggingface.co/datasets/ejhusom/llm-inference-energy-consumption)  
- **Publicación inicial**: Junio 2024  

## 2. Cómo citar el dataset
Si usas este dataset en tus investigaciones, se recomienda citarlo así:

> Husom, E. J., Goknil, A., Sen, S., & Shar, L. K. (2024). **LLM Inference Energy Consumption Dataset**. Disponible en [Hugging Face](https://huggingface.co/datasets/ejhusom/llm-inference-energy-consumption). Publicado bajo licencia CC BY-SA 4.0.

## 3. Paper relacionado
El dataset está descrito en el artículo académico:  
*"The Price of Prompting: Profiling Energy Use in Large Language Model Inference"*.

## 4. Contacto
Para consultas o sugerencias relacionadas con el dataset, contactar a:  
Erik Johannes Husom, [erik.johannes.husom@sintef.no](mailto:erik.johannes.husom@sintef.no).

## 5. Descarga

In [5]:
import requests
import csv
import os

# Define la URL de la API
url = "https://datasets-server.huggingface.co/first-rows?dataset=ejhusom%2Fllm-inference-energy-consumption&config=default&split=train"

# Realiza la petición GET
response = requests.get(url)

# Configuración
output_dir = "energy_consumption"

# Crear la carpeta de salida si no existe
os.makedirs(output_dir, exist_ok=True)

# Verifica que la respuesta sea exitosa
if response.status_code == 200:
    # Convierte la respuesta JSON a un diccionario
    data = response.json()
    
    # Extrae las filas del dataset
    rows = data.get("rows", [])
    
    # Define la ruta del archivo CSV
    os.makedirs(output_dir, exist_ok=True)  # Crea la carpeta si no existe
    csv_path = os.path.join(output_dir, "data.csv")
    
    # Guarda los datos en un archivo CSV
    with open(csv_path, mode="w", newline="", encoding="utf-8") as csv_file:
        writer = csv.writer(csv_file)
        
        # Escribe el encabezado
        if rows:
            headers = rows[0]["row"].keys()
            writer.writerow(headers)
        
        # Escribe las filas
        for row in rows:
            writer.writerow(row["row"].values())
    
    print(f"Datos guardados en {csv_path}")
else:
    print(f"Error al realizar la petición. Código de estado: {response.status_code}")

Datos guardados en energy_consumption\data.csv
