# Sistema de información estructurado y semi-estructurado

### Instituto Tecnológico de Toluca

### Números de Control:
- **21280622**
- **21281153**
- **21281281**

### Proyecto hecho por:
- **Mario Pérez Hernández**
- **Jair**
- **Jefte Donovan**


<p>Este código convierte un archivo CSV llamado <code>vgsales.csv</code> en un archivo XML llamado <code>vgsales.xml</code>. A continuación se explica cada parte del proceso:</p>
<ul>
    <li><strong>Importación de librerías:</strong> Se importan <code>pandas</code> para manipular datos y <code>xml.etree.ElementTree</code> para crear el archivo XML.</li>
    <li><strong>Lectura del archivo CSV:</strong> Se lee el archivo <code>vgsales.csv</code> usando <code>pandas.read_csv</code>, almacenando los datos en un DataFrame llamado <code>df</code>.</li>
    <li><strong>Creación del elemento raíz:</strong> Se crea el elemento raíz del XML llamado <code>&lt;vgsales&gt;</code>.</li>
    <li><strong>Conversión de filas a elementos XML:</strong> Se itera sobre cada fila del DataFrame. Por cada fila, se crea un elemento <code>&lt;game&gt;</code>. Luego, para cada columna, se crea un subelemento con el nombre de la columna y el valor correspondiente de la fila.</li>
    <li><strong>Escritura del archivo XML:</strong> Se crea un árbol XML con el elemento raíz y se escribe en el archivo <code>vgsales.xml</code> con codificación UTF-8 y declaración XML.</li>
    <li><strong>Mensaje de confirmación:</strong> Se imprime un mensaje indicando que el archivo XML se generó correctamente.</li>
</ul>
<p>Este proceso es útil para transformar datos tabulares en un formato jerárquico como XML, facilitando su integración con otros sistemas o aplicaciones que requieran este formato.</p>
<p>A continuación se propone el código ejecutable para crear el XML.</p>


In [ ]:
import pandas as pd
import xml.etree.ElementTree as ET

# Leer el archivo CSV
df = pd.read_csv("vgsales.csv")

# Crear el elemento raíz
root = ET.Element("vgsales")

# Iterar sobre cada fila y agregar los datos al XML
for _, row in df.iterrows():
    game = ET.SubElement(root, "game")
    for col in df.columns:
        ET.SubElement(game, col).text = str(row[col])

# Crear árbol y escribir en el archivo XML
tree = ET.ElementTree(root)
tree.write("vgsales.xml", encoding="utf-8", xml_declaration=True)

print("El archivo XML 'vgsales.xml' se ha generado correctamente.")
