<a href="https://colab.research.google.com/github/DiegoCarrillo19/Absenteeism-Random-Forest/blob/main/Transformar_tree_rules_txt_a_csv.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import re
import csv

def parse_tree_rules(rules_text):
    """
    Parsea las reglas del árbol desde el texto y devuelve una lista de dicts con columnas:
    level, feature, operator, threshold, class, rule_text
    """
    lines = rules_text.strip().split('\n')
    data = []

    for line in lines:
        # Contar nivel por cantidad de "|   "
        level = line.count('|   ')

        # Quitar los | y espacios iniciales
        line_clean = line.replace('|   ', '').replace('|--- ', '').strip()

        # Detectar si es nodo hoja
        class_match = re.search(r'class: (\d+)', line_clean)
        if class_match:
            # Nodo hoja con clase predicha
            class_label = class_match.group(1)
            data.append({
                'level': level,
                'feature': None,
                'operator': None,
                'threshold': None,
                'class': class_label,
                'rule_text': line_clean
            })
        else:
            # Nodo interno: separar feature, operador y umbral
            # Ejemplo: Age <= 38.54
            m = re.match(r'([\w_]+)\s*([<>=]+)\s*([\d\.]+)', line_clean)
            if m:
                feature, operator, threshold = m.groups()
                data.append({
                    'level': level,
                    'feature': feature,
                    'operator': operator,
                    'threshold': threshold,
                    'class': None,
                    'rule_text': line_clean
                })
            else:
                # Línea que no cumple el patrón esperado (posible problema)
                data.append({
                    'level': level,
                    'feature': None,
                    'operator': None,
                    'threshold': None,
                    'class': None,
                    'rule_text': line_clean
                })
    return data

# --- EJEMPLO DE USO ---

# Lee las reglas del archivo (puedes cambiar por tu archivo)
with open('reglas_arbol.txt', 'r') as f:
    rules_text = f.read()

parsed_rules = parse_tree_rules(rules_text)

# Exportar a CSV para cargar en Power BI
keys = ['level', 'feature', 'operator', 'threshold', 'class', 'rule_text']
with open('tree_rules_parsed.csv', 'w', newline='') as output_file:
    dict_writer = csv.DictWriter(output_file, fieldnames=keys)
    dict_writer.writeheader()
    dict_writer.writerows(parsed_rules)

print("Archivo 'tree_rules_parsed.csv' creado con éxito.")


Archivo 'tree_rules_parsed.csv' creado con éxito.
