# Desafío Práctico: Procesador de Comentarios de Clientes

## 1. El Escenario y el Objetivo
El objetivo de este desafío es tomar una lista de comentarios de clientes en formato "crudo" y transformarla en una estructura de datos limpia y útil (una lista de diccionarios). Cada diccionario contendrá el texto original, el texto procesado y métricas clave extraídas del comentario.

## 2. Los Datos de Entrada
Comenzamos con la lista de datos sin procesar proporcionada para el ejercicio.

In [7]:
comentarios_clientes = [
    "  Excelente producto! Muy bueno. Lo recomiendo. ",
    "El servicio de entrega fue TERRIBLE. Muy malo. ",
    "         me gusto mucho, es de buena calidad. ",
    "No fue lo que esperaba, el material es de mala calidad.",
    "bueno bonito y barato! Excelente! "
]

## 3. El Proceso: Construyendo la Solución Paso a Paso

Para resolver el problema, seguimos una secuencia lógica de pasos dentro de un único bucle `for` para procesar cada comentario de forma individual y eficiente.

### Paso 3.1: Estructura Principal y Normalización
Iniciamos con una lista vacía para guardar los resultados. Usamos `enumerate()` en nuestro bucle `for` para obtener un ID único (`índice`) y el `comentario` en cada iteración. La primera acción dentro del bucle es la **normalización del texto**: convertir a minúsculas y eliminar espacios extra.

### Paso 3.2: Cálculo de Métricas
Con el texto ya limpio, calculamos dos métricas simples:
* **Cantidad de Palabras:** Usando `.split()` para dividir el string en una lista de palabras y `len()` para contar los elementos de esa lista.
* **Cantidad de Caracteres:** Usando `len()` sobre el string normalizado.

### Paso 3.3: Análisis de Sentimiento con RegEx
Usamos un bloque `if/elif/else` para determinar el sentimiento. En lugar de buscar palabras exactas, aplicamos **expresiones regulares (`re.search`)** para encontrar patrones (ej. `buen[oa]`) y hacer nuestro análisis más robusto.

### Paso 3.4: Ensamblaje y Almacenamiento
Finalmente, creamos un diccionario temporal para guardar todos los datos procesados de la iteración actual y lo añadimos a nuestra lista de resultados con `.append()`.

## 4. El Código Final: Solución Integrada
Integrando todos los pasos anteriores, llegamos a una solución final, limpia y eficiente que resuelve el desafío en un solo bloque de código.

In [61]:
import re

# Lista vacía para almacenar los resultados finales
resultados_analisis = []

# Iteramos sobre la lista original con enumerate para obtener un ID automático
for indice, comentario_original in enumerate(comentarios_clientes):

    # Paso 1: Normalizar el texto
    # Encadenamos métodos para limpiar y estandarizar el comentario en una línea.
    texto_normalizado = comentario_original.strip().lower()

    # Paso 2: Calcular métricas
    num_palabras = len(texto_normalizado.split())
    num_caracteres = len(texto_normalizado)

    # Paso 3: Determinar el sentimiento
    sentimiento = "Neutral" # Valor por defecto
    if re.search("buen[oa]|excelente", texto_normalizado):
        sentimiento = 'Positivo'
    elif re.search("mal[oa]|terrible", texto_normalizado):
        sentimiento = 'Negativo'

    # Paso 4: Ensamblar el diccionario para este comentario
    analisis_dict = {
        'id_comentario': indice + 1,
        'texto_original': comentario_original,
        'texto_normalizado': texto_normalizado,
        'num_palabras': num_palabras,
        'num_caracteres': num_caracteres,
        'sentimiento': sentimiento
    }

    # ... y añadirlo a nuestra lista de resultados
    resultados_analisis.append(analisis_dict)

Se realizo la limpieza de los datos, cantidad de comentarios procesados: 5
['Excelente producto! muy bueno. lo recomiendo.', 'El servicio de entrega fue terrible. muy malo.', 'Me gusto mucho, es de buena calidad.', 'No fue lo que esperaba, el material es de mala calidad.', 'Bueno bonito y barato! excelente!']


## 5. El Resultado: Datos Estructurados y Listos para Analizar
El resultado final es una lista de diccionarios, un formato de datos estructurado ideal para ser cargado en una base de datos, un DataFrame de Pandas, o para cualquier análisis posterior.

In [130]:
# Para una mejor visualización, imprimimos cada diccionario de la lista
for resultado in resultados_analisis:
    print(resultado)

{'Id': 1, 'Comentario': 'Excelente producto! muy bueno. lo recomiendo.', 'Cantidad Palabras': 6, 'Cantidad Caracteres': 45, 'Sentimiento': 'Positivo'}
{'Id': 2, 'Comentario': 'El servicio de entrega fue terrible. muy malo.', 'Cantidad Palabras': 8, 'Cantidad Caracteres': 46, 'Sentimiento': 'Negativo'}
{'Id': 3, 'Comentario': 'Me gusto mucho, es de buena calidad.', 'Cantidad Palabras': 7, 'Cantidad Caracteres': 36, 'Sentimiento': 'Positivo'}
{'Id': 4, 'Comentario': 'No fue lo que esperaba, el material es de mala calidad.', 'Cantidad Palabras': 11, 'Cantidad Caracteres': 55, 'Sentimiento': 'Negativo'}
{'Id': 5, 'Comentario': 'Bueno bonito y barato! excelente!', 'Cantidad Palabras': 5, 'Cantidad Caracteres': 33, 'Sentimiento': 'Positivo'}
