# 🧠 Reto 63: Detector de Patrones Repetitivos en Texto 🧠

## 🏆 Objetivo:

Desarrollar un programa que analice un texto e identifique patrones repetitivos de palabras, como repeticiones exactas, secuencias duplicadas o estructuras redundantes. Es útil en corrección de estilo, análisis literario o limpieza de datos textuales.

## 📝 Requisitos:

1️⃣ El programa debe permitir ingresar o pegar un bloque de texto largo.  
2️⃣ Detectar:  
🔸 Palabras repetidas seguidas (ej: "muy muy bueno").  
🔸 Frases cortas que se repiten en el texto (ej: "en este caso").  
🔸 Estructuras de repetición tipo eco (ej: "el problema es el problema").  
3️⃣ Resaltar la cantidad de repeticiones encontradas.  
4️⃣ Mostrar las frases o palabras repetidas y cuántas veces aparecen.  
5️⃣ Ignorar mayúsculas/minúsculas y puntuación al hacer las comparaciones.  
6️⃣ Permitir ingresar el número mínimo de palabras que debe tener un patrón para ser considerado (ej: mínimo 2 palabras).  
7️⃣ El resultado debe ser impreso en consola de forma legible.  

## 📌 Ejemplo de ejecución:

Ingrese el texto a analizar:  
\>> El problema es el problema. En este caso, en este caso se puede observar un patrón. Muy muy bueno este código.  

Ingrese el número mínimo de palabras por patrón a buscar:  
\>> 2  

🔍 Resultados:  
- Repetición detectada: "el problema" - 2 veces  
- Repetición detectada: "en este caso" - 2 veces  
- Repetición detectada: "muy muy" - 1 vez (repetición inmediata)  

## 🔍 Pistas:  
🔹 Usa expresiones regulares para buscar repeticiones inmediatas.  
🔹 Convierte el texto a minúsculas y limpia signos de puntuación para facilitar el análisis.  
🔹 Puedes usar diccionarios para contar secuencias repetidas.  
🔹 Prueba dividiendo el texto en n-gramas (frases de N palabras) para detectar patrones más allá de palabras individuales.  
🔹 Usa `collections.Counter` para contar ocurrencias de patrones.  

In [3]:
import re
from collections import Counter

def limpiar_texto(texto):
    """Convierte el texto a minúsculas y elimina puntuaciones."""
    return re.sub(r'[^\w\s]', '', texto.lower())

def encontrar_patrones(texto, min_palabras):
    """Busca patrones repetitivos en el texto."""
    palabras = texto.split()
    patrones = Counter()

    for n in range(min_palabras, len(palabras) + 1):
        for i in range(len(palabras) - n + 1):
            frase = ' '.join(palabras[i:i+n])
            patrones[frase] += 1

    # Solo devolver patrones con más de una repetición
    patrones_filtrados = {
        frase: conteo for frase, conteo in patrones.items() if conteo > 1
    }

    # Ordenar por número de repeticiones descendente
    return dict(sorted(patrones_filtrados.items(), key=lambda x: x[1], reverse=True))

def analizar_texto():
    """Función principal para analizar un texto."""
    texto = input("Ingrese el texto a analizar:\n>> ").strip()
    try:
        min_palabras = int(input("Ingrese el número mínimo de palabras por patrón a buscar:\n>> "))
        if min_palabras <= 0:
            raise ValueError
    except ValueError:
        print("⚠️ Por favor, ingrese un número entero positivo para las palabras mínimas.")
        return

    texto_limpio = limpiar_texto(texto)
    palabras_repetidas = re.findall(r'\b(\w+)\s+\1\b', texto_limpio)
    patrones = encontrar_patrones(texto_limpio, min_palabras)

    print("\n🔍 Resultados:")
    if palabras_repetidas:
        for palabra in sorted(set(palabras_repetidas)):
            print(f"- Repetición detectada: \"{palabra} {palabra}\" - {palabras_repetidas.count(palabra)} veces (repetición inmediata)")

    if patrones:
        for frase, conteo in patrones.items():
            print(f"- Repetición detectada: \"{frase}\" - {conteo} veces")
    if not palabras_repetidas and not patrones:
        print("✅ No se encontraron repeticiones significativas.")

analizar_texto()


Ingrese el texto a analizar:
>>  El problema es el problema. En este caso, en este caso se puede observar un patrón. Muy muy bueno este código.
Ingrese el número mínimo de palabras por patrón a buscar:
>>  2



🔍 Resultados:
- Repetición detectada: "muy muy" - 1 veces (repetición inmediata)
- Repetición detectada: "el problema" - 2 veces
- Repetición detectada: "en este" - 2 veces
- Repetición detectada: "este caso" - 2 veces
- Repetición detectada: "en este caso" - 2 veces
