# 🔥 Reto 18: Contar palabras en un archivo de texto 🔥

## 🏆 Objetivo:

En este reto, crearás un programa que lea un archivo de texto (.txt), cuente la cantidad total de palabras y muestre las N palabras más frecuentes junto con sus respectivas apariciones.

## 📝 Requisitos:

1️⃣ Pedir al usuario el nombre del archivo de texto.  
2️⃣ Leer el contenido del archivo.  
3️⃣ Limpiar el texto eliminando puntuación y convirtiéndolo a minúsculas.  
4️⃣ Contar la cantidad total de palabras.  
5️⃣ Mostrar las N palabras más frecuentes (el usuario elige N).  
6️⃣ Manejar posibles errores, como archivos inexistentes.  

## 📌 Ejemplo de ejecución:

\>>> Enter the filename: sample.txt  
\>>> How many top words do you want to see? 5  

📊 Word Frequency Analysis:  
Total words: 350  
Unique words: 180  

### Top 5 most frequent words:

the      &rarr;  35 times  
and      &rarr;  27 times  
python   &rarr;  18 times  
learning &rarr;  12 times  
program  &rarr;  10 times

## 🔍 Pistas:

🔹 Puedes usar collections.Counter para contar las palabras más frecuentes.  
🔹 Usa try-except para manejar errores si el archivo no existe.  
🔹 Puedes probar con un archivo .txt que tengas o generar uno con texto de prueba.  

In [1]:
import re
from collections import Counter

def count_words_in_file(file_name):
    """
    Reads a text file and counts the frequency of each word.

    :param file_name: The name of the file (without .txt extension).
    :return: Total word count, word frequency dictionary, and unique word count.
    """
    cleaned_word_list = []

    try:
        with open(file_name + '.txt', 'r', encoding='utf-8') as file:
            for line in file:
                # Tokenize words from the line and clean punctuation
                words = re.findall(r"\b\w+\b", line.lower())  
                cleaned_word_list.extend(words)

        # Count total words and unique words
        total_words = len(cleaned_word_list)
        word_count = Counter(cleaned_word_list)
        unique_words_count = len(word_count)

        return total_words, word_count, unique_words_count

    except FileNotFoundError:
        print(f'❌ Error: The file "{file_name}.txt" was not found.')
        return None, None, None


In [2]:
# Main program loop
while True:
    file_name = input('>>> Enter the file name (without .txt): ').strip()

    total_words, word_count, unique_words_count = count_words_in_file(file_name)

    if total_words is None:
        continue  # Ask for a valid file again

    while True:
        num_words_to_show = input('>>> How many most frequent words do you want to see? ').strip()

        if not num_words_to_show.isdigit():
            print('❌ Error: Please enter a valid number.')
            continue
        
        num_words_to_show = int(num_words_to_show)

        print('\n📊 Word Frequency Analysis:')
        print(f'Total words: {total_words}')
        print(f'Unique words: {unique_words_count}')
        print(f'\n🔝 Top {num_words_to_show} most frequent words:\n')

        top_words = word_count.most_common(num_words_to_show)

        for word, frequency in top_words:
            print(f'{word:<12} → {frequency:>3} times')

        break  # Exit the inner loop
    break  # Exit the main loop


>>> Enter the file name (without .txt):  poema2
>>> How many most frequent words do you want to see?  5



📊 Word Frequency Analysis:
Total words: 104
Unique words: 74

🔝 Top 5 most frequent words:

te           →   6 times
y            →   6 times
que          →   5 times
tu           →   5 times
a            →   4 times
