1. Consulte que hacen los siguientes métodos de strings en python: endswith, startswith, isalpha, isalnum, isdigit, isspace, istitle, islower, isupper.



# Métodos de Strings en Python

## Métodos de Coincidencia
- **endswith()**: Verifica si una cadena termina con un patrón específico
- **startswith()**: Verifica si una cadena comienza con un patrón específico

## Métodos de Validación de Caracteres
- **isalpha()**: Verifica si todos los caracteres son letras
- **isalnum()**: Verifica si todos los caracteres son alfanuméricos (letras y números)
- **isdigit()**: Verifica si todos los caracteres son números
- **isspace()**: Verifica si todos los caracteres son espacios en blanco

## Métodos de Formato
- **istitle()**: Verifica si la cadena está en formato título (primera letra de cada palabra en mayúscula)
- **islower()**: Verifica si todos los caracteres están en minúscula
- **isupper()**: Verifica si todos los caracteres están en mayúscula


2. Procesar el <a href="https://www.py4e.com/code3/mbox.txt">archivo</a> y extraer:
 - Cantidad de vocales
 - Cantidad de consonantes
 - Listado de las 50 palabras que más se repiten

In [9]:
import urllib.request

def contar_vocales(texto):
    """
    Cuenta la cantidad de vocales en un texto.

    Args:
        texto: String con el texto a analizar

    Returns:
        dict: Diccionario con el conteo de cada vocal
    """
    vocales = 'aeiou'
    conteo = {v: texto.lower().count(v) for v in vocales}
    return conteo

def contar_consonantes(texto):
    """
    Cuenta la cantidad de consonante en un texto.

    Args:
        texto: String con el texto a analizar

    Returns:
        int: Cantidad de consonantes
    """
    consonantes = 'bcdfghjklmnñpqrstvwxyz'
    conteo =  sum(texto.lower().count(c) for c in consonantes)
    return conteo

def palabras_mas_repetidas(texto, n=50):
    """
    Cuenta las palabras más frecuentes en un texto.

    Args:
        texto: String con el texto a analizar
        n: Cantidad de palabras a obtener

    Returns:
        list: Lista de tuplas (palabra, frecuencia) ordenada por frecuencia
    """
    # Convertir a minúsculas y dividir en palabras
    palabras = texto.lower().split()

    # Crear diccionario de frecuencias
    frecuencias = {}
    for palabra in palabras:
        frecuencias[palabra] = frecuencias.get(palabra, 0) + 1

    # Ordenar por frecuencia (descendente) y luego alfabéticamente
    mas_frecuentes = sorted(frecuencias.items(), key=lambda x: (-x[1], x[0]))[:n]
    return mas_frecuentes



def leer_url(url):
    """
    Lee el contenido de una URL.

    Args:
        url: String con la URL a leer

    Returns:
        str: Contenido del archivo
    """
    try:
        # Agregar headers para simular navegador
        headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) '
                         'AppleWebKit/537.36 (KHTML, like Gecko) '
                         'Chrome/91.0.4472.124 Safari/537.36'
        }
        req = urllib.request.Request(url, headers=headers)

        with urllib.request.urlopen(req) as respuesta:
            return respuesta.read().decode('utf-8')
    except Exception as e:
        print(f"Error al leer la URL: {str(e)}")
        return ""

def main():
    """
    Función principal del programa.
    """

    # URL del archivo
    url = "https://www.py4e.com/code3/mbox.txt"

    # Leer el archivo
    texto = leer_url(url)

    if texto:
        # Contar vocales
        conteo = contar_vocales(texto)

        # Mostrar conteo de vocales
        print("Conteo de vocales:")
        for vocal, cantidad in conteo.items():
            print(f"'{vocal}': {cantidad}")

        print(f"\nTotal de vocales: {sum(conteo.values())}")

        #Mostrar número de consonantes

        print(f"\nTotal de consonantes: {contar_consonantes(texto)}")

        #Imprimir el listado con las palabras más comunes
        print("\nPalabras más comunes:")
        for palabra, frecuencia in palabras_mas_repetidas(texto):
            print(f"'{palabra}': {frecuencia}")
    else:
        print("No se pudo obtener el contenido del archivo.")


if __name__ == "__main__":
    main()

Conteo de vocales:
'a': 355337
'e': 404033
'i': 316771
'o': 309157
'u': 212537

Total de vocales: 1597835

Total de consonantes: 2612121

Palabras más comunes:
'2007': 20413
'from': 18126
'by': 18028
'received:': 16173
'with': 12756
'id': 12607
'-0500': 11774
'dec': 9267
'nov': 8988
'for': 7714
'esmtp': 7188
'nakamura.uits.iupui.edu': 7188
'paploo.uhi.ac.uk': 7188
'<source@collab.sakaiproject.org>;': 5391
'charset=utf-8': 5391
'text/plain;': 5391
'(gmt)': 4932
'+0000': 4932
'oct': 4164
'you': 3621
'(cyrus': 3594
'(localhost': 3594
'(postfix)': 3594
'[127.0.0.1])': 3594
'lmtpa;': 3594
'murder': 3594
'smtp': 3594
'date:': 3587
'thu,': 3534
'tue,': 3305
'fri,': 2964
'-0400': 2910
'to': 2767
'mon,': 2704
'wed,': 2582
'the': 2544
'svn': 2528
'-': 2037
'2007)': 2032
'modify': 1884
'new': 1877
'this': 1877
'message': 1839
'29': 1834
'was': 1834
'sakai': 1823
'at': 1822
'can': 1821
'using': 1821
'set': 1812
