# Análisis de Nombres de Bebés Populares en EE.UU.

## Introducción

Este análisis se basa en la extracción de datos de archivos HTML que contienen información sobre los nombres más populares para bebés nacidos en EE.UU. a lo largo de varios años. A continuación, se presentan los resultados del análisis para cada uno de los años procesados.


In [9]:
import re

filename = '../data/baby1990.html'


In [10]:
import re

# Lista de archivos que deseas procesar
filenames = [
    '../data/baby1990.html',
    '../data/baby1992.html',
    '../data/baby1994.html',
    '../data/baby1996.html',
    '../data/baby1998.html',
    '../data/baby2000.html',
    '../data/baby2002.html',
    '../data/baby2004.html',
    '../data/baby2006.html',
    '../data/baby2008.html',
]

# Función para procesar un archivo HTML y almacenar resultados en un diccionario
def procesar_archivo(filename):
    # Leer el contenido del archivo HTML
    with open(filename, 'r', encoding='utf-8') as file:
        html_contenido = file.read()

    # 1. Encontrar el año con una expresión regular
    year_match = re.search(r"Popularity in (\d{4})", html_contenido)
    if year_match:
        year = year_match.group(1)
        print("Año:", year)
    print(" ")

    # 2. Extraer nombres y clasificaciones con expresiones regulares
    names_data = re.findall(r"<tr align=\"right\"><td>(\d+)</td><td>(\w+)</td><td>(\w+)</td>", html_contenido)
    names_dict = {}  # Diccionario para almacenar nombres y clasificaciones

    for rank, name_boy, name_girl in names_data:
        # Verificar si el nombre de niño no está en el diccionario y agregarlo
        if name_boy not in names_dict:
            names_dict[name_boy] = rank

        # Verificar si el nombre de niña no está en el diccionario y agregarlo
        if name_girl not in names_dict:
            names_dict[name_girl] = rank

    # 3. Imprimir los nombres individuales y su ranking
    for name, rank in names_dict.items():
        print(f"{name} Posición: {rank}")
    print(" ")

    # 4. Crear una lista con los nombres ordenados alfabéticamente
    sorted_names = sorted(names_dict.keys())

    # 5. Crear una lista con el formato especificado
    formatted_list = [f"Año: {year}"]
    formatted_list_name = []

    for name in sorted_names:
        rank = names_dict[name]
        formatted_list_name.append(f"{name} Posición: {rank}")

    formatted_list_name.sort()
    formatted_list.extend(formatted_list_name)

    # Devolver el resultado como un diccionario
    return {
        'year': year,
        'names_dict': names_dict,
        'sorted_names': sorted_names,
        'formatted_list': formatted_list,
    }

# Diccionario para almacenar los resultados por año
results_by_year = {}

# Procesar cada archivo en la lista
for filename in filenames:
    print("\nProcesando archivo:", filename)
    result = procesar_archivo(filename)
    year = result['year']
    results_by_year[year] = result  # Acceder a los resultados por año desde el diccionario

# Recorrer el diccionario results_by_year y acceder a los nombres ordenados alfabéticamente de cada año
for year, results in results_by_year.items():
    print(f"\nNombres ordenados alfabéticamente para el año {year}:")
    print(results['sorted_names'])


Procesando archivo: ../data/baby1990.html
Año: 1990
 
Michael Posición: 1
Jessica Posición: 1
Christopher Posición: 2
Ashley Posición: 2
Matthew Posición: 3
Brittany Posición: 3
Joshua Posición: 4
Amanda Posición: 4
Daniel Posición: 5
Samantha Posición: 5
David Posición: 6
Sarah Posición: 6
Andrew Posición: 7
Stephanie Posición: 7
James Posición: 8
Jennifer Posición: 8
Justin Posición: 9
Elizabeth Posición: 9
Joseph Posición: 10
Lauren Posición: 10
Ryan Posición: 11
Megan Posición: 11
John Posición: 12
Emily Posición: 12
Robert Posición: 13
Nicole Posición: 13
Nicholas Posición: 14
Kayla Posición: 14
Anthony Posición: 15
Amber Posición: 15
William Posición: 16
Rachel Posición: 16
Jonathan Posición: 17
Courtney Posición: 17
Kyle Posición: 18
Danielle Posición: 18
Brandon Posición: 19
Heather Posición: 19
Jacob Posición: 20
Melissa Posición: 20
Tyler Posición: 21
Rebecca Posición: 21
Zachary Posición: 22
Michelle Posición: 22
Kevin Posición: 23
Tiffany Posición: 23
Eric Posición: 24
Che

## Algunos Resultados

### Año 1990

- Nombres ordenados alfabéticamente:
  - Alice
  - Amanda
  - Andrew
  - ...

### Año 1992

- Nombres ordenados alfabéticamente:
  - Aaron
  - Abigail
  - Adam
  - ...

### Año 1994

- Nombres ordenados alfabéticamente:
  - Aaliyah
  - Aaron
  - Abbey
  - ...