# 2. Proyecto 2 - La paradoja del cumpleaños

La Paradoja del Cumpleaños, también llamada el Problema de Cumpleaños, es la probabilidad sorprendentemente alta de que dos personas tengan el mismo cumpleaños incluso en un pequeño grupo de personas. En un grupo de 70 personas, hay un 99,9 por ciento de probabilidad de que dos personas tengan el mismo cumpleaños. Pero incluso en un grupo tan pequeño como 23 personas, hay un 50 por ciento de posibilidades de un cumpleaños en la misma fecha. Este programa realiza varios experimentos de probabilidad para determinar los porcentajes para grupos de diferentes tamaños. Llamamos a este tipo de experimentos, en los que realizamos múltiples ensayos aleatorios para comprender los resultados probables, experimentos de Monte Carlo.

Puede obtener más información sobre la Paradoja del Cumpleaños en https://en.wikipedia.org/wiki/Birthday_problem.

## 2.1 El programa en acción
Cuando ejecutes `birthdayparadox.py`, la salida se verá así:
```
Birthday Paradox, by Al Sweigart al@inventwithpython.com
--snip--
How many birthdays shall I generate? (Max 100)
> 23
Here are 23 birthdays:
Oct 9, Sep 1, May 28, Jul 29, Feb 17, Jan 8, Aug 18, Feb 19, Dec 1, Jan 22,
May 16, Sep 25, Oct 6, May 6, May 26, Oct 11, Dec 19, Jun 28, Jul 29, Dec 6,
Nov 26, Aug 18, Mar 18
In this simulation, multiple people have a birthday on Jul 29
Generating 23 random birthdays 100,000 times...
Press Enter to begin...
Let's run another 100,000 simulations.
0 simulations run...
10000 simulations run...
--snip--
90000 simulations run...
100000 simulations run.
Out of 100,000 simulations of 23 people, there was a
matching birthday in that group 50955 times. This means
that 23 people have a 50.95 % chance of
having a matching birthday in their group.
```

## 2.2 Cómo funciona

La ejecución de 100.000 simulaciones puede llevar un tiempo, por lo que las líneas 95 y 96 informan que otras 10.000 simulaciones han terminado. Esta retroalimentación informa al usuario que el programa no se ha congelado. Note que algunos de los enteros, como 10_000 en la línea 95 y 100_000 en las líneas 93 y 103, tienen subrayados. Estos subrayados no tienen un significado especial, pero Python los permite para que los programadores puedan hacer que los valores enteros sean más fáciles de leer. En otras palabras, es más fácil leer “cien mil” en 100_000 que en 100000.

In [None]:
"""Birthday Paradox Simulation, by Al Sweigart al@inventwithpython.com
Explore the surprising probabilities of the "Birthday Paradox".
More info at https://en.wikipedia.org/wiki/Birthday_problem
This code is available at https://nostarch.com/big-book-small-python-programming
Tags: short, math, simulation"""

import datetime, random


def get_birthdays(number_of_birthdays):
    """Returns a list of number random date objects for birthdays."""
    birthdays_list = []
    for j in range(number_of_birthdays):
        # The year is unimportant for our simulation, as long as all
        # birthdays have the same year.
        start_of_year = datetime.date(2001, 1, 1)

        # Get a random day into the year:
        random_number_of_days = datetime.timedelta(random.randint(0, 364))
        generated_birthday = start_of_year + random_number_of_days
        birthdays_list.append(generated_birthday)
    return birthdays_list


def get_match(birthdays_list):
    """Returns the date object of a birthday that occurs more than once
    in the birthdays list."""
    if len(birthdays_list) == len(set(birthdays_list)):
        return None  # All birthdays are unique, so return None.

    # Compare each birthday to every other birthday:
    for a, birthdayA in enumerate(birthdays_list):
        for b, birthdayB in enumerate(birthdays_list[a + 1 :]):
            if birthdayA == birthdayB:
                return birthdayA  # Return the matching birthday.
    return None


# Display the intro:
print('''Birthday Paradox, by Al Sweigart al@inventwithpython.com

The birthday paradox shows us that in a group of N people, the odds
that two of them have matching birthdays is surprisingly large.
This program does a Monte Carlo simulation (that is, repeated random
simulations) to explore this concept.

(It's not actually a paradox, it's just a surprising result.)
''')

# Set up a tuple of month names in order:
MONTHS = ('Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun',
          'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec')

while True:  # Keep asking until the user enters a valid amount.
    print('How many birthdays shall I generate? (Max 100)')
    response = input('> ')
    if response.isdecimal() and (0 < int(response) <= 100):
        num_b_days = int(response)
        break  # User has entered a valid amount.
print()

# Generate and display the birthdays:
print('Here are', num_b_days, 'birthdays:')
birthdays = get_birthdays(num_b_days)
for i, birthday in enumerate(birthdays):
    if i != 0:
        # Display a comma for each birthday after the first birthday.
        print(', ', end='')
    month_name = MONTHS[birthday.month - 1]
    dateText = '{} {}'.format(month_name, birthday.day)
    print(dateText, end='')
print()
print()

# Determine if there are two birthdays that match.
match = get_match(birthdays)

# Display the results:
print('In this simulation, ', end='')
if match is not None:
    month_name = MONTHS[match.month - 1]
    dateText = '{} {}'.format(month_name, match.day)
    print('multiple people have a birthday on', dateText)
else:
    print('there are no matching birthdays.')
print()

# Run through 100,000 simulations:
print('Generating', num_b_days, 'random birthdays 100,000 times...')
input('Press Enter to begin...')

print('Let\'s run another 100,000 simulations.')
sim_match = 0  # How many simulations had matching birthdays in them.
for i in range(100000):
    # Report on the progress every 10,000 simulations:
    if i % 10000 == 0:
        print(i, 'simulations run...')
    birthdays = get_birthdays(num_b_days)
    if get_match(birthdays) is not None:
        sim_match = sim_match + 1
print('100,000 simulations run.')

# Display simulation results:
probability = round(sim_match / 100000 * 100, 2)
print('Out of 100,000 simulations of', num_b_days, 'people, there was a')
print('matching birthday in that group', sim_match, 'times. This means')
print('that', num_b_days, 'people have a', probability, '% chance of')
print('having a matching birthday in their group.')
print('That\'s probably more than you would think!')


## 2.3 Explorando el programa

Trata de encontrar las respuestas a las siguientes preguntas. Experimenta con algunas modificaciones en el código y vuelve a ejecutar el programa para ver qué efecto tienen los cambios.

-    ¿Cómo se representan los cumpleaños en este programa? (sugerencia: mira la línea 16)
-    ¿Cómo se puede eliminar el límite máximo de 100 cumpleaños que genera el programa?
-    ¿Qué mensaje de error recibe si eliminas o comentas `num_b_days = int(response)` de la línea 57?
-    ¿Cómo puedes hacer que el programa muestre nombres de meses completos, como 'January' en lugar de 'Jan'?
-    ¿Cómo puedes conseguir que `X simulations run...` aparezca cada 1.000 simulaciones en lugar de cada 10.000?
