# Modelización Matemática - Tema 1
## Diego Ángel Gallardo Costilla

### Preámbulo
Para comenzar, importaremos la librería `pandas` y procederemos a leer nuestra base de datos `ContextoLimpio.csv`, importada desde **ConExp**.

In [1]:
import pandas as pd
df = pd.read_csv("ContextoLimpio.csv", sep=";", index_col=0)

Esta base de datos contiene información sobre caballos de carreras japoneses: sus aptitudes de pista, longitudes, estilos de carrera y destrezas.

In [115]:
df

Unnamed: 0,Turf,Dirt,Sprint,Mile,Medium,Long,End Closer,Late Surger,Pace Chaser,Front Runner,Speed Bonus,Stamina Bonus,Power Bonus,Guts Bonus,Wit Bonus
Special Week,1,0,0,0,1,1,0,1,1,0,0,1,0,0,1
Silence Suzuka,1,0,0,1,1,0,0,0,0,1,1,0,0,1,0
Daiwa Scarlet,1,0,0,1,1,0,0,0,1,1,1,0,0,1,0
Vodka,1,0,0,1,1,0,0,1,1,0,1,0,0,0,0
Gold Ship,1,0,0,0,1,1,1,1,1,0,0,1,1,0,0
Mejiro McQueen,1,0,0,0,1,1,0,0,1,0,0,1,0,0,1
Tokai Teio,1,0,0,0,1,1,0,0,1,0,1,1,0,1,0
Symboli Rudolf,1,0,0,0,1,1,0,1,1,0,0,1,0,1,0
Biwa Hayahide,1,0,0,0,1,1,0,1,1,0,0,0,0,1,1
Narita Brian,1,0,0,1,1,1,0,1,1,0,1,1,0,0,0


In [101]:
#El número de filas se nos determinará como df.shape[0], y el número de columnas como df.shape[1]. Veamos el nombre de los objetos:
print(df.index)

Index(['Special Week', 'Silence Suzuka', 'Daiwa Scarlet', 'Vodka', 'Gold Ship',
       'Mejiro McQueen', 'Tokai Teio', 'Symboli Rudolf', 'Biwa Hayahide',
       'Narita Brian', 'Eishin Flash', 'Hishi Akebono', 'Tamamo Cross',
       'Haru Urara', 'Oguri Cap'],
      dtype='object')


In [102]:
print(df.iloc[2,0])
print(df.loc["Daiwa Scarlet","Turf"])

1
1


In [103]:
df_ext = df[(df["Turf"] == 1) & (df["Mile"] == 1) & (df["Guts Bonus"] == 1)]
df_ext

Unnamed: 0,Turf,Dirt,Sprint,Mile,Medium,Long,End Closer,Late Surger,Pace Chaser,Front Runner,Speed Bonus,Stamina Bonus,Power Bonus,Guts Bonus,Wit Bonus
Silence Suzuka,1,0,0,1,1,0,0,0,0,1,1,0,0,1,0
Daiwa Scarlet,1,0,0,1,1,0,0,0,1,1,1,0,0,1,0
Hishi Akebono,1,0,1,1,0,0,0,0,1,1,0,0,1,1,0


#### Ejercicio 2.6

Sea $(\mathcal{O}, \mathcal{P}, \mathcal{R})$ nuestro contexto, expresado como DataFrame. A continuación, definiremos la **extensión** de un subconjunto $A \subseteq \mathcal{P}$ como operador de derivación en Python. En efectos prácticos, si introducimos una lista de atributos, nos devolverá los objetos que posean todos esos atributos a la vez.

In [None]:
def extension(df, atributos):
    """Dado un DataFrame y una lista de atributos, 
    devuelve solo los objetos que poseen 
    todos los atributos especificados."""
    if not atributos:
        return df.index.tolist()
    for atributo in atributos:
        if atributo in df.columns:
            df = df[df[atributo] == 1]
        else:
            print(f"El atributo '{atributo}' no se encuentra en el DataFrame.")
    return df.index.tolist()

Pongamos un ejemplo: queremos saber qué caballos corren en "Turf", a distancia "Mile" y se categorizan con "Guts Bonus". Usando la nueva función, los resultados concuerdan con la base de datos:

In [123]:
atributos = ["Turf", "Mile", "Guts Bonus"]
objetos_con_atributos = extension(df, atributos)
print(objetos_con_atributos)

['Silence Suzuka', 'Daiwa Scarlet', 'Hishi Akebono']


Ahora definiremos de forma similar el operador de derivación conocido como **intensión**, aplicado sobre un subconjunto $A \subseteq \mathcal{O}$. Si le introducimos una lista de objetos, nos devolverá los atributos que poseen todos en común.

In [None]:
def intension(df, objetos):
    """Dado un DataFrame y una lista de objetos, 
    devuelve solo los atributos que todos los objetos 
    especificados poseen."""
    prueba = []
    for objeto in objetos:
        if objeto in df.index:
            prueba.append(df.loc[df.index == objeto])
        else:
            print(f"El objeto '{objeto}' no se encuentra en el DataFrame.")
    if not prueba:
        return []
    prueba2 = pd.concat(prueba)
    atributos_comunes = prueba2.columns[(prueba2 == 1).all()]
    return atributos_comunes.tolist()

Ahora, pongamos que queremos saber qué características de nuestra base de datos comparten "Gold Ship" y "Haru Urara". Al introducir la lista de nombres, obtendremos el resultado esperado.

In [124]:
objetos = ["Gold Ship", "Haru Urara"]
atributos_comunes = intension(df, objetos)
print(atributos_comunes)

['End Closer', 'Late Surger', 'Power Bonus']


#### Ejercicio 2.9

Ahora, comprobaremos si la composición de ambos operadores por ambos sentidos es un operador de clausura. Primero, definámoslos.

In [139]:
def extint(df, objetos):
    return extension(df, intension(df, objetos))
def intext(df, atributos):
    return intension(df, extension(df, atributos))

Comprobamos que ambas son crecientes, reutilizando las listas que empleamos en el anterior ejercicio:

In [135]:
lista1 = extint(df, ["Gold Ship", "Haru Urara"])
lista1

['Gold Ship', 'Tamamo Cross', 'Haru Urara']

In [None]:
lista2 = intext(df, ["Turf", "Mile", "Guts Bonus"])
lista2

['Turf', 'Mile', 'Front Runner', 'Guts Bonus']

mardaun

In [None]:
extint(df, lista1)

['Gold Ship', 'Tamamo Cross', 'Haru Urara']

In [141]:
intext(df, lista2)

['Turf', 'Mile', 'Front Runner', 'Guts Bonus']