# 10_DISTRIBUCIÓN MULTINOMIAL

In [None]:
# Importamos numpy y la función multinomial de scipy
import numpy as np
from scipy.stats import multinomial
import matplotlib.pyplot as plt

# Parámetros de la distribución
n = 16
probs = np.ones(6) * 1 / 6

# Resultado
result = [3, 5, 2, 4, 1, 1]  # Se puede pasar una lista o un array de numpy

# Calculamos la probabilidad
prob = multinomial.pmf(result, n, probs)
print(f"La probabilidad pedida es {prob:.4f}")

### Genética

In [None]:
# Importamos numpy y la función multinomial de scipy
import numpy as np
from scipy.stats import multinomial
import matplotlib.pyplot as plt

# Ejemplo de herencia mendeliana con tres fenotipos

n_organisms = 100

# Probabilidades: dominante (AA), heterocigoto (Aa), recesivo (aa)
prob_genotypes = np.array([0.25, 0.5, 0.25])  # AA, Aa, aa

""" Generamos la población (también podríamos utilizar multinomial.rvs)
    en un array con el número de organismos para cada fenotipo """
population = np.random.multinomial(n_organisms, prob_genotypes)

print("Distribución de genotipos en la población")
print(f"\tAA (dominante): {population[0]}")
print(f"\tAa (heterocigoto): {population[1]}")
print(f"\taa (recesivo): {population[2]}")

# Probabilidad de obtener exactamente esa distribución
prob = multinomial.pmf(population, n_organisms, prob_genotypes)
print(f"\nProbabilidad de esta distribución específica: {prob:.4f}")

# Graficamos
labels = ["AA (dominante)", "Aa (heterocigoto)", "aa (recesivo)"]
colors = ["skyblue", "lightgreen", "salmon"]
plt.figure(figsize=(6, 4))
plt.bar(labels, population, color=colors)
plt.title("Distribución de Genotipos en la Población", fontsize=9)
plt.xlabel("Genotipos", fontsize=8)
plt.ylabel("Organismos", fontsize=8)
plt.grid(axis="y", linestyle="--", alpha=0.7)
plt.show()

### Ingeniería de Materiales

In [None]:
# Importamos numpy y la función multinomial de scipy
import numpy as np
from scipy.stats import multinomial
import matplotlib.pyplot as plt

# Parámetros de la distribución
n_defects = 300
probabilities = [0.5, 0.25, 0.1, 0.15]

# Generamos la poblacion
population = multinomial.rvs(n_defects, probabilities)

In [None]:
# Veamos la salida de este array
population

In [None]:
# Distribución de defectos
print("Distribución de defectos")
print(f"\tVacantes): {population[0]}")
print(f"\tIntersticiales: {population[1]}")
print(f"\tDislocaciones: {population[2]}")
print(f"\tFronteras: {population[3]}")

# Estadísticos
prob_np = np.array(probabilities)
means = n_defects * prob_np
four_1 = np.ones(4)
variances = n_defects * prob_np * (four_1 - prob_np)
covariance_matrix = multinomial.cov(n_defects, prob_np)

print("\nEstadísticos:")
print("\tMatriz de covarianza:")
print(covariance_matrix)
for label, mean, variance in zip(labels, means, variances):
    print(f"\tDefecto: {label}")
    print(f"\t\tMedia {mean:.2f}")
    print(f"\t\tVarianza {variance:.2f}")

# Graficamos
labels = ["Vacantes", "Intersticiales", "Dislocaciones", "Fronteras"]
colors = ["skyblue", "lightgreen", "salmon", "yellow"]
plt.figure(figsize=(6, 4))
plt.bar(labels, population, color=colors)
plt.title("Distribución de Defectos", fontsize=9)
plt.xlabel("Defectos", fontsize=8)
plt.ylabel("Número de defectos", fontsize=8)
plt.grid(axis="y", linestyle="--", alpha=0.7)
plt.show()

### Análisis de fallos en un sistema de telecomunicaciones

In [None]:
# Importamos numpy y la función multinomial de scipy
import numpy as np
from scipy.stats import multinomial
import matplotlib.pyplot as plt
import pandas as pd  # Para facilitar la visualización de los datos

# Parámetros del modelo
number_failures = 500
number_cycles = 200
probabilities = np.array([175, 125, 100, 75, 25]) / 500
labels = ["Hardware", "Software", "Red", "Energía", "Humano"]
resolution_time = {"Hardware": 4, "Software": 2, "Red": 1, "Energía": 3, "Humano": 0.5}
costs_failure = {
    "Hardware": 1000,
    "Software": 500,
    "Red": 300,
    "Energía": 800,
    "Humano": 200,
}

# Generamos las observaciones
results = multinomial.rvs(number_failures, probabilities, number_cycles)

In [None]:
# Creamos el Dataframe para visualizar los datos
results_pd = pd.DataFrame(results)
# Renombramos las columnas
results_pd = results_pd.set_axis(
    ["Hardware", "Software", "Red", "Energía", "Humano"], axis=1
)
# Visualizamos los 5 primeros ciclos
results_pd.head()

In [None]:
results_pd["Total Errores"] = results_pd.sum(axis=1)
results_pd.head()

In [None]:
# Calculamos la media de cada tipo de error
means_failures = np.mean(results, axis=0)
means_failures

In [None]:
"""Utilizando estas medias calculamos el tiempo medio total empleado en subsanar
los fallos. Si consideramos una base anual de 8760 horas (un año), calculamos
también la disponibilidad anual estimada.
"""

ANNUAL_HOURS = 365 * 24
total_time = sum(means_failures * [resolution_time[label] for label in labels])
availability = (ANNUAL_HOURS - total_time) / ANNUAL_HOURS * 100
print(f"La disponibilidad anual estimada es del {availability:.2f}%")

In [None]:
"""Para el análisis económico, procedemos de un modo similar. Calculamos el coste
promedio total.
"""

total_cost = np.sum(means_failures * [costs_failure[label] for label in labels])
print(f"El coste medio mensual de mantenimiento será de {total_cost/12:.0f} €")

In [None]:
# Graficamos la distribución medias
colors = ["skyblue", "lightgreen", "salmon", "yellow", "orange"]
plt.figure(figsize=(6, 4))
plt.bar(labels, means_failures, color=colors)
plt.title("Distribución de fallos (medias)", fontsize=9)
plt.xlabel("Origen de los fallos", fontsize=8)
plt.ylabel("Número de fallos", fontsize=8)
plt.grid(axis="y", linestyle="--", alpha=0.7)
plt.show()