# Unidimensional
### Representaciones

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sb
import pandas as pd

In [None]:
d1 = np.loadtxt("example_1.txt")
d2 = np.loadtxt("example_2.txt")
print(d1.shape, d2.shape)

# Histogramas

In [None]:
plt.hist(d1, label="D1")
plt.hist(d2, label="D2")
plt.legend()
plt.ylabel("Counts");

In [None]:
bins = np.linspace(min(d1.min(), d2.min()), max(d1.max(), d2.max()), 50)
counts1, _, _ = plt.hist(d1, bins=bins, label="D1")
plt.hist(d2, bins=bins, label="D2")
plt.legend()
plt.ylabel("Counts");

In [None]:
bins = np.linspace(min(d1.min(), d2.min()), max(d1.max(), d2.max()), 50)
counts1, _, _ = plt.hist(d1, bins=bins, label="D1", density=True)
plt.hist(d2, bins=bins, label="D2", density=True)
plt.legend()
plt.ylabel("Probability");

In [None]:
bins = np.linspace(min(d1.min(), d2.min()), max(d1.max(), d2.max()), 50)
plt.hist([d1, d2], bins=bins, label="Stacked", density=True, histtype="barstacked", alpha=0.5)
plt.hist(d1, bins=bins, label="D1", density=True, histtype="step", lw=1)
plt.hist(d2, bins=bins, label="D2", density=True, histtype="step", ls=":")
plt.legend()
plt.ylabel("Probability");

In [None]:
bins = 50
plt.hist([d1, d2], bins=bins, label="Stacked", density=True, histtype="barstacked", alpha=0.5)
plt.hist(d1, bins=bins, label="D1", density=True, histtype="step", lw=1)
plt.hist(d2, bins=bins, label="D2", density=True, histtype="step", ls=":")
plt.legend()
plt.ylabel("Probability");

*******
# Gráficas de enjambre

In [None]:
dataset = pd.DataFrame({
    "value": np.concatenate((d1, d2)),
    "type": np.concatenate((np.ones(d1.shape), np.zeros(d2.shape)))
})
dataset.info()

In [None]:
sb.swarmplot(dataset["value"])

In [None]:
sb.swarmplot(x="type", y="value", data=dataset, size=2);

*****
# Box Plots o Diagrama de Caja y Bigotes

In [None]:
sb.boxplot(x="type", y="value", data=dataset, whis=3.0);
sb.swarmplot(x="type", y="value", data=dataset, size=2, color="k", alpha=0.3);

*****

# Gráficas de Violin


In [None]:
sb.violinplot(x="type", y="value", data=dataset);
sb.swarmplot(x="type", y="value", data=dataset, size=2, color="k", alpha=0.3);

In [None]:
sb.violinplot(x="type", y="value", data=dataset, inner="quartile", bw=0.2);

*****

# Funciones de Distribución Acumulada Empírica


Cuando forma un histograma, el hecho de que tiene que agrupar los datos significa que el aspecto puede cambiar significativamente cuando cambia el tamaño del contenedor. Y cada contenedor tiene incertidumbre estadística. Puede superar eso usando un CDF. Es más difícil, visualmente, ver las características en el PDF cuando mira el CDF, sin embargo, generalmente es más útil cuando intenta hacer comparaciones cuantitativas entre múltiples distribuciones. Nos ocuparemos de eso más tarde.

In [None]:
sd1 = np.sort(d1)
sd2 = np.sort(d2)
cdf = np.linspace(1/d1.size, 1, d1.size)

plt.plot(sd1, cdf, label="D1 CDF")
plt.plot(sd2, cdf, label="D2 CDF")
plt.hist(d1, histtype="step", density=True, alpha=0.3)
plt.hist(d2, histtype="step", density=True, alpha=0.3)
plt.legend();

******
# Descriptivo

Si las gráficas no son suficientes y solo quieres números, puedes utilizar de pandas la función `describe`.

In [None]:
df = pd.DataFrame({"Data1": d1, "Data2": d2})
df.describe()