### Distribuciones de probabilidad discretas

Hace poco, aprendió que los profesionales de datos utilizan distribuciones de probabilidad para modelar diferentes tipos de conjuntos de datos y para identificar patrones significativos en sus datos. Recuerde que una distribución de probabilidad describe la probabilidad de los posibles resultados de un suceso aleatorio. Las distribuciones de probabilidad discretas representan variables aleatorias discretas o sucesos discretos. A menudo, los resultados de los sucesos discretos se expresan como números enteros que se pueden contar. Por ejemplo, lanzar un dado puede dar como resultado un 2 o un 3, pero no un valor decimal como 2,575 o 3,184.

En esta lectura, obtendrá una visión general de los principales atributos de cuatro distribuciones de probabilidad discreta comunes:

- Uniforme

- Binomial

- Bernoulli

- Poisson

### Distribuciones de probabilidad discreta

**Distribución uniforme**

La distribución uniforme describe sucesos cuyos resultados son igualmente probables.

Por ejemplo, lanzar un dado puede dar seis resultados: 1, 2, 3, 4, 5 ó 6. La probabilidad de cada resultado es la misma. La probabilidad de cada resultado es la misma: 1 de 6, es decir, aproximadamente el 16,7%.

Puedes visualizar una distribución con un gráfico, como un histograma. Para una distribución discreta, la variable aleatoria se traza a lo largo del eje x, y la probabilidad correspondiente se traza a lo largo del eje y. En este caso, el eje x representa cada resultado posible de una tirada de dado y el eje y representa la probabilidad de cada resultado.

![image.png](attachment:image.png)

**Nota:** Los profesionales de los datos suelen utilizar la distribución uniforme como parte de métodos estadísticos más complejos, como las simulaciones de Montecarlo. Una discusión detallada de estos métodos está fuera del alcance de este curso.

Nota: La distribución uniforme se aplica tanto a variables aleatorias discretas como continuas.


**Distribución binomial**

La Distribución binomial modela la probabilidad de sucesos con sólo dos resultados posibles: éxito o fracaso. Estos resultados son mutuamente excluyentes y no pueden ocurrir al mismo tiempo.

Esta definición supone lo siguiente:

- Cada suceso es independiente, es decir, no afecta a la probabilidad de los demás.

- Cada suceso tiene la misma probabilidad de éxito.

Recuerde que éxito y fracaso son etiquetas que se utilizan por comodidad. Por ejemplo, si lanzas una moneda, sólo hay dos resultados posibles: cara o cruz. En función de las necesidades de su análisis, puede elegir entre cara o cruz como resultado exitoso.

La Distribución binomial representa un tipo de suceso aleatorio llamado experimento binomial. Un experimento binomial tiene los siguientes atributos:

- El experimento consiste en un número de ensayos repetidos.

- Cada ensayo tiene sólo dos resultados posibles.

- La probabilidad de éxito es la misma en cada ensayo.

- Y cada ensayo es independiente.

Un ejemplo de experimento binomial es lanzar una moneda 10 veces seguidas. Se trata de un experimento binomial porque tiene las siguientes características:

- El experimento consiste en 10 ensayos repetidos, o lanzamientos de monedas.

- Cada prueba tiene sólo dos resultados posibles: cara o cruz.

- Cada prueba tiene la misma probabilidad de éxito. Si se define el éxito como cara, la probabilidad de éxito de cada lanzamiento es la misma: 50%.

- Cada prueba es independiente. El resultado de un lanzamiento no afecta al resultado de otro lanzamiento.

En el histograma, el eje x muestra el número de caras y el eje y muestra la probabilidad de obtener cada resultado.

![image-2.png](attachment:image-2.png)

Los profesionales de los datos podrían utilizar la Distribución binomial para modelizar la probabilidad de que:

- Un nuevo medicamento genere efectos secundarios

- Una transacción con tarjeta de crédito sea fraudulenta

- Aumente el valor de una acción

En el Aprendizaje automático, la Distribución binomial se utiliza a menudo para clasificar datos. Por ejemplo, un profesional de los datos puede entrenar un algoritmo para reconocer si una imagen digital es o no un tipo específico de animal, como un gato o un perro.

**Distribución de Bernoulli**

La distribución Bernoulli es similar a la distribución binomial, ya que también modela sucesos que sólo tienen dos resultados posibles (éxito o fracaso). La única diferencia es que la distribución de Bernoulli se refiere a un único ensayo de un experimento, mientras que la binomial se refiere a ensayos repetidos. Un ejemplo clásico de ensayo Bernoulli es el lanzamiento de una moneda.

En el histograma, el eje x representa los posibles resultados de un lanzamiento de moneda, y el eje y representa la probabilidad de cada resultado.

![image-3.png](attachment:image-3.png)

**Distribución de Poisson**

La Distribución de Poisson modela la probabilidad de que se produzca un determinado número de sucesos durante un periodo de tiempo específico.

**Nota:** _La Distribución de Poisson también se puede utilizar para representar el número de sucesos que ocurren en un espacio específico, como una distancia, un área o un volumen. En este curso, nos centraremos en el tiempo._

La Distribución de Poisson representa un tipo de experimento aleatorio llamado experimento de Poisson. Un experimento de Poisson tiene los siguientes atributos:

- El número de sucesos del experimento se puede contar.

- Se conoce el número medio de sucesos que ocurren durante un periodo de tiempo específico.

- Cada suceso es independiente.

Por ejemplo, imagine que tiene una página web en la que publica contenidos. Su sitio web tiene una media de dos visitas por hora. Quiere determinar la probabilidad de que su sitio web reciba un cierto número de visitas en una hora determinada.

Se trata de un experimento de Poisson porque

- Se puede contar el número de eventos del experimento. Se puede contar el número de visitas.

- Se conoce el número medio de eventos que se producen durante un periodo de tiempo determinado. Hay una media de dos visualizaciones por hora.

- Cada resultado es independiente. La probabilidad de que una persona vea tu página web no afecta a la probabilidad de que otra persona la vea.

En el histograma, el eje x muestra el número de visitas por hora y el eje y muestra la probabilidad de que se produzcan.

Histograma que representa la distribución de Poisson de las visitas al sitio web por hora. Las barras más altas son 1 y 2.

![image-4.png](attachment:image-4.png)

Los profesionales de los datos utilizan la distribución de Poisson para modelizar datos como el número de:

- Llamadas por hora en un centro de atención al cliente

- Clientes al día en una tienda

- Tormentas al mes en una ciudad

- Transacciones financieras por segundo en un banco

**Puntos clave**

Identificar la distribución de los datos es un paso clave en cualquier análisis y ayuda a hacer predicciones informadas sobre los resultados futuros. En su futura carrera como profesional de los datos, utilizará distribuciones discretas como la binomial y la de Poisson para comprender mejor sus datos. Conocer la distribución de probabilidad de sus datos también le ayudará a elegir el método estadístico o el modelo de aprendizaje automático que mejor funcione para su análisis.

**Recursos para obtener más información**

Para obtener más información sobre las distribuciones de probabilidad discretas, consulte los siguientes recursos:

Este 
artículo de Statistics How To
 proporciona una visión general del concepto de distribución de probabilidad discreta y ofrece enlaces para explorar más sobre tipos específicos de distribuciones como la binomial y la de Poisson.

 https://www.statisticshowto.com/discrete-probability-distribution/