<img src="https://udearroba.udea.edu.co/imagescourses/2022C343_alprog_V1/banner-colab.png">

# <font color='157699'> **Correlaciones lineales y no-lineales / Probabilidad condicional y conjunta**



## <font color='157699'> **Correlaciones lineales y no-lineales**

### <font color='157699'> **1. Concepto y diferencia entre correlaciones lineales y no-lineales**

---

#### **Definición de correlación**

- **Correlación**: es una medida estadística que indica el grado y dirección de la relación entre dos variables. Puede tomar valores entre -1 y 1.

    - **Valor cercano a 1**: correlación positiva.
    - **Valor cercano a -1**: correlación negativa.
    - **Valor cercano a 0**: sin correlación o correlación muy débil.

---

#### **Correlación lineal**

- Es el tipo de correlación más conocido.
- Indica que las variables cambian juntas en una proporción constante.
- Se puede visualizar con una línea recta en un gráfico de dispersión.
  
<font color='5adcff'> **Ejemplos:**  <font color='000000'>
1. Altura y peso en adultos: las personas altas tienden a pesar más que las bajas.
2. Estudiar y obtener buenas notas: cuanto más estudies, es más probable que obtengas mejores notas (hasta cierto punto).

---

#### **Correlación no-lineal**

- Las variables están relacionadas, pero no de una manera constante.
- La relación no puede ser representada de forma adecuada con una línea recta en un gráfico de dispersión.
- Puede tomar diferentes formas: cuadráticas, exponenciales, sinusoidales, entre otras.

<font color='5adcff'> **Ejemplos:**  <font color='000000'>
1. Edad y agudeza visual: a medida que las personas envejecen su visión puede deteriorarse, pero no a una tasa constante.
2. Estrés y rendimiento: un cierto nivel de estrés puede mejorar el rendimiento, pero demasiado estrés puede deteriorarlo.

---

#### **Visualización de correlaciones con Python**

Usando Python podemos visualizar correlaciones con la ayuda de librerías como Matplotlib y Seaborn.

<font color='5adcff'> **Ejemplo de código:**

```python
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Datos ficticios
x = np.linspace(0, 10, 100)
y_lineal = x + np.random.normal(0, 0.5, 100)
y_no_lineal = np.sin(x) + np.random.normal(0, 0.1, 100)

# Visualización
plt.figure(figsize=(12, 5))

plt.subplot(1, 2, 1)
sns.scatterplot(x, y_lineal)
plt.title("Correlación Lineal")

plt.subplot(1, 2, 2)
sns.scatterplot(x, y_no_lineal)
plt.title("Correlación No-Lineal")

plt.tight_layout()
plt.show()
```

---

#### **Resumen:**

- Las correlaciones pueden ser lineales o no lineales.
- Una correlación lineal sugiere una relación constante entre variables, mientras que una no lineal implica una relación que varía en función de los valores de las variables.
- Ambos tipos de correlación pueden ser útiles para comprender y predecir comportamientos en datos.

## <font color='157699'> **Correlaciones lineales y no-lineales**

### <font color='157699'> **2. Uso de Python para identificar y visualizar estas correlaciones**

---

#### **Identificando correlaciones con Python**

Para identificar correlaciones en Python podemos usar la función `corr()`, que está incorporada en la librería Pandas. Esta función retorna el coeficiente de correlación de Pearson por defecto.

- **Coeficiente de correlación de Pearson**:  
  - Valores cercanos a 1 indican una correlación positiva fuerte.
  - Valores cercanos a -1 indican una correlación negativa fuerte.
  - Valores cercanos a 0 indican poca o ninguna correlación.

<font color='5adcff'> **Ejemplo de código**:

```python
import pandas as pd

# Datos ficticios
data = {'A': [1, 2, 3, 4, 5], 'B': [2, 3, 4, 5, 6]}
df = pd.DataFrame(data)

# Calcular la correlación
correlation = df['A'].corr(df['B'])
print(f"Correlación entre A y B: {correlation:.2f}")
```

---

#### **Visualizando correlaciones con Python**

Existen diferentes maneras de visualizarlas:

1. **Gráficos de dispersión (Scatter plots)**:
    - Permiten visualizar la relación entre dos variables.
    - Se pueden añadir líneas de tendencia para ayudar a la interpretación.

2. **Mapas de calor (Heatmaps)**:
    - Útiles cuando se tienen múltiples variables y se desean visualizar de manera simultánea las correlaciones entre todas ellas.
    - Colores más intensos indican correlaciones más fuertes.

**Ejemplo de código para gráficos de dispersión**:

```python
import seaborn as sns
import matplotlib.pyplot as plt

# Datos ficticios
x = [1, 2, 3, 4, 5]
y = [2, 4, 5, 4, 5]

# Gráfico de dispersión
sns.scatterplot(x, y)
plt.title("Gráfico de Dispersión entre X y Y")
plt.show()
```

<font color='5adcff'> **Ejemplo de código para mapas de calor**:

```python
# Datos ficticios
data = {'A': [1, 2, 3, 4, 5], 'B': [2, 4, 1, 8, 10], 'C': [5, 3, 8, 9, 7]}
df = pd.DataFrame(data)

# Calculando la matriz de correlación
correlation_matrix = df.corr()

# Visualización del mapa de calor
plt.figure(figsize=(8, 6))
sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')
plt.title("Mapa de Calor de Correlaciones")
plt.show()
```

---

#### **Resumen:**

- Python, a través de la librería Pandas, permite calcular fácilmente coeficientes de correlación.
- Las visualizaciones como gráficos de dispersión y mapas de calor son herramientas poderosas para interpretar y presentar las correlaciones entre variables.
- La habilidad para calcular y visualizar correlaciones es esencial para el análisis exploratorio de datos y la toma de decisiones basada en datos.

---

# <font color='157699'> **Probabilidad condicional y conjunta**

### <font color='157699'> **1. Definición y ejemplos prácticos**

---

#### **Probabilidad condicional**

- **Definición**: la probabilidad condicional de un evento \( B \), dado que otro evento \( A \) ha ocurrido, se denota por \( P(B|A) \) y se define como la probabilidad de que el evento \( B \) ocurra bajo la condición de que \( A \) ya ha sucedido.
  
  \[ P(B|A) = \frac{P(A \text{ y } B)}{P(A)} \]

<font color='5adcff'> **Ejemplo práctico**:

Supongamos que se tiene una baraja de cartas. La probabilidad de sacar un rey es \( \frac{1}{13} \). Si se sabe que la carta seleccionada es una figura (rey, reina, o jota), entonces la probabilidad condicional de que sea un rey, ya que es una figura, es \( \frac{1}{3} \).

---

#### **Probabilidad conjunta**

- **Definición**: la probabilidad conjunta de dos eventos \( A \) y \( B \) es la probabilidad de que ambos eventos sucedan al mismo tiempo y se denota por \( P(A \text{ y } B) \) o \( P(A \cap B) \).

  \[ P(A \text{ y } B) = P(A) \times P(B|A) \]
  
<font color='5adcff'> **Ejemplo práctico**:

Consideremos lanzar dos monedas. La probabilidad de que en la primera moneda salga cara es \( \frac{1}{2} \). La probabilidad de que en la segunda moneda también salga cara es \( \frac{1}{2} \). La probabilidad conjunta de que en ambas salga cara es \( \frac{1}{2} \times \frac{1}{2} = \frac{1}{4} \).

---

#### **Diferencia clave**

- La **probabilidad condicional** se refiere a la probabilidad de que ocurra un evento \( B \), dado que otro evento \( A \) ya ha ocurrido.
- La **probabilidad conjunta** se refiere a la probabilidad de que ambos eventos \( A \) y \( B \) sucedan al mismo tiempo.

---

#### **Resumen:**

- La probabilidad condicional y conjunta son conceptos fundamentales en estadística y probabilidad.
- Estas probabilidades nos permiten analizar relaciones entre eventos y son esenciales para una variedad de aplicaciones, desde juegos de azar hasta análisis predictivo en ciencia de datos.
  
---

# <font color='157699'> **Probabilidad condicional y conjunta (1 hora)**

## <font color='157699'> **2. Uso de Python para identificar y visualizar probabilidades condicionales y conjuntas**

---

#### **Cálculo de probabilidades con Python**

Gracias a la biblioteca Pandas, Python es excelente para manipular y calcular probabilidades basadas en conjuntos de datos. Para calcular probabilidades condicionales y conjuntas es común utilizar tablas de contingencia.

<font color='5adcff'> **Ejemplo práctico para calcular probabilidad conjunta**:

```python
import pandas as pd

# Supongamos que tenemos un DataFrame que representa el color y la marca de coches
data = {'Color': ['Rojo', 'Azul', 'Rojo', 'Verde', 'Azul', 'Rojo'],
        'Marca': ['Toyota', 'Ford', 'Ford', 'Toyota', 'Ford', 'Toyota']}
df = pd.DataFrame(data)

# Crear una tabla de contingencia
contingency_table = pd.crosstab(df['Color'], df['Marca'], normalize=True)

print("Probabilidad Conjunta:")
print(contingency_table)
```

<font color='5adcff'> **Ejemplo práctico para calcular probabilidad condicional**:

Dada la tabla de contingencia anterior, podemos calcular la probabilidad condicional de que un coche, por ser rojo, perteneza a la marca Ford.

```python
prob_ford_given_red = contingency_table.loc['Rojo', 'Ford'] / contingency_table.loc['Rojo'].sum()
print(f"P(Ford | Rojo) = {prob_ford_given_red:.2f}")
```

---

#### **Visualización de probabilidades con Python**

Una vez que tengamos las probabilidades, podemos visualizarlas para facilitar su interpretación. Los gráficos de barras son útiles para este propósito.

**Ejemplo de código para visualización**:

```python
import matplotlib.pyplot as plt
import seaborn as sns

# Usando la tabla de contingencia anterior
contingency_table.plot(kind='bar', stacked=True)
plt.title("Distribución Conjunta de Color y Marca")
plt.ylabel("Probabilidad")
plt.xlabel("Color del coche")
plt.show()
```

---

#### **Resumen:**

- Con Python y Pandas podemos calcular fácilmente las probabilidades condicionales y conjuntas por medio de tablas de contingencia.
- Las visualizaciones, como los gráficos de barras, nos permiten interpretar y presentar las probabilidades de una manera más comprensible.
- Comprender y visualizar estas probabilidades es crucial para tomar decisiones basadas en datos y realizar análisis predictivo.

---

· Universidad de Antioquia · Ude@ Educación Virtual ·