## Librerias

```
import numpy as np
import pandas as pd
from scipy import stats
from sklearn.model_selection import cross_val_score
```



## Muestreo en Python
### Ejemplo de muestreo aleatorio simple con numpy
`data = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])`
`sample = np.random.choice(data, size=5, replace=False)`

### Media Muestral
`sample_mean = np.mean(sample)`

### Varianza Muestral
`sample_variance = np.var(sample, ddof=1)`

### Desviación Estándar Muestral
`sample_std = np.std(sample, ddof=1)`

### Intervalos de Confianza
`confidence_interval = stats.t.interval(0.95, len(data) - 1, loc=sample_mean, scale=stats.sem(data))`

## Prueba de Hipótesis
### Ejemplo de una prueba t de dos muestras
`sample1 = np.array([1, 2, 3, 4, 5])`
`sample2 = np.array([6, 7, 8, 9, 10])`
`t_stat, p_value = stats.ttest_ind(sample1, sample2)`

### Tipos de Errores en Pruebas de Hipótesis
### En la interpretación de los resultados de una prueba de hipótesis, se consideran los errores tipo I y tipo II.

### T-Student, Pearson, ANOVA
### Ejemplo de uso de ANOVA para comparar varios grupos
`group1 = np.array([1, 2, 3, 4, 5])`
`group2 = np.array([6, 7, 8, 9, 10])`
`f_stat, p_value = stats.f_oneway(group1, group2)`

###Bootstraping
### Ejemplo de implementación de bootstrap para estimar la media

```
bootstrap_means = []
for _ in range(1000):
    bootstrap_sample = np.random.choice(data, size=len(data), replace=True)
    bootstrap_mean = np.mean(bootstrap_sample)
    bootstrap_means.append(bootstrap_mean)
```

## Validación Cruzada
### Ejemplo de validación cruzada con scikit-learn
`from sklearn.linear_model import LinearRegression`

`from sklearn.datasets import load_iris`

`iris = load_iris()`

`X, y = iris.data, iris.target`

`model = LinearRegression()`

`cross_val_scores = cross_val_score(model, X, y, cv=5)`

## Trabajando con DataFrames en pandas
### Crear un DataFrame de ejemplo

```
data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10]}
```
`df = pd.DataFrame(data)`

### Media Muestral en un DataFrame
`media_muestral = df.mean()`

### Varianza Muestral en un DataFrame
`varianza_muestral = df.var(ddof=1)`

### Desviación Estándar Muestral en un DataFrame
`desviacion_estandar_muestral = df.std(ddof=1)`

### Intervalos de Confianza en un DataFrame
### Supongamos que tienes otro DataFrame llamado "conf_data" con los datos adicionales.

```
conf_interval = stats.t.interval(0.95, df.shape[0] - 1, loc=df['A'].mean(), scale=stats.sem(conf_data['A']))
```

### Prueba de Hipótesis en un DataFrame
`t_stat, p_value = stats.ttest_ind(df['A'], conf_data['A'])`

### T-Student, Pearson, ANOVA en un DataFrame
`f_stat, p_value = stats.f_oneway(df['A'], conf_data['A'])`
