# Actividad Práctica: Generación y Visualización de Datos Aleatorios

**Objetivo:**
- Aprender a utilizar librerías esenciales en Python para ciencia de datos.
- Generar datos aleatorios y almacenarlos en un DataFrame.
- Realizar una gráfica sencilla para visualizar los datos.

Pasos a seguir:

## 1. Importar las Librerías Necesarias


In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline


**Explicación:**

- `numpy` es una librería para realizar operaciones numéricas eficientes.
- `pandas` proporciona estructuras de datos y herramientas de análisis.
- `matplotlib.pyplot` es una librería para crear visualizaciones gráficas.
- `%matplotlib inline` es una "magic command" de Jupyter que permite mostrar las gráficas dentro del notebook.

## 2. Generar Datos Aleatorios


In [None]:
# Establecer una semilla para reproducibilidad
np.random.seed(0)

# Generar un arreglo de 100 números aleatorios con distribución normal
datos = np.random.randn(100)


**Explicación:**

- `np.random.seed(0)` asegura que los resultados sean reproducibles.
- `np.random.randn(100)` genera 100 números aleatorios siguiendo una distribución normal estándar (media 0 y desviación estándar 1).

## 3. Crear un DataFrame con los Datos Generados


In [None]:
# Crear un DataFrame a partir del arreglo de datos
df = pd.DataFrame(datos, columns=['Valor'])


**Explicación:**

- Se crea un DataFrame `df` con una columna llamada 'Valor' que contiene los datos aleatorios generados.

## 4. Explorar el DataFrame

In [None]:
# Mostrar las primeras 5 filas del DataFrame
df.head()


In [None]:
# Obtener estadísticas descriptivas
df.describe()


**Explicación:**

- `df.head()` muestra las primeras 5 filas del DataFrame para una vista rápida de los datos.
- `df.describe()` proporciona estadísticas básicas como media, desviación estándar, valores mínimos y máximos, etc.

## 5. Graficar los Datos

In [None]:
# Crear un histograma de los datos
plt.hist(df['Valor'], bins=10, edgecolor='black')
plt.title('Histograma de Datos Aleatorios')
plt.xlabel('Valor')
plt.ylabel('Frecuencia')
plt.show()


**Explicación:**

- `plt.hist()` crea un histograma que muestra la distribución de los datos.
bins=10 divide los datos en 10 intervalos.
- `edgecolor='black'` agrega un borde negro a las barras para mejorar la visualización.
- `plt.title()`, `plt.xlabel()`, `plt.ylabel()` añaden título y etiquetas al gráfico.
- `plt.show()` muestra la gráfica.

## 6. Interpretar la Gráfica

**Discusión:**

- Observa que los datos se distribuyen aproximadamente de manera normal.
- La mayoría de los valores se concentran alrededor de la media (0).
- Comenta sobre la importancia de entender la distribución de los datos en Machine Learning.