# Introducción a Ciencia de Datos y Machine Learning

Este notebook sirve como una introducción básica a las herramientas principales que usaremos en nuestro proyecto.

In [None]:
# Importar las bibliotecas principales
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configuración para visualizaciones
%matplotlib inline
plt.style.use('seaborn')
sns.set(font_scale=1.2)

## Ejemplo básico de NumPy

NumPy es la biblioteca fundamental para computación científica en Python.

In [None]:
# Crear un array de NumPy
arr = np.array([1, 2, 3, 4, 5])
print(f"Array: {arr}")
print(f"Media: {arr.mean()}")
print(f"Desviación estándar: {arr.std()}")

# Matriz 2D
matriz = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(f"\nMatriz:\n{matriz}")
print(f"Forma: {matriz.shape}")

## Ejemplo básico de Pandas

Pandas es una biblioteca para manipulación y análisis de datos.

In [None]:
# Crear un DataFrame de Pandas
df = pd.DataFrame({
    'Nombre': ['Ana', 'Juan', 'María', 'Pedro', 'Lucía'],
    'Edad': [25, 30, 22, 40, 35],
    'Ciudad': ['Madrid', 'Barcelona', 'Valencia', 'Sevilla', 'Málaga']
})

print("DataFrame de ejemplo:")
print(df)

# Estadísticas descriptivas
print("\nEstadísticas descriptivas:")
print(df.describe())

## Visualización con Matplotlib y Seaborn

Estas bibliotecas son útiles para crear visualizaciones.

In [None]:
# Crear datos de ejemplo
x = np.linspace(0, 10, 100)
y = np.sin(x)

# Visualización con Matplotlib
plt.figure(figsize=(10, 6))
plt.plot(x, y, 'b-', label='sin(x)')
plt.plot(x, np.cos(x), 'r--', label='cos(x)')
plt.title('Funciones trigonométricas')
plt.xlabel('x')
plt.ylabel('y')
plt.legend()
plt.grid(True)
plt.show()

# Visualización con Seaborn
plt.figure(figsize=(8, 6))
sns.histplot(np.random.normal(0, 1, 1000), kde=True)
plt.title('Histograma de distribución normal')
plt.xlabel('Valor')
plt.ylabel('Frecuencia')
plt.show()

## Próximos pasos

Este notebook es solo una introducción básica. En los siguientes notebooks, exploraremos conceptos más avanzados como:

1. Limpieza y preprocesamiento de datos
2. Análisis exploratorio de datos (EDA)
3. Algoritmos de machine learning
4. Evaluación de modelos
5. Deep learning

¡Sigue explorando las carpetas del proyecto para más contenido!