# Principios de Inform√°tica: Visualizaci√≥n de Datos üìä
### Convirtiendo n√∫meros en historias visuales

**Curso:** Principios de Inform√°tica

---
## ¬øPor Qu√© una Imagen Vale M√°s que Mil N√∫meros? üñºÔ∏è

En ciencia e ingenier√≠a, generamos y recolectamos enormes cantidades de datos. Una tabla con miles de n√∫meros es dif√≠cil de interpretar. ¬øHay una tendencia? ¬øExisten valores at√≠picos? ¬øC√≥mo se relacionan dos variables?

La **visualizaci√≥n de datos** es el arte y la ciencia de representar datos de forma gr√°fica. Un buen gr√°fico puede revelar patrones, tendencias y correlaciones que pasar√≠an desapercibidas en los datos crudos. Nos permite comunicar nuestros hallazgos de una manera clara, potente y universal.

Hoy, aprenderemos a usar las bibliotecas de Python para transformar nuestros datos num√©ricos en gr√°ficos informativos y atractivos.

---
### ‚úÖ Lo que aprenderemos hoy:
* **Bibliotecas de Graficaci√≥n:** Conoceremos `Matplotlib` y `Seaborn`.
* **Integraci√≥n con NumPy y Pandas:** C√≥mo visualizar arreglos y DataFrames directamente.
* **Tipos de Gr√°ficos Esenciales:** Crearemos gr√°ficos de l√≠neas, dispersi√≥n, histogramas y superficies.
* **Personalizaci√≥n:** Aprenderemos a a√±adir t√≠tulos, etiquetas y colores para que nuestros gr√°ficos cuenten una historia clara.

---
## üìö Bibliotecas de Graficaci√≥n

Python tiene un ecosistema muy rico para la visualizaci√≥n de datos. Nos centraremos en dos de las bibliotecas m√°s importantes:

* **Matplotlib**: Es la biblioteca de graficaci√≥n "abuelo" de Python. Es extremadamente potente y personalizable, aunque a veces puede ser un poco verbosa. Es la base sobre la que se construyen muchas otras bibliotecas.
* **Seaborn**: Construida sobre Matplotlib, Seaborn proporciona una interfaz de m√°s alto nivel para crear gr√°ficos estad√≠sticos atractivos y complejos con menos c√≥digo.

Para instalarlas (si no las tienes), abre tu terminal y escribe: `pip install matplotlib seaborn`

---
## ü§ù Integraci√≥n con NumPy y Pandas

La verdadera fuerza de estas bibliotecas de visualizaci√≥n reside en su perfecta integraci√≥n con las herramientas de computaci√≥n num√©rica que ya conocemos. Podemos pasar arreglos de NumPy y DataFrames de Pandas directamente a las funciones de graficaci√≥n.

---
### Visualizando un Arreglo de NumPy

In [None]:
import numpy as np
import matplotlib.pyplot as plt # Convenci√≥n para importar el m√≥dulo de graficaci√≥n de Matplotlib

# Generar los datos
x = np.linspace(0, 10, 100) # 100 puntos entre 0 y 10
y = np.sin(x)

# Crear el gr√°fico
plt.plot(x, y)
plt.title("Gr√°fico de la Funci√≥n Seno")
plt.xlabel("Eje X")
plt.ylabel("Seno(X)")
plt.grid(True) # A√±adir una cuadr√≠cula
plt.show() # Mostrar el gr√°fico

---

### Visualizando un DataFrame de Pandas

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

# Crear un DataFrame
datos = {
    'a√±o': [2020, 2021, 2022, 2023, 2024],
    'ventas_producto_A': [100, 120, 150, 130, 170],
    'ventas_producto_B': [80, 90, 100, 115, 140]
}
df_ventas = pd.DataFrame(datos)

# Usar el m√©todo .plot() del DataFrame
df_ventas.plot(x='a√±o', y=['ventas_producto_A', 'ventas_producto_B'], kind='line', marker='o')

plt.title("Ventas Anuales por Producto")
plt.xlabel("A√±o")
plt.ylabel("Unidades Vendidas")
plt.legend(["Producto A", "Producto B"])
plt.grid(True)
plt.show()

---
## üìà Tipos de Gr√°ficos Relevantes para Ciencias

---
### Gr√°fico de L√≠neas

**Uso**: Ideal para mostrar la evoluci√≥n de una variable a lo largo del tiempo o de otra variable continua. Perfecto para series temporales.

---
**Ejercicio: Visualizar Temperatura de un D√≠a**
Tienes datos de temperatura tomados cada hora durante 12 horas. Visual√≠zalos en un gr√°fico de l√≠neas.


In [None]:
import matplotlib.pyplot as plt

horas = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
temperaturas = [18, 17, 16, 16, 17, 19, 21, 23, 24, 25, 26, 25]

plt.plot(horas, temperaturas, color='red', marker='.')
plt.title("Evoluci√≥n de la Temperatura")
plt.xlabel("Hora del d√≠a")
plt.ylabel("Temperatura (¬∞C)")
plt.xticks(horas) # Asegurarse de que todas las horas se muestren en el eje X
plt.grid(True)
plt.show()

---
### Gr√°fico de Dispersi√≥n (Scatter Plot)

**Uso**: Excelente para visualizar la relaci√≥n entre dos variables num√©ricas. Nos ayuda a ver si existe una correlaci√≥n (positiva, negativa) o si no hay ninguna relaci√≥n aparente.

---
**Ejercicio: Relaci√≥n entre Humedad y Temperatura**
Tienes datos de humedad y temperatura. Crea un gr√°fico de dispersi√≥n para ver si est√°n relacionados.


In [None]:
import matplotlib.pyplot as plt
import numpy as np

# Datos simulados: a mayor temperatura, menor humedad
temperatura_disp = np.array([20, 22, 25, 28, 30, 32, 35])
humedad_disp = np.array([80, 75, 65, 55, 50, 45, 40])

plt.scatter(temperatura_disp, humedad_disp, color='blue')
plt.title("Relaci√≥n entre Temperatura y Humedad")
plt.xlabel("Temperatura (¬∞C)")
plt.ylabel("Humedad (%)")
plt.grid(True)
plt.show()

---
### Histogramas

**Uso**: Un histograma nos muestra la **distribuci√≥n** de una sola variable num√©rica. Agrupa los n√∫meros en "contenedores" (bins) y cuenta cu√°ntos valores caen en cada contenedor. Es fundamental para entender la frecuencia y la forma de nuestros datos.

---
**Ejercicio: Distribuci√≥n de Calificaciones**
Tienes las calificaciones de un examen para 100 estudiantes. Crea un histograma para ver c√≥mo se distribuyen.


In [None]:
import matplotlib.pyplot as plt
import numpy as np

# Generar 100 calificaciones aleatorias con una distribuci√≥n normal (media=75, desv. est.=10)
calificaciones = np.random.normal(loc=75, scale=10, size=100)

# Crear el histograma
# bins=10 significa que dividiremos el rango de datos en 10 contenedores
plt.hist(calificaciones, bins=10, edgecolor='black', color='skyblue')
plt.title("Distribuci√≥n de Calificaciones del Examen")
plt.xlabel("Calificaci√≥n")
plt.ylabel("Frecuencia (N¬∫ de Estudiantes)")
plt.show()

---
### Gr√°ficos de Superficie (3D)

**Uso**: Para visualizar datos en tres dimensiones. Son excelentes para representar funciones de dos variables `(z = f(x, y))` o para visualizar terrenos y campos de fuerza.

---
**Ejercicio: Visualizar una Funci√≥n 3D**
Vamos a visualizar la funci√≥n `z = sin(sqrt(x^2 + y^2))`, que crea un patr√≥n de ondas circulares.


In [None]:
import matplotlib.pyplot as plt
import numpy as np

# Crear una figura y un eje 3D
fig = plt.figure()
ax = plt.axes(projection='3d')

# Crear los datos para los ejes x e y
x = np.linspace(-6, 6, 30)
y = np.linspace(-6, 6, 30)

# Crear una malla (una cuadr√≠cula de puntos x, y)
X, Y = np.meshgrid(x, y)

# Calcular los valores de Z para cada punto de la malla
R = np.sqrt(np.power(X, 2) + np.power(Y, 2))
Z = np.sin(R)

# Crear el gr√°fico de superficie
ax.plot_surface(X, Y, Z, cmap='viridis', edgecolor='none')

ax.set_title('Gr√°fico de Superficie 3D')
plt.show()

---
## üé® Personalizaci√≥n de Gr√°ficos B√°sicos

Un gr√°fico sin etiquetas es como un mapa sin nombres de ciudades. La personalizaci√≥n es clave para que sea interpretable.

* `plt.title("Mi T√≠tulo")`: A√±ade un t√≠tulo al gr√°fico.
* `plt.xlabel("Etiqueta del Eje X")`: Nombra el eje horizontal.
* `plt.ylabel("Etiqueta del Eje Y")`: Nombra el eje vertical.
* `plt.legend()`: Muestra una leyenda (√∫til cuando hay varias l√≠neas).
* `plt.grid(True)`: A√±ade una cuadr√≠cula de fondo.
* `color='red'`: Cambia el color de la l√≠nea o los puntos.
* `marker='o'`: Cambia el estilo de los marcadores en los puntos de datos.
* `linestyle='--'`: Cambia el estilo de la l√≠nea (p. ej., a una l√≠nea discontinua).

---
## ‚úèÔ∏è Ejercicios Finales de Pr√°ctica

---
**1. Comparaci√≥n de Dos Funciones**
En un mismo gr√°fico de l√≠neas, visualiza las funciones `y = x^2` e `y = x^3` para valores de `x` entre -10 y 10. Personaliza el gr√°fico con un t√≠tulo, etiquetas para los ejes y una leyenda.


In [None]:
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(-10, 10, 100)
y1 = np.power(x, 2)
y2 = np.power(x, 3)

plt.plot(x, y1, color='blue', linestyle='--', label='x^2')
plt.plot(x, y2, color='green', label='x^3')

plt.title("Comparaci√≥n de Funciones Cuadr√°tica y C√∫bica")
plt.xlabel("X")
plt.ylabel("Y")
plt.legend()
plt.grid(True)
plt.show()

---
**2. An√°lisis de Datos de Iris con Seaborn**
La biblioteca Seaborn viene con conjuntos de datos de ejemplo. Usa el famoso conjunto de datos "iris" para crear un gr√°fico de dispersi√≥n que muestre la relaci√≥n entre la longitud del s√©palo (`sepal_length`) y el ancho del s√©palo (`sepal_width`). Usa el par√°metro `hue` para colorear los puntos seg√∫n la especie.

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

# Cargar el conjunto de datos de ejemplo
iris = sns.load_dataset("iris")

# Crear el gr√°fico de dispersi√≥n con Seaborn
sns.scatterplot(data=iris, x="sepal_length", y="sepal_width", hue="species")

plt.title("Relaci√≥n entre Longitud y Ancho del S√©palo en Flores de Iris")
plt.xlabel("Longitud del S√©palo (cm)")
plt.ylabel("Ancho del S√©palo (cm)")
plt.grid(True)
plt.show()

---
**3. Histograma de Datos de Vuelo**
Usa el conjunto de datos "flights" de Seaborn y crea un histograma del n√∫mero de pasajeros (`passengers`) para ver su distribuci√≥n a lo largo de los a√±os.

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

# Cargar el conjunto de datos
flights = sns.load_dataset("flights")

# Crear el histograma
plt.hist(flights['passengers'], bins=15, edgecolor='black')
plt.title("Distribuci√≥n del N√∫mero de Pasajeros en Vuelos")
plt.xlabel("N√∫mero de Pasajeros")
plt.ylabel("Frecuencia (Meses)")
plt.show()