### Graficos de dispersión (Scatter Plots)
Los gráficos de dispersión (scatter plots) son una herramienta fundamental en la visualización de datos, utilizados para mostrar la relación entre dos variables continuas. En matplotlib, una popular biblioteca de visualización en Python, se pueden crear gráficos de dispersión utilizando la función scatter().

#### Características de los gráficos de dispersión
Ejes X e Y: Cada punto en el gráfico representa un par de valores de las variables X e Y.
Distribución y Tendencias: Ayudan a identificar patrones, distribuciones y posibles correlaciones entre las dos variables.
Outliers: Pueden resaltar valores atípicos o outliers que no siguen la tendencia general de los datos.

In [None]:
import matplotlib.pyplot as plt

# creamos los datos
x = [1, 2, 3, 4, 5]
y = [10, 15, 18, 20, 25]

# creamos la figura
plt.figure()

# dibujamos el gráfico
plt.scatter(x,y)

In [None]:
# podemos modificar el color del gráfico pasando un array de colores en el argumento "c"
colors = ['green', 'green', 'green', 'green', 'red']

plt.figure()

# con "s" size, modificamos el tamaño de los puntos del gráfico
plt.scatter(x, y, s=100, c=colors)

In [None]:
# con zip podemos convertir 2 listas en 1 tupla de valores pares, por ejemplo imaginemos que tenemos
# 2 listas con valores, lista 1 equivale a las x y la 2 a las y
zip_generator = zip([1,2,3,4,5], [6,7,8,9,10])
print(list(zip_generator)) # la salida será: [(1, 6), (2, 7), (3, 8), (4, 9), (5, 10)]

# utilizando el desempaquetador "*" obtendremos argumentos posicionales fuera de la tupla
zip_generator = zip([1,2,3,4,5], [6,7,8,9,10])
print(*zip_generator) # la salida desempaquetada será: (1, 6) (2, 7) (3, 8) (4, 9) (5, 10)

In [None]:
plt.figure()

# también podemos setear colores a intervalos, el primero desde el inicio hasta el indice 2, no incluido y el 
# segundo con el resto de valores
plt.scatter(x[:2], y[:2], s=100, c='red', label='students A')
plt.scatter(x[2:], y[2:], s=100, c='blue', label='students B')

In [None]:
plt.figure()
plt.scatter(x[:2], y[:2], s=100, c='red', label='Tall students')
plt.scatter(x[2:], y[2:], s=100, c='blue', label='Short students')

# podemos añadir etiquetas para que nuestro gráfico sea más comprensible
plt.xlabel('The number of times the child kicked a ball')
plt.ylabel('The grade of the student')

# añadimos un título
plt.title('Relationship between ball kicking and grades');

In [None]:
plt.figure()
plt.scatter(x[:2], y[:2], s=100, c='red', label='Tall students')
plt.scatter(x[2:], y[2:], s=100, c='blue', label='Short students');

plt.xlabel('The number of times the child kicked a ball')
plt.ylabel('The grade of the student')
plt.title('Relationship between ball kicking and grades')

# añadimos una leyenda que utiliza las etiquetas de los scatters
plt.legend()

In [None]:
f=plt.figure()
plt.scatter(x[:2], y[:2], s=100, c='red', label='Tall students')
plt.scatter(x[2:], y[2:], s=100, c='blue', label='Short students')

plt.xlabel('The number of times the child kicked a ball')
plt.ylabel('The grade of the student')
plt.title('Relationship between ball kicking and grades')

# con loc=4 ponemos la leyenda en la parte inferior derecha del gráfico y con frameon=False quitamos el marco
plt.legend(loc=4, frameon=False, title='Legend')