# Gráficas en Python

[Link atlassian](https://www.atlassian.com/data/charts)

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import plotly.graph_objects as go
import plotly.express as px

In [2]:
x = np.linspace(0, 5, 11)
y = x**2

In [3]:
x

## Crear una gráfica básica.

### Matplotlib

In [4]:
# Crear el plot básico
plt.plot(x, y)

# Mostrar el gráfico
plt.show()

### Plotly

In [5]:
# Crear el plot básico
fig = px.bar(x = x, y = y)

# Mostrar el gráfico
fig.show()

## Subplots

### Matplotlib

In [6]:
# Crear subplots (2 filas, 1 columna)
fig, ax = plt.subplots(2, 1)

# Primer gráfico en la primera fila
ax[0].plot(x, y)
ax[0].set_title("Gráfico 1")

# Segundo gráfico en la segunda fila
ax[1].plot(y, x)
ax[1].set_title("Gráfico 2")

# Mostrar el gráfico con subplots
plt.tight_layout()
plt.show()

### Plotly

In [7]:
import plotly.subplots as sp

# Crear subplots (2 filas, 1 columna)
fig = sp.make_subplots(rows=2, cols=1)

# Primer gráfico en la primera fila
fig.add_trace(go.Scatter(x=x, y=y), row=1, col=1)

# Segundo gráfico en la segunda fila
fig.add_trace(go.Scatter(x=y, y=x), row=2, col=1)

# Mostrar el gráfico con subplots
fig.show()

## Añadir Leyendas, títulos y nombres de ejes

### Matplotlib

In [8]:
# Crear la figura y los ejes
fig, ax = plt.subplots(figsize=(10, 6))
ax.set_title("Gráfico de Ejemplo", fontsize=16)
ax.set_xlabel("Eje X")
ax.set_ylabel("Eje Y")

# Graficar las líneas en los ejes
ax.plot(x, y, label="Función x - y", color='red')
ax.plot(y, x, label="Función y - x", color='blue')

# Añadir leyenda
ax.legend()

# Mostrar el gráfico
plt.show()

### Plotly

In [9]:
# Crear gráfico con dos líneas
fig = go.Figure()

# Añadir título y etiquetas
fig.update_layout(
    title="Gráfico de Ejemplo",
    xaxis_title="Eje X",
    yaxis_title="Eje Y",
    title_font_size=16, 
    width=600, 
    height=400
)

fig.add_trace(go.Scatter(x=x, y=y, name='Función x - y'))
fig.add_trace(go.Scatter(x=y, y=x, mode='lines', name='Función y - x'))

# Mostrar gráfico con leyenda
fig.show()

## Cambiar Colores y Estilos

### Matplotlib

In [10]:
# Crear la figura y los ejes
fig, ax = plt.subplots()

# Graficar con diferentes colores y estilos
ax.plot(x, y, color='red', linestyle='--', marker='o', label="Línea roja punteada")
ax.plot(y, x, color='blue', linestyle='-', marker='x', label="Línea azul sólida")

# Añadir leyenda
ax.legend()

# Mostrar gráfico
plt.show()


### Plotly

In [11]:
# Crear un gráfico con diferentes colores y estilos
fig = go.Figure()
fig.add_trace(go.Scatter(x=x, y=y, mode='lines+markers', line=dict(color='red', dash='dash'), marker=dict(symbol='circle'), name="Línea roja punteada"))
fig.add_trace(go.Scatter(x=y, y=x, mode='lines+markers', line=dict(color='blue', dash='solid'), marker=dict(symbol='x'), name="Línea azul sólida"))

# Mostrar gráfico
fig.show()

# Carga cognitiva

La **carga cognitiva** es el esfuerzo que nos demanda acordarnos de algo, retener esa información.

Con ayudas en la percepción visual, la carga cognitiva disminuye mucho, eso quiere decir que entendemos las cosas mejor y más fácil, y tenemos más probabilidades de retenerlo con el paso del tiempo.

# Buenas practicas
- Usa mismas medidas
- No cortar axis*

<img src="image-20240913-093531.png" width="" align="" />

<img src="image-20240913-092500.png" width="" align="" />

- Simplificar pero no recortar

<img src="image-20240913-093159.png" width="" align="" />

<img src="image-20240913-093142.png" width="" align="" />

- Ver principio de gesalt* (son 7, hace poco añadieron 1)

<img src="image-20240913-093332.png" width="" align="" />

# Graficos para DS

## Grafica de barras.

Lo usamos cuando queremos comparar la cantidad entre nuestros valores o categorias

### Consejos para hacer buenos gráficos
- Usar un color distinto por cada una de las categorías
- De ser posible, representar las barras de menor a mayor
- Comenzar desde 0 en los ejes.

In [12]:
# Datos
x = ['A', 'B', 'C', 'D']
y = [3, 8, 1, 10]

# Crear la figura y los ejes
fig, ax = plt.subplots()

# Crear la gráfica de barras
ax.bar(x, y)

# Añadir títulos y etiquetas


# Mostrar la gráfica
plt.show()

In [13]:
# Crear un DataFrame para ordenar los valores juntos
df = pd.DataFrame({'Categoría': x, 'Valor': y}).sort_values('Valor')

# Crear la figura
fig = go.Figure()

# Añadir la gráfica de barras con diferentes colores
fig.add_trace(go.Bar(
    x=df['Categoría'],
    y=df['Valor'],
    marker_color=['#636EFA', '#EF553B', '#00CC96', '#AB63FA']  # Colores distintos
))

# Añadir título y etiquetas
fig.update_layout(
    title="Gráfica de Barras Ordenada",
    xaxis_title="Categorías",
    yaxis_title="Valores"
)

# Mostrar la gráfica
fig.show()

## Grafica de dispersión

Representa valores de dos variables numericas diferentes. 

Se usa cuando queremos mostrar las relaciones entre las dos variables que estamos graficando. Y mostrar los patrones del conjunto de datos. 

<img src="image-20240913-100457.png" width="" align="" />

### Consejos para hacer buenos graficos

- Cuando tengas muchos datos intenta tomar una muestra mas pequeña, usar puntos con transparencia o tal vez opta por un mapa de calor
- En algunos casos es buena idea agregar linea de tendencia
- Cuando tengas los datos separados por una variable categoria, usa diferentes colores. 


<img src="image-20240913-101209.png" width="" align="" />

<img src="image-20240913-101215.png" width="" align="" />

<img src="image-20250427-212133.png" width="" align="" />

<img src="image-20250427-212139.png" width="" align="" />

In [14]:
df_diabetes = pd.read_csv('/work/diabetes.csv')

df_diabetes.head()

# Datos
grupo_0 = df_diabetes[df_diabetes['Outcome'] == 0]
grupo_1 = df_diabetes[df_diabetes['Outcome'] == 1]
x = df_diabetes['Insulin']
y = df_diabetes['Glucose']


In [15]:
# Crear la figura y los ejes
fig, ax = plt.subplots()

# Crear la gráfica de dispersión para cada grupo
ax.scatter(grupo_0['Insulin'], grupo_0['Glucose'], color='blue', label='Sin diabetes')
ax.scatter(grupo_1['Insulin'], grupo_1['Glucose'], color='red', label='Con diabetes')

# Añadir títulos y etiquetas
ax.set_title("Gráfica de Dispersión por Outcome")
ax.set_xlabel("Insulina")
ax.set_ylabel("Glucosa")
ax.legend(title="Outcome")

# Mostrar la gráfica
plt.show()

In [16]:
# Crear la figura
fig = go.Figure()

# Añadir grupo 0
fig.add_trace(go.Scatter(
    x=grupo_0['Insulin'],
    y=grupo_0['Glucose'],
    mode='markers',
    name='Sin diabetes',
    marker=dict(color='blue')
))

# Añadir grupo 1
fig.add_trace(go.Scatter(
    x=grupo_1['Insulin'],
    y=grupo_1['Glucose'],
    mode='markers',
    name='Con diabetes',
    marker=dict(color='red')
))

# Añadir título y etiquetas
fig.update_layout(
    title="Gráfica de Dispersión por Outcome",
    xaxis_title="Insulina",
    yaxis_title="Glucosa",
    legend_title="Outcome"
)

# Mostrar la gráfica
fig.show()


## Histogramas

Se usa para mostrar las caracteristicas de la distribución de los datos. 

### Consejos para hacer buenos graficos
- Usa un numero de cajitas apropiado
- Usa los mismos tamaños para las cajitas
- Usa valores significativos para las etiquetas

<img src="image-20240913-101806.png" width="" align="" />

<img src="image-20240913-101418.png" width="" align="" />

In [17]:
np.linspace(1, 4, 5)

In [18]:
# Datos
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]

# Crear la figura y los ejes
fig, ax = plt.subplots()

ax.hist(data, bins=4, edgecolor='black')  # Añadir edgecolor para el contorno

# Añadir títulos y etiquetas
ax.set_title("Histograma")
ax.set_xlabel("Valor")
ax.set_ylabel("Frecuencia")

# Mostrar la gráfica
plt.show()

In [19]:
np.random.seed(5)
data = np.random.normal(50, 10, 1000)

# Crear la figura y los ejes
fig, ax = plt.subplots()

# Crear el histograma
ax.hist(data, bins=100, edgecolor='black')  # Añadir edgecolor para el contorno

# Añadir títulos y etiquetas
ax.set_title("Histograma")
ax.set_xlabel("Valor")
ax.set_ylabel("Frecuencia")

# Mostrar la gráfica
plt.show()

In [20]:
# Crear la figura
fig = go.Figure()

# Añadir el histograma con líneas de contorno
fig.add_trace(go.Histogram(
                            x=data, 
                            marker=dict(line=dict(width=1, color='black')),
                            nbinsx=100
                            ))

# Añadir título y etiquetas
fig.update_layout(title="Histograma", xaxis_title="Valor", yaxis_title="Frecuencia")

# Mostrar la gráfica
fig.show()


<a style='text-decoration:none;line-height:16px;display:flex;color:#5B5B62;padding:10px;justify-content:end;' href='https://deepnote.com?utm_source=created-in-deepnote-cell&projectId=f830251c-8c78-458f-b1cf-8f2b68e94d45' target="_blank">
 </img>
Created in <span style='font-weight:600;margin-left:4px;'>Deepnote</span></a>