# Enunciado de la PEC 2
En esta PEC 2, tal como se explicó en el planteamiento inicial (lectura imprescindible), queremos que salgáis de vuestra zona de confort y descubráis técnicas de visualización nuevas. El protagonismo es de las tres técnicas que se os asignarán mediante un correo electrónico enviado por vuestro profesor (si no recibís esta comunicación el día de inicio de la actividad, contactad inmediatamente con el profesor a través del aula).

La tarea consiste en investigar cada técnica y determinar su adecuación según el tipo de datos y el objetivo que se desea alcanzar. Para ello podéis utilizar las siguientes webs especializadas como guías para decidir cuándo utilizar cada tipo de representación gráfica:

- Data to Viz: https://www.data-to-viz.com/Links to an external site.

- DataViz Project: https://datavizproject.com/Links to an external site.

- Catálogo de Visualización de Datos: https://datavizcatalogue.com/ES/Links to an external site.

A partir de la información obtenida en estas webs, debéis descubrir todo lo posible sobre cada técnica asignada: nombre, origen, autoría, ventajas e inconvenientes, tipos de datos admitidos, ejemplos y aplicaciones habituales.

Procedimiento:

Cada estudiante deberá crear tres pequeñas visualizaciones usando las técnicas asignadas. Para ello deberá seleccionar datos adecuados y decidir qué herramienta utilizará para visualizarlos. Los datos podrán obtenerse de cualquier fuente abierta. Las visualizaciones deberán publicarse en Internet y ser accesibles directamente mediante una URL pública, sin necesidad de registros ni inicios de sesión. Podéis utilizar plataformas como Flourish, Tableau Public, Infogram, o publicar directamente en GitHub mediante páginas web estáticas en github.io.

La finalidad de esta actividad es familiarizarse con las técnicas asignadas, entendiendo su esencia. En esta ocasión se trabajará desde la técnica hacia los datos, identificando qué tipos de datos son más coherentes con cada técnica asignada.

En el apartado de recursos asociado a esta actividad podrá encontrar un documento con una selección de enlaces a sitios web con fuentes y conjuntos de datos organizados por ámbito y sector.

Finalmente, el trabajo consistirá en la publicación de las tres visualizaciones online y la realización de un vídeo explicativo que deberá seguir el siguiente guion:

[Puntos 1 + 2] Presentación personal siguiendo el esquema de la PEC 1.
[Puntos 1 + 2; 5%] Enlace URL de cada visualización publicada.
[25%] Definición general de cada técnica (nombre, origen, descripción, funcionamiento y ejemplos típicos de aplicación), utilizando la información obtenida de las webs indicadas anteriormente.
[15%] Tipo y estructura de datos adecuados para cada técnica (cuantitativos, cualitativos, requisitos específicos), indicando claramente posibles limitaciones como tamaño mínimo o máximo del conjunto de datos.
[20%] Realización práctica de una visualización simple por técnica, usando datos abiertos escogidos libremente por vosotros mismos.
[30%] Comentario breve sobre cada visualización: qué se representa, qué aspectos específicos resalta o demuestra, así como el objetivo concreto de comunicación o descubrimiento buscado. Explicad claramente cómo la técnica y los datos elegidos permiten alcanzar dicho objetivo.
[5%] Cada presentación de técnica debe durar entre 2 y 3 minutos. El vídeo completo con las tres técnicas no podrá exceder los 7-8 minutos en total. Exceder este límite supondrá una penalización, ya que se valorará especialmente vuestra capacidad de síntesis y comunicación.

**Sobre Plagio e IA**
> IMPORTANTE: En esta actividad sólo se permite un uso limitado de herramientas de inteligencia artificial. Concretamente, en el contexto de las artes y el diseño, las herramientas de IA, tanto textuales como visuales, pueden servir para generar y esbozar ideas, contextualizar conceptos, plantear prototipos o combinar elementos de manera innovadora o alternativa. En caso de utilizar estas herramientas, es necesario explicitar y citar correctamente su uso en la elaboración del trabajo. Esto implica indicar en cada apartado de la actividad entregada qué herramientas se han utilizado, los objetivos, los prompts que se han empleado, la respuesta obtenida y el proceso que se ha seguido para revisar y editar la salida. Para hacerlo correctamente, consulta la guía ¿Cómo citar la IA en los trabajos? En el plan docente y en la Web sobre integridad académica y plagio de la UOC encontrarás información sobre qué se considera conducta irregular y las consecuencias que puede tener. Recuerda también que en caso de usar herramientas de IA generativa, no debe proporcionarse información personal, confidencial o protegida por propiedad intelectual. Ten en cuenta que un uso inadecuado de la IA generativa, como la falta de revisión de la respuesta obtenida o la falta de citación de las herramientas utilizadas, será considerada una conducta irregular en la evaluación. En caso de duda, consulta con el profesor colaborador en el aula.

## Contexto
Voy a proceder paso a paso para obtener **un dataset adecuado** para aplicar las tres técnicas que me asignaron:

1. **Pie chart** -> ideal para mostrar proporciones o participación.
2. **Candlestick chart** -> se usa con datos temporales tipo financiero (valores de apertura, cierre, máximo, mínimo).
3. **Convex hull** -> se aplica sobre datos espaciales o de dispersión (coordenadas X, Y).

Por tanto, necesito un dataset que tenga:

* Una **componente categórica y cuantitativa** (para el pie chart).
* Una **serie temporal con valores numéricos** (para el candlestick).
* Una **componente espacial (coordenadas)** para el convex hull.

## Propuesta de Dataset

Un dataset que cumple con todo eso es el de **acciones financieras con ubicación de sedes de empresas**.
Lo obtendo fácilmente desde **Yahoo Finance**.

In [1]:
# ==============================================
# VISUALIZACIONES FINANCIERAS CON PLOTLY
# ==============================================
import numpy as np
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from scipy.spatial import ConvexHull

# ==============================================
# LIBRERIAS AUXILIARES
# ==============================================
%load_ext autoreload
%autoreload 2

# Proporciona funciones para interactuar con el sistema operativo (como rutas de archivos).
import os  

# Permite modificar aspectos del entorno de ejecución de Python, como la lista de rutas de búsqueda de módulos (sys.path).
import sys 

# En notebooks, usa la ruta del notebook actual
root_dir = os.path.abspath('..')  # Sube un nivel desde /notebooks/
sys.path.append(root_dir)

# Importa las funciones personalizadas desde utils.
import utils.tidy_functions as tf

# Importa las bibliotecas necesarias para el análisis de datos y visualización.
import pandas as pd
pd.set_option('display.float_format', '{:.2f}'.format)
pd.set_option('display.max_columns', None)

In [3]:
acciones = pd.read_csv(r"../Data/acciones_limpio.csv")
acciones

Unnamed: 0,Date,Ticker,Open,High,Low,Close,Volume
0,2023-01-03,AAPL,128.47,129.08,122.44,123.33,112117500
1,2023-01-04,AAPL,125.13,126.87,123.34,124.60,89113600
2,2023-01-05,AAPL,125.36,125.99,123.02,123.28,80962700
3,2023-01-06,AAPL,124.26,128.48,123.15,127.82,87754700
4,2023-01-09,AAPL,128.66,131.55,128.08,128.34,70790800
...,...,...,...,...,...,...,...
1501,2024-12-24,GOOG,195.54,197.03,194.57,196.93,6809800
1502,2024-12-26,GOOG,196.10,197.52,195.24,196.46,7907900
1503,2024-12-27,GOOG,195.84,196.16,191.35,193.41,14693000
1504,2024-12-30,GOOG,190.25,193.15,189.75,192.07,12209500


In [4]:
tf.describe_df(acciones)

Unnamed: 0,Column,Data Type,Non-null Count,% Null Values,Unique Values,Shape,mean,median,std,min,25%,75%,max
0,Date,object,1506,0.0,502,"1506 rows, 7 columns",,,,,,,
1,Ticker,object,1506,0.0,3,"1506 rows, 7 columns",,,,,,,
2,Open,float64,1506,0.0,1506,"1506 rows, 7 columns",230.79,186.19,104.4,86.13,155.05,319.82,462.69
3,High,float64,1506,0.0,1506,"1506 rows, 7 columns",232.95,187.64,105.06,87.61,156.96,323.87,464.02
4,Low,float64,1506,0.0,1506,"1506 rows, 7 columns",228.77,185.14,103.49,84.99,153.31,316.88,460.17
5,Close,float64,1506,0.0,1488,"1506 rows, 7 columns",230.96,186.17,104.32,86.18,155.44,319.54,463.24
6,Volume,int64,1506,0.0,1506,"1506 rows, 7 columns",34966590.97,26633000.0,23356759.47,6809800.0,18978600.0,47157225.0,318679900.0


In [5]:
df = acciones.copy()

# Aseguramos los tipos de datos
df["Date"] = pd.to_datetime(df["Date"])            # datetime64
df["Ticker"] = df["Ticker"].astype(str)            # string
for col in ["Open", "High", "Low", "Close"]:
    df[col] = df[col].astype(float)                # float64
df["Volume"] = df["Volume"].astype("int64")        # int64

In [6]:
tf.describe_df(df)

Unnamed: 0,Column,Data Type,Non-null Count,% Null Values,Unique Values,Shape,mean,median,std,min,25%,75%,max,Min Date,Max Date
0,Date,datetime64[ns],1506,0.0,502,"1506 rows, 7 columns",,,,,,,,2023-01-03,2024-12-31
1,Ticker,object,1506,0.0,3,"1506 rows, 7 columns",,,,,,,,NaT,NaT
2,Open,float64,1506,0.0,1506,"1506 rows, 7 columns",230.79,186.19,104.4,86.13,155.05,319.82,462.69,NaT,NaT
3,High,float64,1506,0.0,1506,"1506 rows, 7 columns",232.95,187.64,105.06,87.61,156.96,323.87,464.02,NaT,NaT
4,Low,float64,1506,0.0,1506,"1506 rows, 7 columns",228.77,185.14,103.49,84.99,153.31,316.88,460.17,NaT,NaT
5,Close,float64,1506,0.0,1488,"1506 rows, 7 columns",230.96,186.17,104.32,86.18,155.44,319.54,463.24,NaT,NaT
6,Volume,int64,1506,0.0,1506,"1506 rows, 7 columns",34966590.97,26633000.0,23356759.47,6809800.0,18978600.0,47157225.0,318679900.0,NaT,NaT


---
---

## TÉCNICA GRUPO I (Básicas y populares): Pie chart  

**Objetivo**: Mostrar la distribución del volumen medio de trading por empresa.

In [9]:
# ==================================================
# PIE CHART — Distribución del volumen medio por empresa
# ==================================================

# Calcular volumen medio por ticker
volumen_medio = df.groupby("Ticker")["Volume"].mean().reset_index()

# Crear gráfico de pastel tipo donut
fig = go.Figure(
    data=[go.Pie(
        labels=volumen_medio["Ticker"],
        values=volumen_medio["Volume"],
        textinfo="label+percent+value",
        hovertemplate="<b>%{label}</b><br>Volumen medio: %{value:,.0f}<br>%{percent}",
        textposition="auto",
        # Comentario: usar hole=0.3 para crear un donut chart más moderno
        hole=0.3,
        marker=dict(line=dict(color="#FFFFFF", width=2))
    )]
)

fig.update_layout(
    title="Distribución del volumen medio por empresa",
    template="plotly_white",
)

# Mostrar
fig.show()

# Guardar como HTML (ya lo tienes)
fig.write_html(r"../Visualizaciones/pie_chart.html")

# Guardar también como PNG
fig.write_image(r"../Visualizaciones/pie_chart.png", width=1200, height=600)


ValueError: 
Image export using the "kaleido" engine requires the kaleido package,
which can be installed using pip:
    $ pip install -U kaleido


---
---

## TÉCNICA GRUPO II (Habituales y específicas): Candlestick Chart  

**Objetivo**: Mostrar la evolución temporal de precios OHLC por empresa.

Incluye hover detallado, media móvil y rangeslider temporal.

In [None]:
# ==================================================
# CANDLESTICK CHART — Evolución temporal de precios
# ==================================================

# Crear figura vacía
fig = go.Figure()

tickers = df["Ticker"].unique()

# Añadir trazas para cada ticker
for ticker in tickers:
    sub_df = df[df["Ticker"] == ticker]
    fig.add_trace(go.Candlestick(
        x=sub_df["Date"],
        open=sub_df["Open"],
        high=sub_df["High"],
        low=sub_df["Low"],
        close=sub_df["Close"],
        name=ticker,
        increasing_line_color="#00CC96",  # verde-azul para días alcistas
        decreasing_line_color="#EF553B"   # rojo para días bajistas
    ))

# Media móvil (SMA 20) opcional
df["SMA20"] = df.groupby("Ticker")["Close"].transform(lambda x: x.rolling(20).mean())
for ticker in tickers:
    sub_df = df[df["Ticker"] == ticker]
    fig.add_trace(go.Scatter(
        x=sub_df["Date"], y=sub_df["SMA20"],
        mode="lines", name=f"SMA 20 - {ticker}",
        line=dict(width=1.5, dash="dot")
    ))

# Layout con interactividad
fig.update_layout(
    title="Evolución temporal de precios OHLC",
    xaxis_title="Fecha",
    yaxis_title="Precio de cierre ($)",
    xaxis_rangeslider_visible=True,
    template="plotly_white",
    hovermode="x unified",
)

# Mostrar
fig.show()

# Guardar como HTML (ya lo tienes)
fig.write_html(r"../Visualizaciones/CandleSticks.html")

# Guardar también como PNG
fig.write_image(r"../Visualizaciones/CandleSticks.png", width=1200, height=600)



---
---

## TÉCNICA GRUPO III (Menos habituales o específicas): Convex hull  


https://www.researchgate.net/publication/4202112_Convex_hull_algorithms_review

**Objetivo**: Visualizar la relación entre precios de apertura y cierre con su envolvente convexa.

In [None]:
# ==================================================
# CONVEX HULL — Relación entre Open y Close
# ==================================================

fig = go.Figure()
colors = {"AAPL": "#1f77b4", "MSFT": "#2ca02c", "GOOG": "#ff7f0e"}

for ticker in df["Ticker"].unique():
    sub_df = df[df["Ticker"] == ticker]
    points = sub_df[["Open", "Close"]].values

    # Calcular envolvente convexa
    hull = ConvexHull(points)
    hull_points = points[hull.vertices]

    # Puntos de dispersión
    fig.add_trace(go.Scatter(
        x=sub_df["Open"],
        y=sub_df["Close"],
        mode="markers",
        name=ticker,
        opacity=0.6,
        marker=dict(size=6, color=colors.get(ticker, "gray")),
        hovertemplate=(
            f"<b>{ticker}</b><br>"
            "Fecha: %{text}<br>"
            "Open: %{x:.2f}<br>"
            "Close: %{y:.2f}"
        ),
        text=sub_df["Date"].dt.strftime("%Y-%m-%d")
    ))

    # Líneas de la envolvente convexa
    fig.add_trace(go.Scatter(
        x=np.append(hull_points[:, 0], hull_points[0, 0]),
        y=np.append(hull_points[:, 1], hull_points[0, 1]),
        mode="lines",
        line=dict(color=colors.get(ticker, "gray"), width=2),
        name=f"Convex Hull - {ticker}"
    ))

# Línea de referencia y = x
fig.add_trace(go.Scatter(
    x=[df["Open"].min(), df["Open"].max()],
    y=[df["Open"].min(), df["Open"].max()],
    mode="lines",
    line=dict(color="gray", dash="dash"),
    name="y = x (Open = Close)"
))

fig.update_layout(
    title="Relación entre precio de apertura y cierre con Envolvente Convexa",
    xaxis_title="Precio de apertura ($)",
    yaxis_title="Precio de cierre ($)",
    legend_title="Ticker",
    template="plotly_white",
)

# Mostrar
fig.show()

# Guardar como HTML (ya lo tienes)
fig.write_html(r"../Visualizaciones/convex_hull.html")

# Guardar también como PNG
fig.write_image(r"../Visualizaciones/convex_hull.png", width=1200, height=600)


---