In [None]:
install.packages("pacman")
library(pacman)

In [None]:
pacman::p_load(dplyr, ggplot2, tidyr, readxl, plotly, tidyverse, ggalluvial)

In [None]:
eva <- read.csv("EVA.csv")
head(eva)

In [None]:
eva <- eva %>%
  filter(DEPARTAMENTO == "NORTE DE SANTANDER") %>%
  select(CÓD..MUN., MUNICIPIO, CULTIVO, Producción..t., Rendimiento..t.ha., GRUPO..DE.CULTIVO, AÑO) %>%
  rename(codmpio = CÓD..MUN., mpio = MUNICIPIO, cultivo = CULTIVO, prod = Producción..t., grupo = GRUPO..DE.CULTIVO,
  rendimiento = Rendimiento..t.ha., periodo = AÑO)

head(eva)

In [None]:
# Calcular producción promedio por municipio y cultivo
eva_mpio <- eva %>%
  group_by(mpio) %>%
  summarise(producion_mean = mean(prod, na.rm = TRUE),
            rendimiento_mean = mean(rendimiento, na.rm = TRUE)) %>%
  ungroup()

head(eva_mpio)

In [None]:
mean_prod <- mean(eva_mpio$producion_mean, na.rm = TRUE)
mean_rend <- mean(eva_mpio$rendimiento_mean, na.rm = TRUE)

ggplot(eva_mpio, aes(x = producion_mean, y = rendimiento_mean)) +
  geom_point(color = "steelblue", size = 2) +
  geom_text(aes(label = mpio), vjust = -0.5, size = 3) +  # Etiquetas con nombres de municipios
  geom_hline(yintercept = mean_rend, linetype = "dashed", color = "black") +
  geom_vline(xintercept = mean_prod, linetype = "dashed", color = "black") +
  labs(
    title = "Distribución producción vs. rendimiento promedio",
    x = "Producción (mean)",
    y = "Rendimiento (mean)"
  ) +
  theme_bw()

In [None]:
# Calcular producción promedio por municipio y cultivo
eva_cultivo <- eva %>%
  group_by(cultivo) %>%
  summarise(producion_mean = mean(prod, na.rm = TRUE),
            rendimiento_mean = mean(rendimiento, na.rm = TRUE)) %>%
  ungroup()

head(eva_mpio)

In [None]:
mean_prod <- mean(eva_mpio$producion_mean, na.rm = TRUE)
mean_rend <- mean(eva_mpio$rendimiento_mean, na.rm = TRUE)

ggplot(eva_cultivo, aes(x = producion_mean, y = rendimiento_mean)) +
  geom_point(color = "steelblue", size = 2) +
  geom_text(aes(label = cultivo), vjust = -0.5, size = 3) +  # Etiquetas con nombres de municipios
  geom_hline(yintercept = mean_rend, linetype = "dashed", color = "black") +
  geom_vline(xintercept = mean_prod, linetype = "dashed", color = "black") +
  labs(
    title = "Distribución producción vs. rendimiento promedio",
    x = "Producción (mean)",
    y = "Rendimiento (mean)"
  ) +
  theme_bw()

In [None]:
# Agrupar datos por Municipio y Cultivo - Producción
prod_data <- eva %>%
  group_by(mpio, cultivo) %>%
  summarise(Produccion = sum(prod, na.rm = TRUE)) %>%
  filter(Produccion > 0)

head(prod_data)

In [None]:
ggplot(prod_data,
       aes(axis1 = mpio, axis2 = cultivo, y = Produccion)) +
  geom_alluvium(aes(fill = mpio), width = 1/12) +
  geom_stratum(width = 1/12, fill = "gray", color = "black") +
  geom_text(stat = "stratum", aes(label = after_stat(stratum)), size = 3) +
  scale_x_discrete(limits = c("Municipio", "Cultivo"), expand = c(.05, .05)) +
  ggtitle("Flujo de Producción entre Municipios y Cultivos en Norte de Santander") +
  theme_minimal()

In [None]:
ggplot(prod_data,
       aes(axis1 = mpio, axis2 = cultivo, y = Produccion)) +
  geom_alluvium(width = 1/12, fill = "lightblue", color = "gray") +  # Color uniforme
  geom_stratum(width = 1/12, fill = "gray", color = "black") +
  geom_text(stat = "stratum", aes(label = after_stat(stratum)), size = 3) +
  scale_x_discrete(limits = c("Municipio", "Cultivo"), expand = c(.05, .05)) +
  ggtitle("Flujo de Producción entre Municipios y Cultivos en Norte de Santander") +
  theme_minimal()