<a href="https://colab.research.google.com/github/Isaquintero2004/Analitica-de-Negocios/blob/main/RETO_N%C2%B04_ISABELA_QUINTERO_FERN%C3%81NDEZ.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **RETO N°4: ANÁLISIS DE SENTIMIENTOS**

De acuerdo con los reportes anuales publicados por la Asociación Nacional de Exportadores (ANALDEX) entre los años 2020-2024, llevar a cabo un análisis de sentimientos de riesgo.  Para este proceso se debe llevar a cabo un informe de análisis por cada uno de los años y crear dos gráficos (Histograma de Frecuencias, Spider Plot) en donde se consolide la información, con el fin de contrastar la evolución de los informes exportadores.

0. Se procede con la carga de las librerias de trabajo

In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

#Librerias de análisis de sentimiento
import nltk #Natural language Toolkit - separar palabras, sentimientos, etc.
from nltk.tokenize import word_tokenize, sent_tokenize #Separar frases y palabras
nltk.download("punkt_tab") #Optimizador del proceso de tokenización, el punk_tab separa por frases
import spacy

from google.colab import drive
drive.mount('/content/drive')

[nltk_data] Downloading package punkt_tab to /root/nltk_data...
[nltk_data]   Unzipping tokenizers/punkt_tab.zip.


Mounted at /content/drive


1. Se procede con la instalación de diferentes paquetes de análisis

In [2]:
#Instalación de paquetes
!pip install vaderSentiment #Diccionario de sentimientos y palabras más famoso (entre -1 y 1)
!pip install -U spacy #-U es que busque el más nuevo que exista. Industrial Strength Natural Language Processing
!spacy download es_core_news_lg #Modelo de lenguaje para español
!spacy download en_core_web_sm #Modelo de lenguaje para inglés

from vaderSentiment.vaderSentiment import SentimentIntensityAnalyzer
sia=SentimentIntensityAnalyzer() #Analizador de sentimientos

Collecting vaderSentiment
  Downloading vaderSentiment-3.3.2-py2.py3-none-any.whl.metadata (572 bytes)
Downloading vaderSentiment-3.3.2-py2.py3-none-any.whl (125 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m126.0/126.0 kB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: vaderSentiment
Successfully installed vaderSentiment-3.3.2
Collecting spacy
  Downloading spacy-3.8.5-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (27 kB)
Downloading spacy-3.8.5-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (30.6 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m30.6/30.6 MB[0m [31m50.0 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: spacy
  Attempting uninstall: spacy
    Found existing installation: spacy 3.8.4
    Uninstalling spacy-3.8.4:
      Successfully uninstalled spacy-3.8.4
Successfully installed spacy-3.8.5


Collecting es-core-news-lg==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/es_core_news_lg-3.8.0/es_core_news_lg-3.8.0-py3-none-any.whl (568.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m568.0/568.0 MB[0m [31m2.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: es-core-news-lg
Successfully installed es-core-news-lg-3.8.0
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('es_core_news_lg')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.
Collecting en-core-web-sm==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-3.8.0/en_core_web_sm-3.8.0-py3-none-any.whl (12.8 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [

2. Análisis de los informes de ANALDEX

## **INFORME ANALDEX 2020**

In [5]:
#Documento de ANALDEX 2020
nxl_2020="/content/drive/MyDrive/ANALÍTICA DE NEGOCIOS/InformeANALDEX_2020_EN.txt"
ntx_2020=open(nxl_2020, encoding="utf-8").read() #Como no es un excel, debemos leerlo como texto
print(ntx_2020)

#Se establece la escala de sentimientos númerico-cualitativo
#Escala PANAS (Positive and negative affective scale)
vn=["Amenaza", "Pesimismo", "Inestabilidad", "Esceptisismo", "Indiferente", "Neutral", "Favorable", "Optimismo", "Convicción", "Consolidación", "Confianza"] #Cualitativo
vnm=np.array([-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0]) #Cuantitativo
#Cada escala cualitativa tiene una escala cuantitativa

sent_tk=sent_tokenize(ntx_2020)
print(sent_tk) #Cada frase inicia con una comilla simple y finaliza con una comilla simple

#Para evitar palabras indeseables se crea un documento
nlp=spacy.load("en_core_web_sm") #Modelo de lenguaje para inglés
doc=nlp(ntx_2020)
oraciones=[sent.text for sent in doc.sents] #Separar por oraciones

resultados=[]
for txtm in oraciones:
  print(txtm)
  scores=sia.polarity_scores(txtm)
  print(scores)
  print("La polaridad es:", scores["compound"])
  #Obtiene las frases por grupos
  #Primero la frase, luego el compound, luego la polaridad (orden en los grupos)

  #A que sentimiento pertenece cada compound
  d=np.abs(vnm-scores["compound"]) #Distancia a cada uno de los sentimientos
  categoria=np.where(d==min(d))[0][0] #Busco la categoría a la que pertenece esa distancia
  print(vn[categoria]) #Sentimiento al cual pertenece la categoría
  resultados.append([txtm, scores["compound"], vn[categoria]])

#Se crea el informe en un dataFrame
df_2020=pd.DataFrame(resultados, columns=["Oración", "Compound", "Sentimiento"])
df_2020["Año"] = 2020
df_2020.head()

#Crear informe
df_2020.to_excel("Análisis ANALDEX 2020.xlsx")


Detailed Report on Colombia's Foreign Trade in 2020
1. Introduction
2020 represented a turning point for the global economy, and Colombia was no exception. The outbreak of the COVID-19 pandemic generated an unprecedented health crisis that drastically impacted supply chains, international trade relations, and domestic demand. In this context, Colombian foreign trade presented a series of specific characteristics that are worth analyzing in depth.

2. The Impact of the COVID-19 Pandemic on Colombian Foreign Trade
The COVID-19 pandemic had a devastating effect on the Colombian economy, causing an economic contraction unprecedented since the Great Depression. The lockdown and social distancing measures implemented by the government to contain the spread of the virus paralyzed economic activity and generated a sharp drop in demand.
Main consequences of the pandemic on Colombian foreign trade:
Decrease in global trade: Restrictions on the movement of people and goods, as well as border clos

## **INFORME ANALDEX 2021**

In [6]:
#Documento de ANALDEX 2021
nxl_2021="/content/drive/MyDrive/ANALÍTICA DE NEGOCIOS/InformeANALDEX_2021_EN.txt"
ntx_2021=open(nxl_2021, encoding="utf-8").read() #Como no es un excel, debemos leerlo como texto
print(ntx_2021)

#Se establece la escala de sentimientos númerico-cualitativo
#Escala PANAS (Positive and negative affective scale)
vn=["Amenaza", "Pesimismo", "Inestabilidad", "Esceptisismo", "Indiferente", "Neutral", "Favorable", "Optimismo", "Convicción", "Consolidación", "Confianza"] #Cualitativo
vnm=np.array([-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0]) #Cuantitativo
#Cada escala cualitativa tiene una escala cuantitativa

sent_tk=sent_tokenize(ntx_2021)
print(sent_tk) #Cada frase inicia con una comilla simple y finaliza con una comilla simple

#Para evitar palabras indeseables se crea un documento
nlp=spacy.load("en_core_web_sm") #Modelo de lenguaje para inglés
doc=nlp(ntx_2021)
oraciones=[sent.text for sent in doc.sents] #Separar por oraciones

resultados=[]
for txtm in oraciones:
  print(txtm)
  scores=sia.polarity_scores(txtm)
  print(scores)
  print("La polaridad es:", scores["compound"])
  #Obtiene las frases por grupos
  #Primero la frase, luego el compound, luego la polaridad (orden en los grupos)

  #A que sentimiento pertenece cada compound
  d=np.abs(vnm-scores["compound"]) #Distancia a cada uno de los sentimientos
  categoria=np.where(d==min(d))[0][0] #Busco la categoría a la que pertenece esa distancia
  print(vn[categoria]) #Sentimiento al cual pertenece la categoría
  resultados.append([txtm, scores["compound"], vn[categoria]])

#Se crea el informe en un dataFrame
df_2021=pd.DataFrame(resultados, columns=["Oración", "Compound", "Sentimiento"])
df_2021["Año"] = 2021
df_2021.head()

#Crear informe
df_2021.to_excel("Análisis ANALDEX 2021.xlsx")

Detailed Report on Colombia's Foreign Trade in 2021

1. Introduction

2021 was a year of transition for the global economy and for Colombia. Although the COVID-19 pandemic continued to be a challenge, vaccination measures and the easing of restrictions allowed for a gradual reactivation of economic activity. In this context, Colombian foreign trade presented a series of particularities that are worth analyzing in depth.

2. The Residual Impact of the COVID-19 Pandemic and Economic Recovery

Although the Colombian economy began to recover in 2021, the effects of the pandemic persisted. Uncertainty, supply chain disruptions, and weak global demand continued to be factors influencing the performance of foreign trade.

However, as the year progressed, a gradual recovery in exports and imports was observed, driven by:

Increased global demand:** Mass vaccination in several countries and the implementation of expansionary fiscal and monetary policies contributed to a gradual recovery in glob

## **INFORME ANALDEX 2022**

In [7]:
#Documento de ANALDEX 2022
nxl_2022="/content/drive/MyDrive/ANALÍTICA DE NEGOCIOS/InformeANALDEX_2022_EN.txt"
ntx_2022=open(nxl_2022, encoding="utf-8").read() #Como no es un excel, debemos leerlo como texto
print(ntx_2022)

#Se establece la escala de sentimientos númerico-cualitativo
#Escala PANAS (Positive and negative affective scale)
vn=["Amenaza", "Pesimismo", "Inestabilidad", "Esceptisismo", "Indiferente", "Neutral", "Favorable", "Optimismo", "Convicción", "Consolidación", "Confianza"] #Cualitativo
vnm=np.array([-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0]) #Cuantitativo
#Cada escala cualitativa tiene una escala cuantitativa

sent_tk=sent_tokenize(ntx_2022)
print(sent_tk) #Cada frase inicia con una comilla simple y finaliza con una comilla simple

#Para evitar palabras indeseables se crea un documento
nlp=spacy.load("en_core_web_sm") #Modelo de lenguaje para inglés
doc=nlp(ntx_2022)
oraciones=[sent.text for sent in doc.sents] #Separar por oraciones

resultados=[]
for txtm in oraciones:
  print(txtm)
  scores=sia.polarity_scores(txtm)
  print(scores)
  print("La polaridad es:", scores["compound"])
  #Obtiene las frases por grupos
  #Primero la frase, luego el compound, luego la polaridad (orden en los grupos)

  #A que sentimiento pertenece cada compound
  d=np.abs(vnm-scores["compound"]) #Distancia a cada uno de los sentimientos
  categoria=np.where(d==min(d))[0][0] #Busco la categoría a la que pertenece esa distancia
  print(vn[categoria]) #Sentimiento al cual pertenece la categoría
  resultados.append([txtm, scores["compound"], vn[categoria]])

#Se crea el informe en un dataFrame
df_2022=pd.DataFrame(resultados, columns=["Oración", "Compound", "Sentimiento"])
df_2022["Año"] = 2022
df_2022.head()

#Crear informe
df_2022.to_excel("Análisis ANALDEX 2022.xlsx")

Detailed Report on Colombia's Foreign Trade in 2022

1. Introduction

The year 2022 marked an important milestone in Colombia's economic recovery following the impacts of the COVID-19 pandemic. Foreign trade, as an engine of growth, played a fundamental role in this recovery. However, the international context, characterized by high inflation, geopolitical conflicts, and supply chain disruptions, presented new challenges for the Colombian export sector.

2. The Global Scenario and its Impact on Colombia

The international environment in 2022 was characterized by:

High inflation: Global inflation, driven by factors such as supply chain disruptions and expansionary monetary policies, impacted production costs and the prices of imported products.
Geopolitical uncertainty: Geopolitical conflicts, such as the war in Ukraine, generated volatility in the energy and raw materials markets, affecting the prices and availability of certain products. Supply chain disruptions: Although an improvem

## **INFORME ANALDEX 2023**

In [8]:
#Documento de ANALDEX 2023
nxl_2023="/content/drive/MyDrive/ANALÍTICA DE NEGOCIOS/InformeANALDEX_2023_EN.txt"
ntx_2023=open(nxl_2023, encoding="utf-8").read() #Como no es un excel, debemos leerlo como texto
print(ntx_2023)

#Se establece la escala de sentimientos númerico-cualitativo
#Escala PANAS (Positive and negative affective scale)
vn=["Amenaza", "Pesimismo", "Inestabilidad", "Esceptisismo", "Indiferente", "Neutral", "Favorable", "Optimismo", "Convicción", "Consolidación", "Confianza"] #Cualitativo
vnm=np.array([-1, -0.8, -0.6, -0.4, -0.2, 0, 0.2, 0.4, 0.6, 0.8, 1.0]) #Cuantitativo
#Cada escala cualitativa tiene una escala cuantitativa

sent_tk=sent_tokenize(ntx_2023)
print(sent_tk) #Cada frase inicia con una comilla simple y finaliza con una comilla simple

#Para evitar palabras indeseables se crea un documento
nlp=spacy.load("en_core_web_sm") #Modelo de lenguaje para inglés
doc=nlp(ntx_2023)
oraciones=[sent.text for sent in doc.sents] #Separar por oraciones

resultados=[]
for txtm in oraciones:
  print(txtm)
  scores=sia.polarity_scores(txtm)
  print(scores)
  print("La polaridad es:", scores["compound"])
  #Obtiene las frases por grupos
  #Primero la frase, luego el compound, luego la polaridad (orden en los grupos)

  #A que sentimiento pertenece cada compound
  d=np.abs(vnm-scores["compound"]) #Distancia a cada uno de los sentimientos
  categoria=np.where(d==min(d))[0][0] #Busco la categoría a la que pertenece esa distancia
  print(vn[categoria]) #Sentimiento al cual pertenece la categoría
  resultados.append([txtm, scores["compound"], vn[categoria]])

#Se crea el informe en un dataFrame
df_2023=pd.DataFrame(resultados, columns=["Oración", "Compound", "Sentimiento"])
df_2023["Año"] = 2023
df_2023.head()

#Crear informe
df_2023.to_excel("Análisis ANALDEX 2023.xlsx")

Detailed Report on Colombia's Foreign Trade in 2023

1. Introduction

The year 2023 marked a turning point in Colombia's economic recovery following the ravages of the COVID-19 pandemic. However, the international context, characterized by high inflation, geopolitical conflicts, and supply chain disruptions, presented new challenges for the Colombian export sector. In this report, we will analyze in-depth the performance of Colombian foreign trade this year, identifying the main trends, challenges, and opportunities.

2. The Global Scenario and its Impact on Colombia

The international environment in 2023 was characterized by:

High inflation: Global inflation, driven by factors such as supply chain disruptions and expansionary monetary policies, impacted production costs and the prices of imported products.
Geopolitical uncertainty: Geopolitical conflicts, such as the war in Ukraine, generated volatility in the energy and raw materials markets, affecting the prices and availability of

3. Consolidación de los informes

In [9]:
import pandas as pd
df_2020 = pd.read_excel("Análisis ANALDEX 2020.xlsx")
df_2021 = pd.read_excel("Análisis ANALDEX 2021.xlsx")
df_2022 = pd.read_excel("Análisis ANALDEX 2022.xlsx")
df_2023 = pd.read_excel("Análisis ANALDEX 2023.xlsx")

df_total = pd.concat([df_2020, df_2021, df_2022, df_2023], ignore_index=True)
df_total.head()

#Crear informe
df_total.to_excel("Análisis ANALDEX TOTAL EN.xlsx")

# **ANÁLISIS DE RESULTADOS:**

Dado que para este informe no hay variables por evaluar, se pretende dar una explicación general de qué es ANALDEX para así entender el contexto del ejercicio.

**ANALDEX** hace referencia a la Asociación Nacional de Comercio Exterior (antes conocida como la Asociación Nacional de Exportadores), es una entidad sin animo de lucro de naturaleza privada que tiene como objetivo fomentar y fortalecer la actividad exportadora nacional, apoyar el diseño y la ejecución de políticas de exportación de corto, mediano y largo plazo. Analdex asesora a los empresarios para que las exportaciones sean un mejor negocio y ayuda en la definición de estrategias de comercio exterior. De igual manera, incentiva la cultura exportadora y la competitividad. En la actualidad, esta asociación representa la voz de empresas exportadoras, importadoras, agencias de aduana, puertos, zonas francas, entre otras.

Esta Asociación es la encargada de realizar los informes anuales en términos de comercio exterior para ofrecer un panorama general de como se comportó Colombia en términos de relaciones internacionales y negocios. Los informes para el año 2020, 2021, 2022 y 2023 son los que se evaluaron en este análisis de sentimientos. A continuación un breve resumen del contenido de cada informe:

*   En **2020**, el comercio exterior colombiano cayó drásticamente por el COVID-19, afectando exportaciones e importaciones, especialmente en los sectores minero-energético y manufacturero. Se destacó la resiliencia del agro y la importancia del comercio digital.

* En **2021**, comenzó la recuperación gracias a la reapertura económica y el alza en precios de materias primas. Hubo mayor diversificación en exportaciones, pero persistieron desafíos como problemas en la cadena de suministro y baja competitividad.

* En **2022**, la recuperación continuó, aunque afectada por la inflación y la guerra en Ucrania. Creció el comercio electrónico y los acuerdos comerciales fueron clave. El sector minero-energético se benefició del alza en precios, pero con retos ambientales.

* En **2023**, el comercio exterior se estabilizó, pero con desafíos como la desaceleración global. La digitalización y la sostenibilidad emergieron como claves para fortalecer la competitividad del país.

El análisis de sentimiento pretendía evaluar cada informe y definir su tono emocional positivo, negativo o neutro para cada caso. Se evaluaron con respecto a 6 sentimientos: "Amenaza", "Pesimismo", "Inestabilidad", "Esceptisismo", "Indiferente", "Neutral", "Favorable", "Optimismo", "Convicción", "Consolidación", "Confianza".

Para el año **2020**, los sentimientos predominantes fueron convicción y consolidación, con 6 frases cada uno, seguidos de inestabilidad y optimismo, con 5 frases. Esto refleja el impacto negativo del COVID-19 en el comercio exterior colombiano, generando incertidumbre y desafíos. Sin embargo, a pesar de la crisis, el informe evidencia una postura de resiliencia y confianza en la capacidad del país para superar los retos y recuperar su estabilidad económica.

Para el año **2021**, el optimismo fue el sentimiento más recurrente, con 7 frases, reflejando la recuperación económica tras un año de pandemia e inestabilidad. Este panorama se refuerza con el sentimiento de convicción, presente en 6 frases, que, al igual que en 2020, muestra la confianza de los colombianos en la mejora del país. Además, el sentimiento favorable, con 5 menciones, indica avances y crecimiento en el comercio exterior gracias a la reapertura económica y la diversificación de exportaciones, evidenciando una visión más positiva tras un año desafiante.

Para el año **2022**, el sentimiento más predominante fue convicción, con 5 frases, reflejando la confianza en la continuidad del crecimiento económico a pesar de los desafíos globales. Le sigue consolidación, con 4 frases, indicando estabilidad en ciertos sectores del comercio exterior, especialmente en los acuerdos comerciales, que jugaron un papel clave en la dinámica económica del país. Además, los sentimientos favorable y optimismo, con 3 frases cada uno, evidencian una percepción positiva sobre las oportunidades de expansión y desarrollo, aunque aún con cierta cautela frente a los retos ambientales y de sostenibilidad reflejando el puntaje de 3 frases de inestabilidad en el análisis de sentimientos.

Para el año **2023**, los sentimientos predominantes fueron convicción y consolidación, con 4 frases cada uno, reflejando la confianza en la estabilidad del comercio exterior y la adaptación del país a un entorno global desafiante, fortaleciendo la competitividad colombiana. Además, los sentimientos favorable y optimismo, con 3 frases cada uno, indican una visión positiva sobre las oportunidades de crecimiento, reflejando la ambición por generar más crecimiento y seguir fortaleciendo la presencia de Colombia en un entorno internacional.

En general, durante estos cuatro años, el sentimiento de **convicción** ha sido una constante en los informes de ANALDEX, con un total de 21 frases. Este patrón sugiere una postura firme y confiada por parte de la Asociación en la capacidad de Colombia para enfrentar desafíos y fortalecer su comercio exterior, incluso en momentos de crisis como la pandemia por COVID-19. Este sentimiento se ve respaldado por el **optimismo** (18 frases) y la **consolidación** (17 frases), reflejando una visión positiva y esperanzadora sobre el futuro del comercio internacional del país. La confianza en la consolidación de la industria colombiana dentro del entorno global demuestra el compromiso de ANALDEX con el crecimiento y la estabilidad del sector. Sin embargo, la **inestabilidad** sigue siendo un factor presente, con 12 frases a lo largo de los cuatro años, lo que indica que, aunque hay avances, persisten desafíos importantes. La incertidumbre política y económica ha sido un obstáculo recurrente, dificultando el proceso de desarrollo y afectando la confianza en el panorama comercial a largo plazo.

Con este análisis de sentimientos pudimos clasificar y entender como a lo largo de estos cuatro años la postura por parte de Analdex ha cambiado o se ha mantenido en relación con el contexto global, permitiendo una visión general del panorama colombiano y el tono emocional por parte de sus informes.
