# NLP Basics Assessment

[![Open in Colab](https://colab.research.google.com/assets/colab-badge.svg)]('https://colab.research.google.com/github/semurillas/NLP_MIAA_252/blob/main/Sesion%201/Practice/6-practice.ipynb')


<center>

<h1>📚 Maestría en Inteligencia Artificial Aplicada – 3er Semestre</h1>

<h3>Asignatura: Procesamiento de Lenguaje Natural</h3>

<hr style="width:60%;">

<h2>👨‍🎓 Estudiantes</h2>
<ul style="list-style:none; padding:0; font-size:18px;">
    <li>Claudia Martínez</li>
    <li>Sebastián Murillas</li>
    <li>Mario J. Castellanos</li>
    <li>Enrique Manzano</li>
    <li>Octavio Guerra</li>
</ul>

<hr style="width:60%;">

<h3>📅 Fecha: Agosto 10, 2025</h3>

</center>


En este notebook vamos a poner en práctica algunos de los conceptos vistos en los notebooks anteriores (Sección Learning en Repositorio GitHub), aplicado a un corpus específico que cada uno de los estudiantes del grupo ha seleccionado.

## Referencias
* [NLP - Natural Language Processing With Python](https://www.udemy.com/course/nlp-natural-language-processing-with-python)
* [Natural Language Processing in Action](https://www.manning.com/books/natural-language-processing-in-action)

In [40]:
import importlib.metadata
import warnings

warnings.filterwarnings('ignore')

# Use importlib.metadata to get installed packages
installed_packages = [dist.metadata['Name'].lower() for dist in importlib.metadata.Distribution.discover()]
IN_COLAB = 'google-colab' in installed_packages

In [41]:
!test '{IN_COLAB}' = 'True' && pip install -r https://raw.githubusercontent.com/semurillas/NLP_MIAA_252/refs/heads/main/requirements.txt



In [42]:
import spacy
nlp = spacy.load('es_dep_news_trf')

In [43]:
print(nlp)

<spacy.lang.es.Spanish object at 0x78a2b50befd0>


## 📑 Análisis del Texto Seleccionado – Octavio Guerra

El texto elegido corresponde a un documento **Word** presentado como entrega del *Proyecto II de Innovación Tecnológica* del semestre anterior.

Dado que el archivo está en formato **.docx**, primero debe convertirse a texto antes de su procesamiento.


In [79]:
import docx
import requests

# Step 1: Download the file from GitHub
url = "https://raw.githubusercontent.com/semurillas/NLP_MIAA_252/main/Texts/Proyecto%20-%20Despliegue%20Modelos%20IA%20-%20Microservicios%20-%20Informe%20Final%20v3.docx"
docx_file_path = "informe_final.docx"

response = requests.get(url)
with open(docx_file_path, "wb") as f:
    f.write(response.content)

print(f"Archivo descargado como: {docx_file_path}")

# Step 2: Read the DOCX file
def read_docx(file_path):
    """Reads a .docx file and returns its text content."""
    doc = docx.Document(file_path)
    all_text = []
    for paragraph in doc.paragraphs:
        all_text.append(paragraph.text)
    return '\n'.join(all_text)

text_content = read_docx(docx_file_path)

# Step 3: Process with NLP model
doc = nlp(text_content)
print(docx_file_path,' has been processed with NLP model succesfully')




Archivo descargado como: informe_final.docx
informe_final.docx  has been processed with NLP model succesfully


In [80]:
doc[:100]


Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios. La solución fue diseñada en respuesta a la propuesta y necesidades del cliente, considerando sus limitaciones actuales en infraestructura y software, y orientada a ofrecer escalabilidad, flexibilidad y facilidad de mantenimiento. Cada componente del sistema se implementa como un microservicio independiente, empaquetado

El documento fue cargado exitosamente!

**2. Cuantos tokens hay en el archivo?**

In [81]:
len(doc)

4932

**3. Cuantas oraciones hay en el archivo?**
<br>Pista: Necesitarás una lista primero

In [82]:
sentences = list(doc.sents)
len(sentences)

214

**4. Imprime la segunda oración del documento**
<br> Pista: Los índices comienzan en 0 y el título cuenta como la primera oración.

In [83]:
sentences[1]

Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios.

**5. Por cada token en la oración anterior, imprime su `text`, `POS` tag, `dep` tag y `lemma`**
<br>

In [84]:
print("{:20}{:20}{:20}{:20}".format("Text", "POS", "dep", "lemma"))
for token in sentences[1]:
    print(f"{token.text:{20}}{token.pos_:{20}}{token.dep_:{20}}{token.lemma_:{20}}")

Text                POS                 dep                 lemma               
Elaboración         NOUN                nmod                elaboración         
de                  ADP                 case                de                  
Plataforma          PROPN               nmod                Plataforma          
basada              ADJ                 amod                basado              
en                  ADP                 case                en                  
Microservicios      NOUN                obj                 microservicio       

                   SPACE               dep                 
                   
Hector              PROPN               appos               Hector              
Yesid               PROPN               flat                Yesid               
Castelblanco        PROPN               flat                Castelblanco        
,                   PUNCT               punct               ,                   
Hector              PROPN   

**6. Implementa un matcher llamado *Swimming* que encuentre las ocurrencias de la frase *Inteligencia Artificial* Write a matcher called 'Swimming' that finds**
<br>
Pista: Deberías incluir un patrón`'IS_SPACE': True` entre las dos palabras.

In [95]:
from spacy.matcher import Matcher

matcher = Matcher(nlp.vocab)
pattern = [{'TEXT': 'Inteligencia'}]
matcher.add("Swimming", [pattern])

In [96]:
found_matches = matcher(doc)
print("Se encontraron: {}".format(len(found_matches)), "ocurrencias del ", pattern )
found_matches

Se encontraron: 7 ocurrencias del  [{'TEXT': 'Inteligencia'}]


[(12881893835109366681, 43, 44),
 (12881893835109366681, 345, 346),
 (12881893835109366681, 436, 437),
 (12881893835109366681, 1966, 1967),
 (12881893835109366681, 2607, 2608),
 (12881893835109366681, 3730, 3731),
 (12881893835109366681, 4144, 4145)]

**7. Imprime el texto al rededor de cada match encontrado**

In [97]:
for _, start, end in found_matches:
    span = doc[start:end]
    surrounding_span = doc[start-9:end+9]
    highlighted_text = []
    for token in surrounding_span:
        if token.i >= start and token.i < end:
            highlighted_text.append(f'**{token.text}**')
        else:
            highlighted_text.append(token.text)
    print(' '.join(highlighted_text))
    print('-------------------------------------------')
    print('\n')

de una plataforma para el despliegue de modelos de **Inteligencia** Artificial , basada en una arquitectura de microservicios .
-------------------------------------------


fundamentada en microservicios para el despliegue de modelos de **Inteligencia** Artificial ( IA ) , desarrollados y validados previamente
-------------------------------------------


desarrollo de backends y en el campo de la **Inteligencia** Artificial . Para la construcción de APIs ligeras y
-------------------------------------------


desarrollo de la plataforma de despliegue de modelos de **Inteligencia** Artificial ( IA ) , se ha adoptado una
-------------------------------------------


de la plataforma para el despliegue de modelos de **Inteligencia** Artificial ( IA ) se ha llevado a cabo
-------------------------------------------


de esta plataforma para el despliegue de modelos de **Inteligencia** Artificial se llevó a cabo basándose en la arquitectura
-------------------------------------------


un

**8. Imprime la oración que contiene cada match encontrado**

In [98]:
for sentence in sentences:
    for _, start, end in found_matches:
        if sentence.start <= start and sentence.end >= end:
            print(sentence.text, '\n')
            print("---------------------------------------------")

Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios. 

---------------------------------------------
Frente a este panorama, las arquitecturas basadas en microservicios han emergido como una alternativa sólida a los enfoques monolíticos tradicionales, permitiendo construir sistemas distribuidos, modulares y escalables con mayor flexibilidad y resiliencia.
Este documento presenta el diseño e implementación de una plataforma fundamentada en microservicios para el despliegue de modelos de Inteligencia Artificial (IA), desarrollados y validados previamente, con el objetivo de optimizar su ciclo de vida e integrarlos de manera eficiente en entornos productivos. 

--

## 📑 Análisis del Texto Seleccionado – Claudia Martinez


In [None]:
import docx
import requests

# Step 1: Download the file from GitHub
url = "https://raw.githubusercontent.com/semurillas/NLP_MIAA_252/main/Texts/Proyecto%20-%20Despliegue%20Modelos%20IA%20-%20Microservicios%20-%20Informe%20Final%20v3.docx"
docx_file_path = "informe_final.docx"

response = requests.get(url)
with open(docx_file_path, "wb") as f:
    f.write(response.content)

print(f"Archivo descargado como: {docx_file_path}")

# Step 2: Read the DOCX file
def read_docx(file_path):
    """Reads a .docx file and returns its text content."""
    doc = docx.Document(file_path)
    all_text = []
    for paragraph in doc.paragraphs:
        all_text.append(paragraph.text)
    return '\n'.join(all_text)

text_content = read_docx(docx_file_path)

# Step 3: Process with NLP model
doc = nlp(text_content)
print(docx_file_path,' has been processed with NLP model succesfully')




Archivo descargado como: informe_final.docx
informe_final.docx  has been processed with NLP model succesfully


In [None]:
doc[:100]


Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios. La solución fue diseñada en respuesta a la propuesta y necesidades del cliente, considerando sus limitaciones actuales en infraestructura y software, y orientada a ofrecer escalabilidad, flexibilidad y facilidad de mantenimiento. Cada componente del sistema se implementa como un microservicio independiente, empaquetado

El documento fue cargado exitosamente!

**2. Cuantos tokens hay en el archivo?**

In [None]:
len(doc)

4932

**3. Cuantas oraciones hay en el archivo?**
<br>Pista: Necesitarás una lista primero

In [None]:
sentences = list(doc.sents)
len(sentences)

214

**4. Imprime la segunda oración del documento**
<br> Pista: Los índices comienzan en 0 y el título cuenta como la primera oración.

In [None]:
sentences[1]

Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios.

**5. Por cada token en la oración anterior, imprime su `text`, `POS` tag, `dep` tag y `lemma`**
<br>

In [None]:
print("{:20}{:20}{:20}{:20}".format("Text", "POS", "dep", "lemma"))
for token in sentences[1]:
    print(f"{token.text:{20}}{token.pos_:{20}}{token.dep_:{20}}{token.lemma_:{20}}")

Text                POS                 dep                 lemma               
Elaboración         NOUN                nmod                elaboración         
de                  ADP                 case                de                  
Plataforma          PROPN               nmod                Plataforma          
basada              ADJ                 amod                basado              
en                  ADP                 case                en                  
Microservicios      NOUN                obj                 microservicio       

                   SPACE               dep                 
                   
Hector              PROPN               appos               Hector              
Yesid               PROPN               flat                Yesid               
Castelblanco        PROPN               flat                Castelblanco        
,                   PUNCT               punct               ,                   
Hector              PROPN   

**6. Implementa un matcher llamado *Swimming* que encuentre las ocurrencias de la frase *Inteligencia Artificial* Write a matcher called 'Swimming' that finds**
<br>
Pista: Deberías incluir un patrón`'IS_SPACE': True` entre las dos palabras.

In [None]:
from spacy.matcher import Matcher

matcher = Matcher(nlp.vocab)
pattern = [{'TEXT': 'Inteligencia'}]
matcher.add("Swimming", [pattern])

In [None]:
found_matches = matcher(doc)
print("Se encontraron: {}".format(len(found_matches)), "ocurrencias del ", pattern )
found_matches

Se encontraron: 7 ocurrencias del  [{'TEXT': 'Inteligencia'}]


[(12881893835109366681, 43, 44),
 (12881893835109366681, 345, 346),
 (12881893835109366681, 436, 437),
 (12881893835109366681, 1966, 1967),
 (12881893835109366681, 2607, 2608),
 (12881893835109366681, 3730, 3731),
 (12881893835109366681, 4144, 4145)]

**7. Imprime el texto al rededor de cada match encontrado**

In [None]:
for _, start, end in found_matches:
    span = doc[start:end]
    surrounding_span = doc[start-9:end+9]
    highlighted_text = []
    for token in surrounding_span:
        if token.i >= start and token.i < end:
            highlighted_text.append(f'**{token.text}**')
        else:
            highlighted_text.append(token.text)
    print(' '.join(highlighted_text))
    print('-------------------------------------------')
    print('\n')

de una plataforma para el despliegue de modelos de **Inteligencia** Artificial , basada en una arquitectura de microservicios .
-------------------------------------------


fundamentada en microservicios para el despliegue de modelos de **Inteligencia** Artificial ( IA ) , desarrollados y validados previamente
-------------------------------------------


desarrollo de backends y en el campo de la **Inteligencia** Artificial . Para la construcción de APIs ligeras y
-------------------------------------------


desarrollo de la plataforma de despliegue de modelos de **Inteligencia** Artificial ( IA ) , se ha adoptado una
-------------------------------------------


de la plataforma para el despliegue de modelos de **Inteligencia** Artificial ( IA ) se ha llevado a cabo
-------------------------------------------


de esta plataforma para el despliegue de modelos de **Inteligencia** Artificial se llevó a cabo basándose en la arquitectura
-------------------------------------------


un

**8. Imprime la oración que contiene cada match encontrado**

In [None]:
for sentence in sentences:
    for _, start, end in found_matches:
        if sentence.start <= start and sentence.end >= end:
            print(sentence.text, '\n')
            print("---------------------------------------------")

Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios. 

---------------------------------------------
Frente a este panorama, las arquitecturas basadas en microservicios han emergido como una alternativa sólida a los enfoques monolíticos tradicionales, permitiendo construir sistemas distribuidos, modulares y escalables con mayor flexibilidad y resiliencia.
Este documento presenta el diseño e implementación de una plataforma fundamentada en microservicios para el despliegue de modelos de Inteligencia Artificial (IA), desarrollados y validados previamente, con el objetivo de optimizar su ciclo de vida e integrarlos de manera eficiente en entornos productivos. 

--

## 📑 Análisis del Texto Seleccionado – Sebastian Murillas

In [None]:
import docx
import requests

# Step 1: Download the file from GitHub
url = "https://raw.githubusercontent.com/semurillas/NLP_MIAA_252/main/Texts/Proyecto%20-%20Despliegue%20Modelos%20IA%20-%20Microservicios%20-%20Informe%20Final%20v3.docx"
docx_file_path = "informe_final.docx"

response = requests.get(url)
with open(docx_file_path, "wb") as f:
    f.write(response.content)

print(f"Archivo descargado como: {docx_file_path}")

# Step 2: Read the DOCX file
def read_docx(file_path):
    """Reads a .docx file and returns its text content."""
    doc = docx.Document(file_path)
    all_text = []
    for paragraph in doc.paragraphs:
        all_text.append(paragraph.text)
    return '\n'.join(all_text)

text_content = read_docx(docx_file_path)

# Step 3: Process with NLP model
doc = nlp(text_content)
print(docx_file_path,' has been processed with NLP model succesfully')




Archivo descargado como: informe_final.docx
informe_final.docx  has been processed with NLP model succesfully


In [None]:
doc[:100]


Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios. La solución fue diseñada en respuesta a la propuesta y necesidades del cliente, considerando sus limitaciones actuales en infraestructura y software, y orientada a ofrecer escalabilidad, flexibilidad y facilidad de mantenimiento. Cada componente del sistema se implementa como un microservicio independiente, empaquetado

El documento fue cargado exitosamente!

**2. Cuantos tokens hay en el archivo?**

In [None]:
len(doc)

4932

**3. Cuantas oraciones hay en el archivo?**
<br>Pista: Necesitarás una lista primero

In [None]:
sentences = list(doc.sents)
len(sentences)

214

**4. Imprime la segunda oración del documento**
<br> Pista: Los índices comienzan en 0 y el título cuenta como la primera oración.

In [None]:
sentences[1]

Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios.

**5. Por cada token en la oración anterior, imprime su `text`, `POS` tag, `dep` tag y `lemma`**
<br>

In [None]:
print("{:20}{:20}{:20}{:20}".format("Text", "POS", "dep", "lemma"))
for token in sentences[1]:
    print(f"{token.text:{20}}{token.pos_:{20}}{token.dep_:{20}}{token.lemma_:{20}}")

Text                POS                 dep                 lemma               
Elaboración         NOUN                nmod                elaboración         
de                  ADP                 case                de                  
Plataforma          PROPN               nmod                Plataforma          
basada              ADJ                 amod                basado              
en                  ADP                 case                en                  
Microservicios      NOUN                obj                 microservicio       

                   SPACE               dep                 
                   
Hector              PROPN               appos               Hector              
Yesid               PROPN               flat                Yesid               
Castelblanco        PROPN               flat                Castelblanco        
,                   PUNCT               punct               ,                   
Hector              PROPN   

**6. Implementa un matcher llamado *Swimming* que encuentre las ocurrencias de la frase *Inteligencia Artificial* Write a matcher called 'Swimming' that finds**
<br>
Pista: Deberías incluir un patrón`'IS_SPACE': True` entre las dos palabras.

In [None]:
from spacy.matcher import Matcher

matcher = Matcher(nlp.vocab)
pattern = [{'TEXT': 'Inteligencia'}]
matcher.add("Swimming", [pattern])

In [None]:
found_matches = matcher(doc)
print("Se encontraron: {}".format(len(found_matches)), "ocurrencias del ", pattern )
found_matches

Se encontraron: 7 ocurrencias del  [{'TEXT': 'Inteligencia'}]


[(12881893835109366681, 43, 44),
 (12881893835109366681, 345, 346),
 (12881893835109366681, 436, 437),
 (12881893835109366681, 1966, 1967),
 (12881893835109366681, 2607, 2608),
 (12881893835109366681, 3730, 3731),
 (12881893835109366681, 4144, 4145)]

**7. Imprime el texto al rededor de cada match encontrado**

In [None]:
for _, start, end in found_matches:
    span = doc[start:end]
    surrounding_span = doc[start-9:end+9]
    highlighted_text = []
    for token in surrounding_span:
        if token.i >= start and token.i < end:
            highlighted_text.append(f'**{token.text}**')
        else:
            highlighted_text.append(token.text)
    print(' '.join(highlighted_text))
    print('-------------------------------------------')
    print('\n')

de una plataforma para el despliegue de modelos de **Inteligencia** Artificial , basada en una arquitectura de microservicios .
-------------------------------------------


fundamentada en microservicios para el despliegue de modelos de **Inteligencia** Artificial ( IA ) , desarrollados y validados previamente
-------------------------------------------


desarrollo de backends y en el campo de la **Inteligencia** Artificial . Para la construcción de APIs ligeras y
-------------------------------------------


desarrollo de la plataforma de despliegue de modelos de **Inteligencia** Artificial ( IA ) , se ha adoptado una
-------------------------------------------


de la plataforma para el despliegue de modelos de **Inteligencia** Artificial ( IA ) se ha llevado a cabo
-------------------------------------------


de esta plataforma para el despliegue de modelos de **Inteligencia** Artificial se llevó a cabo basándose en la arquitectura
-------------------------------------------


un

**8. Imprime la oración que contiene cada match encontrado**

In [None]:
for sentence in sentences:
    for _, start, end in found_matches:
        if sentence.start <= start and sentence.end >= end:
            print(sentence.text, '\n')
            print("---------------------------------------------")

Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios. 

---------------------------------------------
Frente a este panorama, las arquitecturas basadas en microservicios han emergido como una alternativa sólida a los enfoques monolíticos tradicionales, permitiendo construir sistemas distribuidos, modulares y escalables con mayor flexibilidad y resiliencia.
Este documento presenta el diseño e implementación de una plataforma fundamentada en microservicios para el despliegue de modelos de Inteligencia Artificial (IA), desarrollados y validados previamente, con el objetivo de optimizar su ciclo de vida e integrarlos de manera eficiente en entornos productivos. 

--

## 📑 Análisis del Texto Seleccionado – Mario J. Castellanos

In [None]:
import docx
import requests

# Step 1: Download the file from GitHub
url = "https://raw.githubusercontent.com/semurillas/NLP_MIAA_252/main/Texts/Proyecto%20-%20Despliegue%20Modelos%20IA%20-%20Microservicios%20-%20Informe%20Final%20v3.docx"
docx_file_path = "informe_final.docx"

response = requests.get(url)
with open(docx_file_path, "wb") as f:
    f.write(response.content)

print(f"Archivo descargado como: {docx_file_path}")

# Step 2: Read the DOCX file
def read_docx(file_path):
    """Reads a .docx file and returns its text content."""
    doc = docx.Document(file_path)
    all_text = []
    for paragraph in doc.paragraphs:
        all_text.append(paragraph.text)
    return '\n'.join(all_text)

text_content = read_docx(docx_file_path)

# Step 3: Process with NLP model
doc = nlp(text_content)
print(docx_file_path,' has been processed with NLP model succesfully')




Archivo descargado como: informe_final.docx
informe_final.docx  has been processed with NLP model succesfully


In [None]:
doc[:100]


Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios. La solución fue diseñada en respuesta a la propuesta y necesidades del cliente, considerando sus limitaciones actuales en infraestructura y software, y orientada a ofrecer escalabilidad, flexibilidad y facilidad de mantenimiento. Cada componente del sistema se implementa como un microservicio independiente, empaquetado

El documento fue cargado exitosamente!

**2. Cuantos tokens hay en el archivo?**

In [None]:
len(doc)

4932

**3. Cuantas oraciones hay en el archivo?**
<br>Pista: Necesitarás una lista primero

In [None]:
sentences = list(doc.sents)
len(sentences)

214

**4. Imprime la segunda oración del documento**
<br> Pista: Los índices comienzan en 0 y el título cuenta como la primera oración.

In [None]:
sentences[1]

Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios.

**5. Por cada token en la oración anterior, imprime su `text`, `POS` tag, `dep` tag y `lemma`**
<br>

In [None]:
print("{:20}{:20}{:20}{:20}".format("Text", "POS", "dep", "lemma"))
for token in sentences[1]:
    print(f"{token.text:{20}}{token.pos_:{20}}{token.dep_:{20}}{token.lemma_:{20}}")

Text                POS                 dep                 lemma               
Elaboración         NOUN                nmod                elaboración         
de                  ADP                 case                de                  
Plataforma          PROPN               nmod                Plataforma          
basada              ADJ                 amod                basado              
en                  ADP                 case                en                  
Microservicios      NOUN                obj                 microservicio       

                   SPACE               dep                 
                   
Hector              PROPN               appos               Hector              
Yesid               PROPN               flat                Yesid               
Castelblanco        PROPN               flat                Castelblanco        
,                   PUNCT               punct               ,                   
Hector              PROPN   

**6. Implementa un matcher llamado *Swimming* que encuentre las ocurrencias de la frase *Inteligencia Artificial* Write a matcher called 'Swimming' that finds**
<br>
Pista: Deberías incluir un patrón`'IS_SPACE': True` entre las dos palabras.

In [None]:
from spacy.matcher import Matcher

matcher = Matcher(nlp.vocab)
pattern = [{'TEXT': 'Inteligencia'}]
matcher.add("Swimming", [pattern])

In [None]:
found_matches = matcher(doc)
print("Se encontraron: {}".format(len(found_matches)), "ocurrencias del ", pattern )
found_matches

Se encontraron: 7 ocurrencias del  [{'TEXT': 'Inteligencia'}]


[(12881893835109366681, 43, 44),
 (12881893835109366681, 345, 346),
 (12881893835109366681, 436, 437),
 (12881893835109366681, 1966, 1967),
 (12881893835109366681, 2607, 2608),
 (12881893835109366681, 3730, 3731),
 (12881893835109366681, 4144, 4145)]

**7. Imprime el texto al rededor de cada match encontrado**

In [None]:
for _, start, end in found_matches:
    span = doc[start:end]
    surrounding_span = doc[start-9:end+9]
    highlighted_text = []
    for token in surrounding_span:
        if token.i >= start and token.i < end:
            highlighted_text.append(f'**{token.text}**')
        else:
            highlighted_text.append(token.text)
    print(' '.join(highlighted_text))
    print('-------------------------------------------')
    print('\n')

de una plataforma para el despliegue de modelos de **Inteligencia** Artificial , basada en una arquitectura de microservicios .
-------------------------------------------


fundamentada en microservicios para el despliegue de modelos de **Inteligencia** Artificial ( IA ) , desarrollados y validados previamente
-------------------------------------------


desarrollo de backends y en el campo de la **Inteligencia** Artificial . Para la construcción de APIs ligeras y
-------------------------------------------


desarrollo de la plataforma de despliegue de modelos de **Inteligencia** Artificial ( IA ) , se ha adoptado una
-------------------------------------------


de la plataforma para el despliegue de modelos de **Inteligencia** Artificial ( IA ) se ha llevado a cabo
-------------------------------------------


de esta plataforma para el despliegue de modelos de **Inteligencia** Artificial se llevó a cabo basándose en la arquitectura
-------------------------------------------


un

**8. Imprime la oración que contiene cada match encontrado**

In [None]:
for sentence in sentences:
    for _, start, end in found_matches:
        if sentence.start <= start and sentence.end >= end:
            print(sentence.text, '\n')
            print("---------------------------------------------")

Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios. 

---------------------------------------------
Frente a este panorama, las arquitecturas basadas en microservicios han emergido como una alternativa sólida a los enfoques monolíticos tradicionales, permitiendo construir sistemas distribuidos, modulares y escalables con mayor flexibilidad y resiliencia.
Este documento presenta el diseño e implementación de una plataforma fundamentada en microservicios para el despliegue de modelos de Inteligencia Artificial (IA), desarrollados y validados previamente, con el objetivo de optimizar su ciclo de vida e integrarlos de manera eficiente en entornos productivos. 

--

## 📑 Análisis del Texto Seleccionado – Enrique Manzano

In [None]:
import docx
import requests

# Step 1: Download the file from GitHub
url = "https://raw.githubusercontent.com/semurillas/NLP_MIAA_252/main/Texts/Proyecto%20-%20Despliegue%20Modelos%20IA%20-%20Microservicios%20-%20Informe%20Final%20v3.docx"
docx_file_path = "informe_final.docx"

response = requests.get(url)
with open(docx_file_path, "wb") as f:
    f.write(response.content)

print(f"Archivo descargado como: {docx_file_path}")

# Step 2: Read the DOCX file
def read_docx(file_path):
    """Reads a .docx file and returns its text content."""
    doc = docx.Document(file_path)
    all_text = []
    for paragraph in doc.paragraphs:
        all_text.append(paragraph.text)
    return '\n'.join(all_text)

text_content = read_docx(docx_file_path)

# Step 3: Process with NLP model
doc = nlp(text_content)
print(docx_file_path,' has been processed with NLP model succesfully')




Archivo descargado como: informe_final.docx
informe_final.docx  has been processed with NLP model succesfully


In [None]:
doc[:100]


Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios. La solución fue diseñada en respuesta a la propuesta y necesidades del cliente, considerando sus limitaciones actuales en infraestructura y software, y orientada a ofrecer escalabilidad, flexibilidad y facilidad de mantenimiento. Cada componente del sistema se implementa como un microservicio independiente, empaquetado

El documento fue cargado exitosamente!

**2. Cuantos tokens hay en el archivo?**

In [None]:
len(doc)

4932

**3. Cuantas oraciones hay en el archivo?**
<br>Pista: Necesitarás una lista primero

In [None]:
sentences = list(doc.sents)
len(sentences)

214

**4. Imprime la segunda oración del documento**
<br> Pista: Los índices comienzan en 0 y el título cuenta como la primera oración.

In [None]:
sentences[1]

Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios.

**5. Por cada token en la oración anterior, imprime su `text`, `POS` tag, `dep` tag y `lemma`**
<br>

In [None]:
print("{:20}{:20}{:20}{:20}".format("Text", "POS", "dep", "lemma"))
for token in sentences[1]:
    print(f"{token.text:{20}}{token.pos_:{20}}{token.dep_:{20}}{token.lemma_:{20}}")

Text                POS                 dep                 lemma               
Elaboración         NOUN                nmod                elaboración         
de                  ADP                 case                de                  
Plataforma          PROPN               nmod                Plataforma          
basada              ADJ                 amod                basado              
en                  ADP                 case                en                  
Microservicios      NOUN                obj                 microservicio       

                   SPACE               dep                 
                   
Hector              PROPN               appos               Hector              
Yesid               PROPN               flat                Yesid               
Castelblanco        PROPN               flat                Castelblanco        
,                   PUNCT               punct               ,                   
Hector              PROPN   

**6. Implementa un matcher llamado *Swimming* que encuentre las ocurrencias de la frase *Inteligencia Artificial* Write a matcher called 'Swimming' that finds**
<br>
Pista: Deberías incluir un patrón`'IS_SPACE': True` entre las dos palabras.

In [None]:
from spacy.matcher import Matcher

matcher = Matcher(nlp.vocab)
pattern = [{'TEXT': 'Inteligencia'}]
matcher.add("Swimming", [pattern])

In [None]:
found_matches = matcher(doc)
print("Se encontraron: {}".format(len(found_matches)), "ocurrencias del ", pattern )
found_matches

Se encontraron: 7 ocurrencias del  [{'TEXT': 'Inteligencia'}]


[(12881893835109366681, 43, 44),
 (12881893835109366681, 345, 346),
 (12881893835109366681, 436, 437),
 (12881893835109366681, 1966, 1967),
 (12881893835109366681, 2607, 2608),
 (12881893835109366681, 3730, 3731),
 (12881893835109366681, 4144, 4145)]

**7. Imprime el texto al rededor de cada match encontrado**

In [None]:
for _, start, end in found_matches:
    span = doc[start:end]
    surrounding_span = doc[start-9:end+9]
    highlighted_text = []
    for token in surrounding_span:
        if token.i >= start and token.i < end:
            highlighted_text.append(f'**{token.text}**')
        else:
            highlighted_text.append(token.text)
    print(' '.join(highlighted_text))
    print('-------------------------------------------')
    print('\n')

de una plataforma para el despliegue de modelos de **Inteligencia** Artificial , basada en una arquitectura de microservicios .
-------------------------------------------


fundamentada en microservicios para el despliegue de modelos de **Inteligencia** Artificial ( IA ) , desarrollados y validados previamente
-------------------------------------------


desarrollo de backends y en el campo de la **Inteligencia** Artificial . Para la construcción de APIs ligeras y
-------------------------------------------


desarrollo de la plataforma de despliegue de modelos de **Inteligencia** Artificial ( IA ) , se ha adoptado una
-------------------------------------------


de la plataforma para el despliegue de modelos de **Inteligencia** Artificial ( IA ) se ha llevado a cabo
-------------------------------------------


de esta plataforma para el despliegue de modelos de **Inteligencia** Artificial se llevó a cabo basándose en la arquitectura
-------------------------------------------


un

**8. Imprime la oración que contiene cada match encontrado**

In [None]:
for sentence in sentences:
    for _, start, end in found_matches:
        if sentence.start <= start and sentence.end >= end:
            print(sentence.text, '\n')
            print("---------------------------------------------")

Elaboración de Plataforma basada en Microservicios
Hector Yesid Castelblanco, Hector Torres , Octavio Guerra 
hector.castelblancocaro@u.icesi.edu.co  , hector.torres@u.icesi.edu.co  ,octavio.guerra@u.icesu.edu.co 

Resumen –  Este trabajo presenta el desarrollo de una plataforma para el despliegue de modelos de Inteligencia Artificial, basada en una arquitectura de microservicios. 

---------------------------------------------
Frente a este panorama, las arquitecturas basadas en microservicios han emergido como una alternativa sólida a los enfoques monolíticos tradicionales, permitiendo construir sistemas distribuidos, modulares y escalables con mayor flexibilidad y resiliencia.
Este documento presenta el diseño e implementación de una plataforma fundamentada en microservicios para el despliegue de modelos de Inteligencia Artificial (IA), desarrollados y validados previamente, con el objetivo de optimizar su ciclo de vida e integrarlos de manera eficiente en entornos productivos. 

--