# MoCoPo 

El protocolo MCP fue estandarizado por Anthropic en noviembre de 2024. 
https://modelcontextprotocol.io/docs/getting-started/intro

Aunque es muy joven (aún no tiene un año cuando escribo esto) cada vez más modelos LLM y programas lo usan (aparte de Claude). 

https://developer.chrome.com/blog/chrome-devtools-mcp?hl=es-419


MCP tiene un futuro prometedor. 
Pero ¿ para que sirve? , ¿ como y porque funciona?

El texto es para personas que conocen poco o nada de MCP , Agentes y herramientas (que son cosas relacionadas).








## LLM

    De forma muy abstracta, cualquier modelo de inteligencia artificial es una gran matriz “numérica”, que hace operaciones con otra matriz numérica(entrada), dando como resultado una nueva matriz de números: .

\* \* En los modelos de lenguaje (LLM), la entrada es un texto que se codifica con embeddings en matrices numericas , y el resultado se re-codifica a texto. Y lo mismo ocurre si hablamos de imagen o sonido. 

![image.png](llmabstract.png)


Son una especie de caja “cerrada”. No tiene acceso al exterior. Su conocimiento está “encerrado” en la matriz de números de esa caja.  La única forma de comunicarse con esa caja es la entrada, y la caja produce un resultado como  salida. 

La salida puede cambiar porque en la inferencia de redes neuronales existe una aleatoriedad intrínseca, y además se puede dar más o menos “calor” para que las respuestas sean o más “creativas” o más “predecibles".

## Agentes 

La forma típica de comunicarse con el LLM, es un programa estilo “chat” en el que introducimos preguntas y se visualizan las respuestas del LLM.  Este programa sabe como comunicarse con el modelo LLM , como enviarle los datos y cómo mostrar los resultados.

* Este programa hace de mediador entre el modelo LLM y el usuario humano.  Le podriamos llamar "agente chat"
* De la misma forma podemos crear programas mediadores entre el LLM y nuestros programas, que serian otros tipos de Agente, sin intervención humana.
* Sin entrar en dogmatismos de nombres : Lo importante a entender es que una cosa es el LLM (por ejemplo ollama) que llamaremos servidor LLM . Y otra cosa son los programas que lo usan y que pueden combinarse. Desde el propio programa chat, a los programas añadidos a los que  podriamos llamar "Agentes".


## Herramientas

La mayoría de modelos LLM “actuales”, son muy modulares. Algunas características o funciones se activan  según el trabajo a realizar. 

Por ejemplo , un LLM multimodal que reconoce imágenes no ejecutará la función de OCR de una imagen, si no hay imagen a  analizar. En muchos casos el  agente chat le da ordenes concretas al llm para activar algunas caracteristicas. En otros casos puede ser que el propio LLM active esas  “herramientas internas”, porque sabe cuándo o cómo usarlas.

Lo que buscamos, es añadir nuevas herramientas al LLM. O dicho de otra manera, que el LLM pueda hacer cosas que no tenga programadas internamente.

Y como el LLM no se puede cambiar, las caracteristicas se añaden a traves de los agentes que lo usan.

Una explicación mas detallada y "normalizada" de agentes y herramientas

https://huggingface.co/learn/agents-course/es/unit0/introduction




### ollama-python
https://github.com/ollama/ollama-python


En esta primera parte me centraré en ver como funcionan las herramientas tools en ollama. Asumiendo que funcionan de forma parecida en otros modelos, pero cada uno con sus especificaciones.  

La existencia de las tools es anterior al estandar MCP. Pero si entendemos como funcionan las tools, entenderemos MCP.

Usaremos la libreria oficial de ollama-python para dar los primeros pasos.
Si necesitas instalarla : pip install  ollama  

In [None]:
# !pip install typing-extensions ? si no lo tienes instalado
# !pip install --force-reinstall ollama==0.4. ? si queremos una version concreta
# !pip install --force-reinstall   ollama 

Lo normal es que tengais ollama instalado localmente. 

Pero ahora tienes la posibilidad de ejecutarlo en la nuve.
Puedes tener tu ApiKey accediendo a tu cuenta en 
https://ollama.com

![image.png](ollamaconfig.png)


In [None]:
# definimos la funciones que crean los clientes ollama que se ajusten a las necesidades.

from ollama import Client, chat

modelo='llama3.2'  

# para acceder a tu ollama local
def  clientLocal ():
    return  Client(host='http://localhost:11434')

# para acceder a un ollama instalado en otra maquina (la mia)
def  clientRemoto ():
    return  Client(host='http://88.6.74.122:11433')

# para acceder a un ollama en la nuve
def  clientCloud ():
    global modelo
    modelo="gpt-oss:20b-cloud"
    ApiKey="xxxx"
    return  Client(
              host='https://ollama.com/',
              headers={ 'Authorization': 'Bearer ' + ApiKey}    
            )


In [None]:
# client = clientLocal()

# la version Cloud - 
# client = clientCloud()
# escogemos la version remota
client = clientRemoto()



def log (*args):
   print(*args)
   return


# este es la primera version de chat 
def runPrompt (prom):
    log('Pregunta:',prom)
    response =  client.chat(
        model=modelo,
        messages=[
            {'role': 'user', 'content': prom}]
    )    
    # Extrae la respuesta 
    respuesta = response.message.content
    log('Respuesta:',respuesta)
    return respuesta




In [None]:
# Probamos que la conexion funciona, 

def ejemplo1 ():
    runPrompt( 'Hola. ¿Donde esta teruel?')

ejemplo1()



Ahora vamos a jugar un poco


In [None]:
def ejemplo2 ():
    runPrompt( '¿que temperatura hace hoy en Teruel?')
    
def ejemplo3 ():
    runPrompt( 'Si En teruel ahora hace 20 grados de temperatura ¿que temperatura hace hoy en teruel?')


ejemplo2()
ejemplo3()


Lo normal es que el ejemplo2 haya respondido diciendo que no puede saberlo.
En el caso del ejemplo3, puede ser que varie la respuesta segun el modelo, porque en la pregunta puede  encontrar la respuesta, o no ya que no son muy precisas las instrucciones. No es lo mismo la temperatura de ahora mismo que la temperatura de hoy

Es obvio que este tipo de preguntas no suelen hacerse, hacer la pregunta , aportando la respuesta no tiene mucho sentido, pero estamos jugando.

Damos un pequeño paso más. Supongamos que al sistema le hayamos informado previamente de las temperaturas, con una orden interna .
Ahora puede responder con la información si la tiene.

Evidentemente , no es normal hacer esto. Pero es para ilustrar como gradualmente podemos darle información al modelo que le ayude a  dar la respuesta.



In [None]:

systemPrompt= 'Has comprobado que en Teruel  hace 15 grados de temperatura y en Cuenca hace 17 grados'

def runPrompt2 (prom,syprom):
    log('Pregunta:',prom)
    response =  client.chat(
        model=modelo,
        messages=[
            {'role': 'system', 'content': syprom},
            {'role': 'user', 'content': prom}]        
    )
    # Extrae la respuesta del modelo
    respuesta = response.message.content
    log('Respuesta:',respuesta)
    return respuesta



def ejemplo4 ():
    runPrompt2 ( ' ¿que temperatura hace ahora en teruel, cuenca y valencia?',systemPrompt)


# ejemplo1()
# ejemplo2()
#  ejemplo3()
ejemplo4()


### Cambiamos de ejemplo. 
Nos Hemos inventado una operacion matematica que le llamamos mocopo. 
Como es inventada es normal que el LLM no sepa qué responder


In [None]:


def ejemploOperacion1 ():
    runPrompt ( ' ¿cual es el resultado de hacer la operacion mocopo entre en numero 4 y 8')

ejemploOperacion1()


Pero  ahora mira este ejemplo: Le estamos haciendo la pregunta y le estamos informando de como se hace la operacion mocopo ,
no  le decimos el resultado, le damos la formula para calcularlo.



In [None]:


def ejemploOperacion2 ():
    runPrompt2 ( ' ¿cual es el resultado de hacer la operacion mocopo entre el numero 4 y 8',
                'la operacion mocopo es  la suma de dos numeros restando 2 al resultado ')

ejemploOperacion2()


Puedes probar diferentes valores de numeros y seguramente te va a dar respuestas correctas.

Esta seria una forma muy primitiva de definir y añadir una funcion nueva al modelo. 

Podemos hacer prompts mas complejos y detallados, pero nos encontraremos muchas limitaciones, ya que el texto puede tener ambiguedades, o ser demasiado complejos para ser analizados correctamente por el LLM. 





## Tools

Para decirle al modelo ollama  como hacer nuevas operaciones se utiliza algo parecido, pero mas especializado y especifico. Las Tools.
Se trata de algo que añadimos a los mensajes , y que el modelo LLM sabe entender y usar.

Vamos a ver un ejemplo más complejo que ilustre el ciclo de vida de las tools.
* El agente chat hace la consulta al LLM, pasandole la pregunta y diciendole que tiene unas herramientas disponibles por si las necesita.
* Si para dar la respuesta , el LLM considera que debe usar alguna de las herramientas, devuelve una respuesta "especial" diciendole al agente que necesita usar tal herramienta pasando los datos
* El agente le vuelve a pasar la pregunta al LLM, añadiendo los resultados obtenidos por la tool
* Si el LLM todavia necesita usar alguna tool más vuelve a responder de forma especial y se repite el ciclo
* Cuando el LLM ya tiene todo lo necesario, da la respuesta final. Que es la que llega al usuario.
* Todos los mensajes de intercambio de llamadas a  herramientas pueden ser invisibles al usuario, aunque  puedes requerir una confirmacion para proteger un acceso no deseado a alguna tool 

![image.png](CicloVidaTool.png)


Veamos como se hace esto en código python.

Primero tenemos definidas unas funciones "normales" en python. Lo importante es que esten bien comentados informando de que hacen. Esta descripcion se va a usar para informarle al LLM de que hace la funcion.



In [None]:


def temperaturaCiudad (city: str) -> int :
  """
  optiene la temperatura en ciudades de España. Esta funcion se conectaria a un servicio web que devuelve el resultado en tiempo real.
  Args:
    city (str): la ciudad a consultar
  Returns:
    int: la temperatura de la ciudad
  """
  # log ('temperaturaCiudad:',city)
  if city.lower()=='teruel': return 7
  if city.lower()=='cuenca': return 14
  return 20


def mocopo_two_numbers(a: int, b: int) -> int:
  """
  Mocopo de dos numeros. Es el nombre que hemos inventado para una operacion compleja entre dos numeros
  Args:
    'a' int : El primer numero
    'b' int : El segundo numero
   
  Returns:
    int: el resultado de la operacion
  """
  # log ('mocopo:',a,b)  
  return (int(a) + int(b))+(int(a) * int(b))


def factorial_par (a: int) -> int:
  """
  FactorialPar de un numero. Un tipo de factorizacion especial definido como a!=a*(a-3)!
  Args:
    'a' int : El  numero
      
  Returns:
    int: el resultado de la operacion
  """
  a=int(a)
  if a<=1: return 1
  return a*factorial_par(a-3)



Tambien podemos definir la descripcion aparte usando una nomenclatura concreta. 
En realidad , la libreria ollama-python que usamos, contruye internamente una descripcion parecida a partir de las funciones que hemos definido. 
Pero si queremos tener un control más preciso podemos hacerlo nosotros.

Un json del siguiente tipo:


In [None]:

# Ejemplo de definicion de la funcion  mocopo_two_numbers
mocopo_two_numbers_tool = {
  'type': 'function',
  'function': {
    'name': 'mocopo_two_numbers',
    'description': 'mocopo de dos numeros. Es el nombre que hemos inventado para una operacion compleja entre dos numeros',
    'parameters': {
      'type': 'object',
      'required': ['a', 'b'],
      'properties': {
        'a': {'type': 'integer', 'description': 'El primer numero'},
        'b': {'type': 'integer', 'description': 'el segundo numero'},
      },
    },
  },
}


In [None]:
  

# diccionario con las funcionciones disponibles

funciones_disponibles = {
  'temperaturaCiudad': temperaturaCiudad,
  'mocopo_two_numbers': mocopo_two_numbers,
  'factorial_par':factorial_par
}


def ComplexChatTool ( pregunta):
  # iniciamos la lista de mensajes con la pregunta hecha por el usuario.  
  messages = [{'role': 'user', 'content': pregunta}]   
  log ("pregunta ",messages)

  # entramos en un bucle del que se sale cuando tenemos la respuesta final  
  count = 0
  while count < 9:
    count+=1
    # ejecutamos el chat diciendole que tiene varias herramientas tools disponibles por si las necesita.  
    response: ChatResponse = client.chat(
          model=modelo,
          messages=messages,
          tools=[mocopo_two_numbers,temperaturaCiudad,factorial_par]
    )
    # log ('response: ',count,response)
    
    # aqui esta el quid principal. En la respuesta del modelo puede hacer una llamada a alguna tool      
    # si es asi, ejecutamos las llamadas a esas funciones, añadimos la respuesta a la lista de mensajes
    # y volvemos a llamar al chat pasandole la respuesta que necesita. Esto se podria repetir varias veces mientras el modelo necesite más información.
    if response.message.tool_calls:  
      log ("ciclo ",count)  
      log (response.message.tool_calls)
      messages.append(response.message)
      for tool in response.message.tool_calls:    

        function_to_call = funciones_disponibles.get(tool.function.name)
        if function_to_call :
          log('Función:', tool.function.name, 'argumentos:', tool.function.arguments)
          output = function_to_call(**tool.function.arguments)
          log('Function output:', output)
          messages.append({'role': 'tool', 'content': str(output), 'tool_name': tool.function.name})  
        else:
          print('Function', tool.function.name, 'no encontrada')
    
    else:
      # Cuando ya no hay llamadas a tools ya tenemos la respuesta final
      #if count<=1: print('No he usado tool calls')
      return  response.message.content



def ComplexChat ( pregunta):
    resulta=ComplexChatTool (pregunta)
    print (resulta)
    print ('------')
   




In [None]:
def EjemploComplex1():
    ComplexChat ("donde estan teruel , cuenca y paris")

def EjemploComplex2():
    ComplexChat ("Temperatura de hoy en Teruel y cuanto es el mocopo de 9 y 11")

def EjemploComplex3():
    ComplexChat ("habitantes y temperatura de hoy en Teruel y cuanto es el FactorialPar de 7")


EjemploComplex1()
EjemploComplex2()
EjemploComplex3()    
# EjemploComplex4()    
    

In [None]:


def EjemploComplex5():
    ComplexChat ("Calcula cuanto es el mocopo de 6 y 3. cuando tengas el resultado de la operacion,  calcula el FactorialPar del primer resultado")

def EjemploComplex6():
    ComplexChat ("calcula x =  mocopo de 5 y 3. cuando estes seguro del resultado x, calcula el FactorialPar de x")

EjemploComplex5()    
EjemploComplex6()    



In [None]:

def EjemploComplex7():
    ComplexChat (
        '''t = temperatura en teruel , c= temperatura de cuenca. cuando estes seguro de t y c, calcula x =mocopo de t y c.
            Al final, Cuando tengas el resultado x, calcula el FactorialPar de x
        ''' )

EjemploComplex7()


![image.png](mocopologo.png)

### Felicidades!
Si has entendido como funcionan las tools en ollama, ya entiendes como funciona el MCP.
* La diferencia es que MCP es un estandar para todos los modelos 
* En vez de tener que crear agentes especiales para cada modelo, creamos solo uno que sirve para todos.
* Ademas, solo tenemos que programar las funciones a publicar, no todo el protocolo de comunicacion, ya que es estandar.





# MCP

La segunda parte es ver un ejemplo de servicio MCP.

Un servicio (o servidor) MCP es un programa que "publica" una lista de herramientas y recursos, que pueden ser usados por un Agente MCP, en combinacion de un modelo LLM.

En nuestro ejemplo vamos a publicar las funciones  temperaturaCiudad, mocopo_two_numbers y factorial_par
Usaremos Claude desktop como agente, y veremos como conectar Claude con nuestras herramientas.



Hay 2 formas habituales de hacer la conexion entre el agente  y nuestro servicio MCP

### A traves de http. 
El servicio MCP es muy parecido a un servidor REST tradicional. El servidor atiende a unos comandos concretos estandar MCP, devolviendo informacion en una forma estandar tambien.


### Por consola
Otra forma es a traves de la linea de comandos. El servidor MCP seria un programa de consola sencillo que comienza esperando que se escriba un texto. Comprueba si el texto es algun comando estandar MCP y si lo es, devuelve el resultado escribiendolo en la consola. Haria lo mismo que hace un servicio http, pero a través de texto en consola en vez de a traves de la red.

* La ventaja del primero es que to puedes usar desde otros ordenadores, y el de consola no.
* La aventaja de a traves de consola es que puede ser mas rapido de desarrollo o mas fácil de depurar
* Los detalles y comandos concretos del protocolo estan especificados en
https://modelcontextprotocol.io/docs/getting-started/intro

### Problema Claude Evaluación

La version gratuida de Claude Desktop, tiene una limitación en cuanto a que MCP puedes conectar.
En concreto no pudes conectar servicios MCP a traves de http, solo puedes conectar versiones consola.
* Hay formas de saltarse esa limitación usando una especie de proxy que atienda a la linea de comandos , y que conecte con el servidor http que queramos. Pero eso ya son cosas de la tercera parte del curso.


## fastmcp
Afortunadamente no tenemos que conocer todos los detalles del protocolo MCP.
Hay una libreria que nos simplifica todo.
* fastmcp : https://github.com/jlowin/fastmcp

Adjuntamos un ejemplo en https://./MoCoPoFast1.py


Para hacer pruebas de un servidor MCP se puede usar

https://modelcontextprotocol.io/legacy/tools/debugging


Para usarlo, primero tienes que tener instalado node.js https://nodejs.org/es
Vale la pena tener instalado nodejs porque abre la puerta a muchos proyectos abiertos,  entornos web, o leguajes como typeScript





