# Tutorial de llamaindex

Iniciando con los tutoriales de [llamaindex](https://docs.llamaindex.ai/en/stable/getting_started/starter_example_local/)

In [None]:
!pip install llama-index

In [3]:
!pip install ollama

Collecting ollama
  Using cached ollama-0.4.7-py3-none-any.whl.metadata (4.7 kB)
Using cached ollama-0.4.7-py3-none-any.whl (13 kB)
Installing collected packages: ollama
Successfully installed ollama-0.4.7


In [10]:
!ollama list

NAME                      ID              SIZE      MODIFIED       
nemotron-mini:latest      ed76ab18784f    2.7 GB    13 minutes ago    
qwen2.5-coder:7b          2b0496514337    4.7 GB    17 minutes ago    
qwen2.5:7b                845dbda0ea48    4.7 GB    21 minutes ago    
mistral:latest            f974a74358d6    4.1 GB    24 minutes ago    
granite3-dense:8b         199456d876ee    4.9 GB    31 minutes ago    
phi4-mini:latest          78fad5d182a7    2.5 GB    21 hours ago      
gemma3:latest             c0494fe00251    3.3 GB    4 days ago        
gemma3:4b                 c0494fe00251    3.3 GB    7 days ago        
deepseek-r1:7b            0a8c26691023    4.7 GB    8 days ago        
dolphin-mistral:latest    5dc8c5a2be65    4.1 GB    8 days ago        


In [8]:
!pip install llama-index --upgrade



In [9]:
!pip install llama-index-llms-ollama

Collecting llama-index-llms-ollama
  Using cached llama_index_llms_ollama-0.5.3-py3-none-any.whl.metadata (3.8 kB)
Using cached llama_index_llms_ollama-0.5.3-py3-none-any.whl (7.8 kB)
Installing collected packages: llama-index-llms-ollama
Successfully installed llama-index-llms-ollama-0.5.3


En entornos de jupyter notebooks ya tiene un loop de eventos corriendo.
Esto significa que hay un loop de `asyncio` activo y se reemplaza

```python

# Run the agent
if __name__ == "__main__":
    asyncio.run(main())
```

Por:
```python
nest_asyncio.apply()  # Permite reusar el loop ya corriendo

await main()
```

In [9]:
import asyncio
import nest_asyncio
from llama_index.core.agent.workflow import FunctionAgent
from llama_index.llms.ollama import Ollama

Ollama levanta un servidor local (por defecto en http://localhost:11434) y expone una API que llama_index.llms.ollama usa para enviar los prompts.

No se usa ningún modelo en la nube ni se conecta a Internet, todo sucede de forma local, lo cual es genial para privacidad y velocidad (siempre que tengas RAM y VRAM).

In [2]:
# Prueba de que esté disponible el modelo
llm = Ollama(model="nemotron-mini:latest")
print(llm.complete("¿Cuál es la capital de Francia?").text)

 La capital de Francia es París.


# Function Agent example

No sigue la la arquitectura de Workflow (por tanto no es compatible con Context), ya que es una forma más simplificada.

In [8]:
nest_asyncio.apply()

# Define a una simple calculadora
def multiply(a: float, b: float) -> float:
    """Útil para multiplicar dos números."""
    return a * b


# Crea un flujo de trabajo del agente con la herramienta calculadora
agent = FunctionAgent(
    name="Agent",
    description="Útil para multiplicar dos números",
    tools=[multiply],
    llm=Ollama(model="nemotron-mini:latest", request_timeout=360.0),
    system_prompt="Tu eres un servicial asistente que puede multiplicar dos números.",
)


async def main():
    # Run the agent
    response = await agent.run("¿Cuánto es 1234 * 4567?")
    print(str(response))


# Ejecuta la función principal
await main()

 El resultado es 5635678.
