# Part 1: Conceptes Fonamentals d'Agents d'IA amb CrewAI
## JCM Technologies - Departament de R+D

<table style="margin: 0; text-align: left; width:100%; border: 2px solid #2e86ab;">
    <tr>
        <td style="width: 150px; vertical-align: middle; padding: 20px;">
            <img src="https://raw.githubusercontent.com/googlefonts/noto-emoji/main/png/128/emoji_u1f9e0.png" width="120" style="display: block;" />
        </td>
        <td style="padding: 20px;">
            <h2 style="color:#2e86ab; margin: 0;">Objectius d'aprenentatge</h2>
            <ul style="color:#333; margin-top: 10px;">
                <li>Entendre la difer√®ncia entre <strong>workflows</strong> i <strong>agents</strong></li>
                <li>Con√®ixer les diferents <strong>capes de frameworks</strong> per agents d'IA</li>
                <li>Crear el teu primer <strong>Crew</strong> amb CrewAI i Google Gemini</li>
                <li>Aplicar-ho a un cas real: analitzar un BOM (Bill of Materials)</li>
            </ul>
            <p style="color:#ff7800; margin: 10px 0 0 0;"><strong>Durada estimada:</strong> 50-60 minuts</p>
        </td>
    </tr>
</table>

---
## üìö Continguts

1. **Recordatori r√†pid:** Qu√® s√≥n els LLMs? (5 min)
2. **Costos i models:** Google Gemini (5 min)
3. **Frameworks d'agents:** De baix a alt nivell (5 min)
4. **Workflows vs Agents:** La difer√®ncia clau (15 min)
5. **Mans a l'obra:** El teu primer Crew (15 min)
6. **Cas pr√†ctic:** Crew analitzador de BOM (15 min)

---
## 1. Recordatori R√†pid: Qu√® s√≥n els LLMs?

Ja coneixes ChatGPT i Copilot, aix√≠ que aquest ser√† r√†pid. Per√≤ anem a repassar els conceptes b√†sics perqu√® s√≥n la base dels agents.

### 1.1 Els components b√†sics

Un **Large Language Model (LLM)** √©s, essencialment:

```
Input (prompt) ‚Üí [Model] ‚Üí Output (resposta)
```

**Conceptes que ja coneixes:**
- **Prompt:** Les instruccions que dones al model
- **Tokens:** Les unitats que el model processa (aproximadament 4 car√†cters per token)
- **Temperature:** Controla la "creativitat" (0 = determinista, 1 = creatiu)
- **Context window:** Quanta informaci√≥ pot "recordar" el model

**El que potser no saps:** Quan cridem un LLM program√†ticament, no estem parlant amb ChatGPT o Gemini directament. Estem cridant una **API** que ens d√≥na acc√©s al model.

### 1.2 Exemple r√†pid amb l'API de Google Gemini

Vegem com es fa una crida b√†sica a l'API de Google:

In [None]:
import os
from dotenv import load_dotenv
from google import genai
from google.genai import types

load_dotenv()

# Configurar client amb API key
client = genai.Client(api_key=os.getenv("GOOGLE_API_KEY"))

print("üìã Models Gemini disponibles amb la teva API Key:\n")
print("=" * 70)

try:
    # Llistar tots els models
    models = client.models.list()
    
    found_models = False
    
    for model in models:
        # El nou SDK retorna objectes diferents
        model_name = model.name
        
        # Mostrar informaci√≥ del model
        print(f"\n‚úÖ {model_name}")
        
        if hasattr(model, 'display_name'):
            print(f"   Display Name: {model.display_name}")
        
        if hasattr(model, 'description'):
            print(f"   Description: {model.description}")
        
        # Nom per usar amb CrewAI (eliminar prefix "models/")
        clean_name = model_name.replace("models/", "")
        print(f"   üîß Usar amb CrewAI: gemini/{clean_name}")
        print("-" * 70)
        
        found_models = True
    
    if not found_models:
        print("‚ö†Ô∏è  No s'han trobat models")
        print("   Pot ser que l'API Key no tingui permisos")
    
except Exception as e:
    print(f"‚ùå Error llistant models: {e}")
    print(f"\nüí° Verifica que la teva API Key √©s correcta:")
    api_key = os.getenv("GOOGLE_API_KEY")
    if api_key:
        print(f"   API Key: ...{api_key[-4:]}")
    else:
        print("   API Key: NO TROBADA al .env")
    
    print("\nüîç Detalls de l'error:")
    import traceback
    traceback.print_exc()

In [None]:
# Una crida b√†sica a l'API
response = client.models.generate_content(
    model='gemini-2.5-flash',
    contents='Explica\'m en una frase qu√® √©s un d√≠ode.'
)

print(response.text)

**Aix√≤ √©s programaci√≥ amb LLMs tradicional.** Per√≤... **aix√≤ NO √©s un agent encara!**

Ara veurem per qu√®.

---
## 2. Costos i Rendiment dels Models

Una decisi√≥ t√®cnica important quan treballem amb agents √©s **quin model utilitzar**. No tots els models s√≥n iguals!

### 2.1 Per qu√® importa el cost?

Cada crida a l'API t√© un cost. Si el teu agent fa:
- 100 crides al dia ‚Üí Cost diari
- 1,000 crides al dia ‚Üí Cost considerable
- 10,000 crides al dia ‚Üí Has de vigilar molt el model!

**Missatge clau:** No sempre necessites el model m√©s potent. Sovint un model m√©s petit i r√†pid √©s millor!

### 2.2 Comparativa de Models Google Gemini (gener 2025)

| Model | Input ($/1M tokens) | Output ($/1M tokens) | Millor per a... |
|-------|---------------------|----------------------|------------------|
| **gemini-2.5-flash** | $0.075 | $0.30 | Tasques r√†pides, alt volum, excel¬∑lent qualitat |
| **gemini-2.5-pro** | $1.25 | $5.00 | Tasques complexes, raonament avan√ßat |
| **gemini-2.0-flash-exp** | GRATIS | GRATIS | Experimentaci√≥ (l√≠mits d'√∫s) |
| **gemini-1.5-flash** | $0.075 | $0.30 | Versi√≥ anterior, encara v√†lida |
| **gemini-1.5-pro** | $1.25 | $5.00 | Versi√≥ anterior del Pro |

**Exemple pr√†ctic:**
- Analitzar un BOM de 500 tokens amb Gemini 2.5 Flash: ~$0.00015 (gaireb√© gratis!)
- La mateixa tasca amb Gemini 2.5 Pro: ~$0.0025 (17x m√©s car)
- Si fas 10,000 an√†lisis/mes: $1.50 vs $25

**üìç Preus actualitzats:** https://ai.google.dev/pricing

### 2.3 Comparativa: Gemini vs OpenAI vs Anthropic

| Prove√Ødor | Model econ√≤mic | Input | Output | Qualitat |
|-----------|----------------|--------|--------|----------|
| **Google** | Gemini 2.5 Flash | $0.075 | $0.30 | ‚≠ê‚≠ê‚≠ê‚≠ê |
| **OpenAI** | GPT-4o-mini | $0.15 | $0.60 | ‚≠ê‚≠ê‚≠ê‚≠ê |
| **Anthropic** | Claude Haiku 4 | $0.25 | $1.25 | ‚≠ê‚≠ê‚≠ê‚≠ê |

| Prove√Ødor | Model premium | Input | Output | Qualitat |
|-----------|---------------|--------|--------|----------|
| **Google** | Gemini 2.5 Pro | $1.25 | $5.00 | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê |
| **OpenAI** | GPT-4o | $2.50 | $10.00 | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê |
| **Anthropic** | Claude Sonnet 4.5 | $3.00 | $15.00 | ‚≠ê‚≠ê‚≠ê‚≠ê‚≠ê |

**Avantatge de Gemini:** Els models m√©s econ√≤mics del mercat amb excel¬∑lent qualitat!

**Recursos per comparar:**
- **Artificial Analysis:** https://artificialanalysis.ai/ (cost vs qualitat vs velocitat)

Si busqueu, hi ha moltes comparatives per internet.

### 2.4 Regla d'or per escollir model

1. **Comen√ßa sempre amb Gemini 2.5 Flash**  
   √âs r√†pid, molt barat, i excel¬∑lent qualitat

2. **Puja a Gemini 2.5 Pro nom√©s si:**
   - La qualitat de Flash no √©s suficient
   - La tasca √©s realment complexa
   - El cost no √©s un problema

3. **Usa Gemini 2.0 Flash Experimental per:**
   - Proves i desenvolupament (GRATIS!)
   - Prototips inicials
   - Verificar que la soluci√≥ funciona abans de gastar diners

**Per al nostre projecte d'escandalls:** Gemini 2.5 Flash ser√† perfecte per a la majoria de tasques!

üí° **Consell pr√†ctic:** Fes sempre A/B testing. Prova la teva tasca amb diferents models i mesura:
- Qualitat del resultat
- Temps de resposta  
- Cost

Despr√©s decideix quin √©s el millor equilibri per al teu cas d'√∫s.

---
## 3. Frameworks d'Agents: De Baix a Alt Nivell

Abans d'entrar en agents, √©s important entendre que hi ha **diferents maneres de treballar amb LLMs**, cada una amb el seu nivell d'abstracci√≥.

### 3.1 Les capes de frameworks d'agents

Imagina una pir√†mide amb diferents capes:

<p align="center">
  <img src="diagrams/ai_stack_architecture.png" width="350">
  <br>
  <em>Stack tecnol√≤gic d‚Äôaplicacions basades en agents i LLMs</em>
</p>

**A mesura que puges:**
- ‚úÖ M√©s abstracci√≥ (menys codi repetitiu)
- ‚úÖ M√©s f√†cil d'usar
- ‚úÖ M√©s funcionalitats predefinides
- ‚ö†Ô∏è Menys control sobre els detalls
- ‚ö†Ô∏è Menys flexibilitat

### 3.2 Descripci√≥ de cada capa

#### üîπ Capa 1: APIs REST
**Qu√® √©s:** Crides HTTP directes a l'API del prove√Ødor

**Exemple:**
```python
import requests
response = requests.post(
    'https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:generateContent',
    headers={'Authorization': f'Bearer {API_KEY}'},
    json={'contents': [{'parts': [{'text': 'Hello'}]}]}
)
```

**Quan usar:**
- ‚úÖ Control total sobre les crides
- ‚úÖ No depens de llibreries de tercers
- ‚ùå Molt codi repetitiu
- ‚ùå Gesti√≥ manual d'errors, retries, etc.

---

#### üîπ Capa 2: SDKs de Prove√Ødors
**Qu√® √©s:** Llibreries oficials dels prove√Ødors que simplifiquen les crides

**Exemples:**
- `google-genai` (Google)
- `openai` (OpenAI)
- `anthropic` (Anthropic)

**Codi:**
```python
from google import genai
client = genai.Client(api_key=API_KEY)
response = client.models.generate_content(
    model='gemini-2.5-flash',
    contents='Hello'
)
```

**Quan usar:**
- ‚úÖ M√©s simple que crides REST
- ‚úÖ Gesti√≥ autom√†tica d'errors
- ‚úÖ Millor documentaci√≥
- ‚ùå Lligat a un prove√Ødor espec√≠fic
- ‚ùå Encara necessites gestionar molt manualment

---

#### üîπ Capa 3: Frameworks de Workflows
**Qu√® √©s:** Frameworks per construir cadenes i grafs de LLMs

**Exemples:**
- **LangChain** - Cadenes de LLMs, templates, mem√≤ria
- **LangGraph** - Grafs amb nodes i transicions
- **LlamaIndex** - Enfocada en RAG i indexaci√≥

**Caracter√≠stiques:**
- ‚úÖ Multi-prove√Ødor (OpenAI, Google, Anthropic...)
- ‚úÖ Components reutilitzables (chains, retrievers, etc.)
- ‚úÖ Ecosistema gran de plugins
- ‚ö†Ô∏è Corba d'aprenentatge mitjana
- ‚ö†Ô∏è Molt flexible per√≤ pot ser complex

**Quan usar:**
- Necessites workflows complexos amb branching
- Vols mantenir la flexibilitat de canviar de prove√Ødor
- Treballes amb RAG (Retrieval Augmented Generation)

---

#### üîπ Capa 4: Frameworks d'Agents
**Qu√® √©s:** Frameworks especialitzats en crear **equips d'agents** aut√≤noms

**Exemples:**
- **CrewAI** ‚Üê **El que utilitzarem!**
- **AutoGen** (Microsoft)
- **Agency Swarm**

**Caracter√≠stiques:**
- ‚úÖ Abstracci√≥ d'alt nivell (menys codi)
- ‚úÖ Conceptes d'agents, roles, tasques predefinits
- ‚úÖ Col¬∑laboraci√≥ entre agents autom√†tica
- ‚úÖ Multi-prove√Ødor (funciona amb qualsevol LLM)
- ‚ö†Ô∏è Menys control sobre detalls baixos
- ‚ö†Ô∏è Opinat (et for√ßa a fer les coses d'una manera)

**Quan usar:**
- Vols crear equips d'agents r√†pidament
- La teva tasca es pot dividir en roles clars
- Prefereixes menys codi i m√©s productivitat

---

#### üîπ Capa 5: No-Code / Low-Code
**Qu√® √©s:** Plataformes visuals per crear workflows i agents **sense programar** (o amb programaci√≥ m√≠nima)

**Categoria A: Plataformes d'automatitzaci√≥ generals**
- **n8n** - Workflows visuals amb nodes, integraci√≥ amb 400+ serveis
- **Zapier** - Automatitzacions simples entre apps ("si aix√≤, aleshores all√≤")
- **Make (Integromat)** - Similar a Zapier per√≤ m√©s visual i potent

**Categoria B: Eines visuals espec√≠fiques per LLMs**
- **Flowise** - UI visual per LangChain (crear flows arrossegant nodes)
- **LangFlow** - Altra UI visual per LangChain amb m√©s features
- **Dify** - Plataforma completa no-code per apps d'IA
- **LangGraph Studio** - UI oficial de LangGraph per crear grafs visuals
- **CrewAI Studio** - UI per CrewAI

**Exemple visual (n8n):**
```
[Trigger: Email rebut] ‚Üí [Node: Gemini analitza] ‚Üí [Decision: Urgent?]
                                                          |
                                                    S√≠ ‚Üí [Slack notifica]
                                                    No ‚Üí [Google Sheets guarda]
```

**Caracter√≠stiques:**
- ‚úÖ Zero programaci√≥ (o m√≠nima)
- ‚úÖ Interface visual (drag & drop)
- ‚úÖ Perfecte per prototips r√†pids
- ‚úÖ Accessible per no-programadors
- ‚ö†Ô∏è Limitat per el que ofereix la plataforma
- ‚ö†Ô∏è Dif√≠cil de versionar i debugar en producci√≥
- ‚ö†Ô∏è Pot ser car a escala (pricing per execucions)

**Quan usar:**
- Prototips r√†pids per validar idees
- Automatitzacions senzilles internes
- Proves de concepte abans de programar
- Equips sense programadors que necessiten automatitzar

**‚ö†Ô∏è Limitacions per producci√≥:**
- Menys control sobre logs i traces
- Dificultat per integrar amb CI/CD
- Vendor lock-in (quedar lligat a la plataforma)
- Escalabilitat limitada

### 3.3 Per qu√® hem escollit CrewAI?

Per a aquesta formaci√≥ hem escollit **CrewAI** (capa 4) per diverses raons:

**‚úÖ Avantatges per la formaci√≥:**
1. **Alt nivell d'abstracci√≥** - Menys codi per aprendre conceptes d'agents
2. **Multi-prove√Ødor** - Podeu usar Google Gemini, OpenAI, o qualsevol altre
3. **Conceptes clars** - Agents, Roles, Tasks, Crews s√≥n f√†cils d'entendre
4. **Productiu** - Podeu crear sistemes complexos r√†pidament
5. **Comunitat activa** - Molt suport i exemples

**‚ö†Ô∏è Desavantatges (per ser honest):**
1. **Menys control** - Algunes decisions les pren CrewAI per tu
2. **Opinat** - Has de seguir la filosofia de Crew/Agent/Task
3. **Debugging** - M√©s dif√≠cil veure exactament qu√® passa per sota

**üéØ Per al nostre cas d'√∫s (valoraci√≥ d'escandalls):**
- Tenim rols clars: Analitzador BOM ‚Üí Buscador de preus ‚Üí Comparador ‚Üí Generador d'informes
- Volem productivitat: Crear el sistema r√†pidament
- Volem flexibilitat de prove√Ødor: Podeu canviar de Gemini a GPT si cal

**CrewAI √©s perfecte per aix√≤!** üéØ

### 3.4 Taula comparativa per decidir

| Si necessites... | Usa... |
|------------------|--------|
| Control total sobre cada byte | APIs REST |
| Crides simples a un LLM | SDK del prove√Ødor |
| Workflows complexos amb branching | LangGraph |
| RAG i cerca vectorial | LlamaIndex |
| Equips d'agents col¬∑laborant | **CrewAI** ‚Üê Nosaltres! |
| Converses multi-agent complexes | AutoGen |

**üí° Consell:** Comen√ßa amb l'eina m√©s simple que resolgui el teu problema. Sempre pots baixar de nivell si necessites m√©s control!

## 4. Workflows vs Agents: La Difer√®ncia Clau

Aquesta √©s la secci√≥ m√©s important conceptualment. Entendre aquesta difer√®ncia canviar√† com penses sobre IA.

### 4.1 Qu√® √©s un Workflow?

Un **workflow** (o patr√≥ ag√®ntic) √©s una **seq√º√®ncia predefinida** de crides a LLMs.

Tu, com a programador, decideixes:
- Quins LLMs es criden
- En quin ordre
- Amb quines condicions

**Exemples de workflows:**

#### üîó 1. Prompt Chaining

**Descompondre una tasca en sub-tasques fixes**

<p align="center">
  <img src="diagrams/prompt_chaining.png" width="450">
  <br>
  <em>Exemple de prompt chaining</em>
</p>

**Exemple:** 
1. LLM1 genera una pregunta t√®cnica sobre un component
2. Gate decideix si la pregunta √©s v√†lida
3. LLM2 respon la pregunta t√®cnica
4. LLM3 valida que la resposta sigui correcta

**Caracter√≠stiques:**
- ‚úÖ Seq√º√®ncia lineal i predictible
- ‚úÖ F√†cil de debugar
- ‚ùå No s'adapta a situacions noves

**Analogia JCM:** Com una cadena de muntatge - cada estaci√≥ fa sempre el mateix.

#### üîÄ 2. Routing

**Dirigir l'input a un LLM especialitzat**
<p align="center">
  <img src="diagrams/llm_router_experts.png" width="550">
  <br>
  <em>Selecci√≥ d‚ÄôLLMs experts per domini mitjan√ßant un router</em>
</p>

**Exemple:**
- Router classifica la consulta (component electr√≤nic, pe√ßa mec√†nica, software)
- Envia a l'LLM expert corresponent

**Caracter√≠stiques:**
- ‚úÖ Separaci√≥ de concerns
- ‚úÖ LLMs especialitzats per domini
- ‚ùå Les rutes s√≥n fixes (no pot crear rutes noves)

**Analogia JCM:** Com distribuir queries de suport a diferents departaments.

#### ‚ö° 3. Parallelization

**Executar m√∫ltiples sub-tasques simult√†niament**
<p align="center">
  <img src="diagrams/coordinator_flow_diagram.png" width="550">
  <br>
  <em>Selecci√≥ d‚ÄôLLMs experts per domini mitjan√ßant un router</em>
</p>

**Exemple BOM:**
- Analitzar un component des de 3 perspectives diferents en paral¬∑lel
- Agregar els resultats en un informe complet

**Caracter√≠stiques:**
- ‚úÖ M√©s r√†pid (paral¬∑lel)
- ‚úÖ Perspectives m√∫ltiples
- ‚ùå Complexitat en l'agregaci√≥

**Analogia JCM:** Com fer que 3 enginyers treballin en el mateix disseny simult√†niament.

#### üé≠ 4. Orchestrator-Worker

**Tasques complexes descompostes din√†micament**

<p align="center">
  <img src="diagrams/orchestrator_diagram.png" width="500">
  <br>
  <em>Selecci√≥ d‚ÄôLLMs experts per domini mitjan√ßant un router</em>
</p>

**Exemple:**
- Orchestrator decideix quines parts d'un BOM analitzar
- Workers executen les an√†lisis en paral¬∑lel
- Synthesizer combina els resultats

**Caracter√≠stiques:**
- ‚úÖ Descomposici√≥ din√†mica de tasques
- ‚úÖ Escalable
- ‚ùå Encara √©s un workflow (flux predeterminat)

#### üîÑ 5. Evaluator-Optimizer

**Validar i millorar iterativament**

<p align="center">
  <img src="diagrams/evaluator_diagram.png" width="350">
  <br>
  <em>Bucle de generaci√≥ i avaluaci√≥ amb feedback en cas de rebuig</em>
</p>

**Exemple:**
- Generator crea una llista de components alternatius
- Evaluator valida que compleixin especificacions
- Si no, torna a generar amb feedback

**Caracter√≠stiques:**
- ‚úÖ Auto-millora
- ‚úÖ Control de qualitat
- ‚ùå Pot ser lent (m√∫ltiples iteracions)

**Analogia JCM:** Com el proc√©s de revisi√≥ de disseny fins que passa QA.

### 4.2 Aleshores... qu√® √©s un Agent?

Un **agent** √©s fonamentalment diferent. 

_"An AI agent is a system that takes a goal, makes decisions, and acts to move work forward."_

√âs a dir, l'agent:
- **Percep l'entorn** (llegeix informaci√≥ disponible)
- **Pren decisions aut√≤nomes** sobre qu√® fer
- **Actua** (executa accions, crida tools)
- **Rep feedback** de l'entorn
- **Itera** fins assolir l'objectiu o decidir parar

**Esquema d'un agent:**

<p align="center">
  <img src="diagrams/human_llm_agent_environment.png" width="350">
  <br>
  <em>Bucle d‚Äôinteracci√≥ entre una persona, un agent LLM i l‚Äôentorn</em>
</p>

**L'agent decideix:**
- Quina acci√≥ fer (de les disponibles)
- Quan parar o continuar
- Com interpretar el feedback
- Com adaptar l'estrat√®gia

**Caracter√≠stiques clau:**
- ‚úÖ Pren decisions aut√≤nomes
- ‚úÖ S'adapta segons el feedback
- ‚úÖ Pot usar eines (tools) per interactuar amb l'entorn
- ‚úÖ Apr√®n de l'experi√®ncia (dins d'una execuci√≥)
- ‚ö†Ô∏è M√©s dif√≠cil de controlar
- ‚ö†Ô∏è Pot ser impredictible

### 4.3 Comparaci√≥ directa

| Aspecte | Workflow | Agent |
|---------|----------|-------|
| **Control** | Tu decideixes el flux | L'agent decideix |
| **Adaptabilitat** | Flux fix predefinit | S'adapta din√†micament |
| **Predictibilitat** | Molt predictible | Menys predictible |
| **Complexitat** | M√©s simple | M√©s complex |
| **Autonomia** | Zero autonomia | Alta autonomia |
| **Cas d'√∫s** | Processos coneguts | Situacions obertes |
| **Debugging** | F√†cil (flux fix) | Dif√≠cil (decisions din√†miques) |
| **Cost** | Predictible | Variable segons decisions |

**Regla d'or:**
- Si **saps exactament** els passos ‚Üí Workflow
- Si l'agent ha de **decidir** qu√® fer ‚Üí Agent

### üí° Reflexi√≥

Pensa en el cas d'√∫s de valoraci√≥ d'escandalls que farem m√©s endavant:

**Escenari:**
1. Reps un BOM amb 50 components
2. Has de buscar preus a diversos prove√Ødors
3. Algunes peces poden no estar disponibles
4. Potser cal buscar alternatives
5. Generar un informe final

**Pregunta:** Creus que hauria de ser un workflow o un agent? Per qu√®?

**Pista:** Pensa en:
- S√≥n els passos sempre els mateixos?
- Pot haver-hi situacions inesperades?
- Cal prendre decisions segons el que es trobi?

*Pensar√†s en la resposta quan arribem al cas pr√†ctic...*

---
## 5. Mans a l'Obra: El Teu Primer Crew amb CrewAI

Ara que entens la teoria, anem a crear el nostre primer **Crew** amb CrewAI i Google Gemini.

### 5.1 Conceptes b√†sics de CrewAI

CrewAI organitza els agents en una met√†fora d'**equip de treball**:

**üé≠ Agent:**
- Un membre de l'equip amb un **rol** espec√≠fic
- T√© un **objectiu** (goal)
- T√© un **backstory** que defineix la seva expertesa
- Pot tenir **tools** per executar accions

**üìã Task:**
- Una tasca concreta a realitzar
- Assignada a un agent espec√≠fic
- T√© una **descripci√≥** clara
- T√© un **resultat esperat** (expected_output)

**üë• Crew:**
- L'equip complet
- Agrupa agents i tasques
- Defineix com col¬∑laboren (process)
- Executa el workflow

**Analogia JCM:**
- **Crew** = Departament de R+D
- **Agents** = Enginyers amb especialitats diferents
- **Tasks** = Projectes assignats a cada enginyer

### 5.2 El nostre primer crew: Analitzador T√®cnic

Crearem un crew super simple: **1 agent, 1 task**.

**Objectiu:** Respondre preguntes t√®cniques sobre components electr√≤nics.

In [None]:
# Imports necessaris
from crewai import Agent, Task, Crew
from dotenv import load_dotenv
import os

# Carregar API key
load_dotenv(override=True)

print("‚úÖ CrewAI importat correctament!")

#### Pas 1: Crear l'Agent

In [None]:
# Definir l'agent
agent_tecnic = Agent(
    role="Enginyer Electr√≤nic Senior",
    goal="Proporcionar informaci√≥ t√®cnica precisa sobre components electr√≤nics",
    backstory="""
    Ets un enginyer electr√≤nic amb 15 anys d'experi√®ncia a JCM Technologies.
    Has treballat en disseny de circuits de control per a portes autom√†tiques
    i tens un coneixement profund de components com rel√©s, sensors i actuadors.
    
    La teva especialitat √©s explicar conceptes t√®cnics de manera clara i precisa,
    sempre amb exemples pr√†ctics del m√≥n real.
    """,
    llm="gemini/gemini-2.5-flash",  # Model de Google Gemini
    verbose=True  # Per veure qu√® fa l'agent
)

print("‚úÖ Agent 'Enginyer Electr√≤nic Senior' creat!")

**üí° Nota sobre el model:**

CrewAI usa el format `prove√Ødor/model` per especificar models:
- `gemini/gemini-2.5-flash` ‚Üí Google Gemini
- `openai/gpt-4o-mini` ‚Üí OpenAI
- `anthropic/claude-sonnet-4.5` ‚Üí Anthropic

Aix√≤ fa CrewAI **multi-prove√Ødor**! Pots canviar de model canviant una l√≠nia.

#### Pas 2: Crear la Task

In [None]:
# Definir la tasca
task_explicar = Task(
    description="""
    Explica qu√® √©s un rel√© i per qu√® s'utilitza en sistemes de control
    de portes autom√†tiques.
    
    Inclou:
    - Definici√≥ t√®cnica del component
    - Com funciona internament
    - Avantatges d'utilitzar-lo en aquest context
    - Un exemple pr√†ctic d'aplicaci√≥
    """,
    expected_output="""
    Una explicaci√≥ t√®cnica clara de 3-4 par√†grafs que cobreixi tots els punts,
    escrita de manera professional per√≤ accessible.
    """,
    agent=agent_tecnic  # Assignem la tasca a l'agent
)

print("‚úÖ Task 'Explicar rel√©' creada i assignada!")

#### Pas 3: Crear i executar el Crew

In [None]:
# Crear el crew
crew = Crew(
    agents=[agent_tecnic],
    tasks=[task_explicar],
    verbose=True  # Per veure el proc√©s complet
)

print("‚úÖ Crew creat amb 1 agent i 1 task!")

In [None]:
# Executar el crew!
print("üöÄ Executant el crew...\n")
print("=" * 70)

result = crew.kickoff()

print("=" * 70)
print("\n‚úÖ Crew executat amb √®xit!\n")
print("üìÑ RESULTAT:\n")
print(result)

### 5.3 Qu√® ha passat?

Quan executem `crew.kickoff()`:

1. **CrewAI inicialitza** l'agent amb el seu rol i backstory
2. **Envia la task** a l'agent
3. **L'agent usa Gemini** per generar la resposta
4. **Valida** que la resposta compleixi l'expected_output
5. **Retorna** el resultat final

**üí° Difer√®ncia clau amb un LLM tradicional:**

```python
# LLM tradicional (1 crida)
response = client.models.generate_content("Explica qu√® √©s un rel√©")

# CrewAI Agent (pot fer m√∫ltiples crides si cal)
result = crew.kickoff()  # L'agent decideix quantes crides fer
```

L'agent pot fer **m√∫ltiples iteracions** fins que estigui satisfet amb el resultat!

### 5.4 Provant amb diferents preguntes

Ara modifiquem la task per fer una altra pregunta:

In [None]:
# Nova task amb una pregunta diferent
task_sensors = Task(
    description="""
    Compara les fotoc√®l¬∑ules i les bandes de seguretat
    per a detecci√≥ d'obstacles en portes autom√†tiques.
    
    Inclou:
    - Com funciona cada tipus de sensor
    - Avantatges i desavantatges de cada un
    - En quines situacions √©s millor usar cada tipus
    """,
    expected_output="""
    Una comparativa t√®cnica de 4-5 par√†grafs que ajudi a decidir
    quin sensor utilitzar segons el cas d'√∫s.
    """,
    agent=agent_tecnic
)

# Crear nou crew amb la nova task
crew_sensors = Crew(
    agents=[agent_tecnic],
    tasks=[task_sensors],
    verbose=True
)

# Executar
result_sensors = crew_sensors.kickoff()
print("\nüìÑ RESULTAT:\n")
print(result_sensors)

### üí° Reflexi√≥ Important

**Pregunta:** L'exemple que acabem de crear, √©s realment un "agent" aut√≤nom?

Pensa en:
- L'agent pren decisions?
- Interactua amb l'entorn?
- Utilitza tools?
- S'adapta segons feedback?

**Resposta:** Encara **NO** √©s un agent complet! √âs m√©s aviat un **LLM amb context millorat**.

Per ser un agent real necessita:
- ‚úÖ **Tools** per interactuar amb l'entorn (llegir fitxers, cridar APIs, etc.)
- ‚úÖ **Capacitat de decisi√≥** sobre quina tool usar
- ‚úÖ **Iteraci√≥** basada en els resultats de les tools

**Aix√≤ ho veurem a la Part 2!** Ara anem a aplicar-ho al cas del BOM.

## 6. Cas Pr√†ctic: Crew Analitzador de BOM

Ara aplicarem tot el que hem apr√®s a un cas real: analitzar un Bill of Materials (BOM) utilitzant CrewAI.

### 6.1 Qu√® √©s un BOM?

Un **Bill of Materials** (Escandall) √©s una llista estructurada de tots els components necessaris per fabricar un producte.

**Exemple simplificat:**

| Part Number | Description | Quantity | Unit |
|-------------|-------------|----------|------|
| RES-001 | Resist√®ncia 10kŒ© | 5 | pcs |
| CAP-002 | Condensador 100nF | 3 | pcs |
| LED-003 | LED vermell 5mm | 2 | pcs |
| IC-004 | Microcontrolador ATmega328 | 1 | pcs |

**A JCM Technologies:**
- Cada producte (control de porta, sensor, etc.) t√© el seu BOM
- Cal analitzar-los per: costejat, planificaci√≥, compres, qualitat

### 6.2 Objectiu: Crew que analitza un BOM

Volem un crew que pugui:
1. Llegir un BOM (text o dades estructurades)
2. Identificar els components
3. Agrupar-los per categoria
4. Detectar possibles problemes o inconsist√®ncies
5. **Retornar dades estructurades** (no text lliure!)

El punt 5 √©s clau: volem poder processar el resultat program√†ticament!

### 6.3 BOM simplificat per la demo

In [None]:
# BOM simplificat en format text
bom_simple = """
BILL OF MATERIALS - Control Board v2.1
=======================================

1. RES-10K - Resist√®ncia 10kŒ© 1/4W - Qty: 5
2. RES-1K - Resist√®ncia 1kŒ© 1/4W - Qty: 3  
3. CAP-100N - Condensador cer√†mic 100nF - Qty: 4
4. CAP-10U - Condensador electrol√≠tic 10¬µF - Qty: 2
5. LED-RED - LED vermell 5mm - Qty: 2
6. LED-GREEN - LED verd 5mm - Qty: 1
7. RELAY-5V - Rel√© 5V 10A SPDT - Qty: 3
8. IC-ATMEGA - Microcontrolador ATmega328P - Qty: 1
9. CONN-RJ45 - Connector RJ45 - Qty: 1
10. PCB - Placa de circuit impr√®s - Qty: 1
"""

print(bom_simple)

### 6.4 Definir l'esquema de sortida amb Pydantic

Abans de crear l'agent, definim **exactament** quin format volem a la sortida.

**Per qu√® Pydantic?**
- ‚úÖ Validaci√≥ autom√†tica de tipus
- ‚úÖ Errors clars si les dades s√≥n incorrectes
- ‚úÖ Conversi√≥ f√†cil a dict/JSON
- ‚úÖ Integraci√≥ directa amb CrewAI

In [None]:
from pydantic import BaseModel, Field
from typing import List, Dict

class Component(BaseModel):
    """Un component del BOM"""
    part_number: str = Field(description="Codi identificador del component")
    description: str = Field(description="Descripci√≥ t√®cnica del component")
    quantity: int = Field(description="Quantitat necess√†ria", gt=0)
    category: str = Field(description="Categoria del component (Resist√®ncia, Condensador, etc.)")

class BOMAnalysis(BaseModel):
    """An√†lisi estructurada d'un BOM"""
    product_name: str = Field(description="Nom del producte")
    components: List[Component] = Field(description="Llista de tots els components")
    total_components: int = Field(description="Total de l√≠nies de components")
    categories_summary: Dict[str, int] = Field(description="Resum de components per categoria")
    observations: List[str] = Field(description="Possibles problemes o notes rellevants")

print("‚úÖ Esquemes Pydantic definits!")
print("\nEsquema Component:")
print(Component.model_json_schema())
print("\nEsquema BOMAnalysis:")
print(BOMAnalysis.model_json_schema())

### 6.5 Crear l'Agent Analitzador de BOM

In [None]:
from crewai import Agent, Task, Crew

# Agent especialitzat en analitzar BOMs
agent_bom_analyzer = Agent(
    role="Analitzador de Bills of Materials",
    goal="Analitzar BOMs i extreure informaci√≥ estructurada sobre components electr√≤nics",
    backstory="""
    Ets un especialista en gesti√≥ de BOMs amb 10 anys d'experi√®ncia a JCM Technologies.
    
    La teva expertesa inclou:
    - Identificaci√≥ precisa de components electr√≤nics
    - Classificaci√≥ per categories (resist√®ncies, condensadors, semiconductors, etc.)
    - Detecci√≥ d'inconsist√®ncies o components estranys
    - An√†lisi de consist√®ncia de BOMs
    
    Ets meticul√≥s i sempre proporciones dades estructurades i verificades.
    """,
    llm="gemini/gemini-2.5-flash",
    verbose=True
)

print("‚úÖ Agent Analitzador de BOM creat!")

### 6.6 Crear la Task amb sortida estructurada

Aqu√≠ ve la part important: especifiquem que volem la sortida en format **Pydantic**!

In [None]:
# Task amb sortida estructurada
task_analyze_bom = Task(
    description=f"""
    Analitza el seg√ºent BOM i extreu tota la informaci√≥ de manera estructurada:
    
    {bom_simple}
    
    Per a cada component del BOM, has de:
    1. Extreure el part number exacte
    2. Extreure la descripci√≥ completa
    3. Extreure la quantitat
    4. Classificar-lo en la categoria apropiada:
       - Resist√®ncia
       - Condensador
       - Semiconductor (LED, IC, etc.)
       - Connector
       - Electromec√†nic (rel√©s)
       - PCB
       - Altres
    
    Tamb√© has de:
    - Comptar el total de components diferents (l√≠nies del BOM)
    - Crear un resum de quants components hi ha per cada categoria
    - Identificar possibles observacions (components poc comuns, quantitats estranyes, etc.)
    """,
    expected_output="""
    Un objecte BOMAnalysis amb:
    - Nom del producte identificat
    - Llista completa de components amb tota la informaci√≥
    - Total de components
    - Resum per categories
    - Observacions rellevants
    """,
    agent=agent_bom_analyzer,
    output_pydantic=BOMAnalysis  # ‚Üê Aqu√≠ especifiquem el format Pydantic!
)

print("‚úÖ Task amb sortida estructurada (Pydantic) creada!")

**üí° La clau est√† a `output_pydantic=BOMAnalysis`**

Aix√≤ li diu a CrewAI:
1. Genera l'esquema JSON del model Pydantic
2. Envia'l a Gemini perqu√® s√†piga exactament quin format retornar
3. Valida autom√†ticament que la resposta compleixi l'esquema
4. Retorna un objecte Python (no text!)

### 6.7 Crear i executar el Crew

In [None]:
# Crear el crew
crew_bom = Crew(
    agents=[agent_bom_analyzer],
    tasks=[task_analyze_bom],
    verbose=True
)

print("‚úÖ Crew BOM Analyzer creat!")

### üí° Nota sobre `verbose=True`

Has vist que posem `verbose=True` al crear el crew. Aix√≤ mostra **traces** 
de l'execuci√≥: qu√® pensa l'agent, quines decisions pren, quines crides fa al LLM.

Per ara, nom√©s observa la sortida. A la **Part 2**, quan treballem amb **tools**, 
les traces seran fonamentals per entendre:
- Quina tool ha decidit usar l'agent
- Per qu√® ha pres aquesta decisi√≥  
- Qu√® ha obtingut de cada tool
- Com itera basant-se en els resultats

**Consell:** Mant√©n sempre `verbose=True` durant el desenvolupament. 
√âs la teva millor eina de debugging!

In [None]:
# Executar el crew!
print("üöÄ Analitzant el BOM...\n")
print("=" * 70)

result = crew_bom.kickoff()

print("=" * 70)
print("\n‚úÖ An√†lisi completada!\n")

### 6.8 Processar el resultat estructurat

Ara tenim un **objecte Python validat**, no text! Podem processar-lo directament:

In [None]:
# El resultat √©s un objecte BOMAnalysis!
bom_analysis = result.pydantic

print(f"üì¶ Producte: {bom_analysis.product_name}")
print(f"üìä Total de components: {bom_analysis.total_components}")
print("\nüìÇ Components per categoria:")
for categoria, count in bom_analysis.categories_summary.items():
    print(f"  - {categoria}: {count}")

if bom_analysis.observations:
    print("\nüìù Observacions:")
    for obs in bom_analysis.observations:
        print(f"  ‚Ä¢ {obs}")

### 6.9 Visualitzar els components amb pandas

In [None]:
import pandas as pd

# Convertir components a DataFrame
df_components = pd.DataFrame([c.model_dump() for c in bom_analysis.components])

print("\nüìã Taula de components:\n")
display(df_components)

# Resum per categories
print("\nüìä Resum per categories:\n")
df_categories = pd.DataFrame([
    {"Categoria": cat, "Quantitat de l√≠nies": count} 
    for cat, count in bom_analysis.categories_summary.items()
])
display(df_categories)

### 6.10 Exportar a diferents formats

Com que tenim dades estructurades, podem exportar-les f√†cilment:

In [None]:
# Exportar a JSON
json_output = bom_analysis.model_dump_json(indent=2)
print("JSON format:\n")
print(json_output[:500] + "...\n")  # Mostrem nom√©s els primers 500 car√†cters

# Guardar a fitxer
with open('data/bom_analysis.json', 'w', encoding='utf-8') as f:
    f.write(json_output)
print("‚úÖ Guardat a: bom_analysis.json")

# Exportar components a Excel
df_components.to_excel('data/bom_components.xlsx', index=False)
print("‚úÖ Components guardats a: bom_components.xlsx")

### üí° Difer√®ncia amb l'enfocament tradicional

**Sense structured outputs (text lliure):**
```python
result = "El BOM cont√© 10 components: 2 resist√®ncies, 2 condensadors..."
# Ara hauries de fer parsing del text amb regex üò±
```

**Amb structured outputs (Pydantic):**
```python
result = BOMAnalysis(components=[...], total_components=10, ...)
# Acc√©s directe a dades validades! üéâ
print(result.total_components)  # 10
print(result.components[0].category)  # "Resist√®ncia"
```

**Avantatges:**
- ‚úÖ No cal parsing de text
- ‚úÖ Validaci√≥ autom√†tica de tipus
- ‚úÖ Errors clars si alguna cosa va malament
- ‚úÖ Autocompletat al IDE
- ‚úÖ F√†cil d'integrar amb bases de dades, APIs, etc.

### 6.11 Reflexi√≥ final sobre Agents vs Workflows

**Pregunta:** El que acabem de crear, √©s un workflow o un agent?

**An√†lisi:**
- ‚úÖ T√© un **rol** espec√≠fic (Analitzador de BOM)
- ‚úÖ Retorna **dades estructurades** 
- ‚ùå No pren **decisions** aut√≤nomes
- ‚ùå No usa **tools** per interactuar amb l'entorn
- ‚ùå No **itera** basant-se en feedback

**Resposta:** √âs m√©s proper a un **workflow sofisticat** que a un veritable agent aut√≤nom.

**Per convertir-lo en un agent real necessitar√≠em:**
1. **Tools** per:
   - Llegir fitxers Excel reals
   - Buscar informaci√≥ de components a internet
   - Consultar bases de dades de prove√Ødors
   
2. **Capacitat de decisi√≥:**
   - "Aquest component sembla estrany, busco m√©s informaci√≥?"
   - "Necessito validar aquest preu amb un prove√Ødor?"
   
3. **Iteraci√≥ basada en resultats:**
   - Si no troba info d'un component ‚Üí busca alternatives
   - Si detecta inconsist√®ncia ‚Üí fa comprovacions addicionals

**Aix√≤ ho construirem a la Part 2: Tools i Function Calling!** üöÄ

---
## Reflexi√≥ Final de la Part 1

### üéì Qu√® hem apr√®s?

1. ‚úÖ **LLMs i APIs**
   - Com cridar Google Gemini des de Python
   - Difer√®ncia entre usar l'API directament vs frameworks

2. ‚úÖ **Costos i models**
   - Gemini √©s molt econ√≤mic (Flash: $0.075/1M tokens)
   - Comparativa amb OpenAI i Anthropic
   - Regla d'or: comen√ßar amb models econ√≤mics

3. ‚úÖ **Capes de frameworks**
   - Des d'APIs REST fins a No-code
   - Per qu√® hem escollit CrewAI (capa 4)
   - Quan usar cada capa

4. ‚úÖ **Workflows vs Agents**
   - 5 patrons ag√®ntics comuns
   - Difer√®ncia clau: control vs autonomia
   - Quan usar cada un

5. ‚úÖ **CrewAI b√†sic**
   - Anatomia: Agent, Task, Crew
   - Primer crew simple (1 agent, 1 task)
   - Com configurar models de Gemini

6. ‚úÖ **Structured Outputs amb Pydantic**
   - Definir esquemes amb BaseModel
   - Integraci√≥ amb CrewAI (`output_pydantic`)
   - Processar dades estructurades
   - Cas pr√†ctic: Analitzador de BOM

### üöÄ Pr√≤xims passos

A la **Part 2: Tools i Function Calling** veurem:

- üîß **Crear tools personalitzades**
  - Tool per llegir fitxers Excel (BOMs reals)
  - Tool per "enviar" emails (via Gmail API)
  - Tool per consultar APIs externes

- ü§ñ **Agents que usen tools**
  - Com l'agent decideix quina tool usar
  - Iteraci√≥ basada en resultats de tools
  - Agents veritablement aut√≤noms

- üë• **M√∫ltiples agents col¬∑laborant**
  - Un agent per analitzar, un altre per buscar preus
  - Com es passen informaci√≥ entre ells
  - Processos Sequential vs Hierarchical

A la **Part 3: Cas Pr√†ctic Complet** integrarem tot:
- Sistema multi-agent per valoraci√≥ d'escandalls
- Workflow complet: BOM ‚Üí Preus ‚Üí Comparaci√≥ ‚Üí Informe
- El vostre projecte real! üéØ

---
<table style="margin: 20px 0; text-align: left; width:100%; border: 2px solid #27ae60;">
    <tr>
        <td style="width: 150px; vertical-align: middle; padding: 20px;">
            <img src="https://raw.githubusercontent.com/googlefonts/noto-emoji/main/png/128/emoji_u1f389.png" width="120" style="display: block;" />
        </td>
        <td style="padding: 20px;">
            <h2 style="color:#27ae60; margin: 0;">Enhorabona!</h2>
            <p style="color:#333; margin: 10px 0;">Has completat la Part 1 dels fonaments d'agents d'IA amb CrewAI i Google Gemini.</p>
            <p style="color:#ff7800; margin: 10px 0 0 0;"><strong>Proper pas:</strong> Part 2 - Tools i Function Calling</p>
        </td>
    </tr>
</table>