# Notebook 2 ‚Äî Vectores en R y operaciones vectorizadas

### Objetivo del cuaderno

En este cuaderno aprender√°s a trabajar con **vectores**, la estructura de datos m√°s importante en R y una de las bases del trabajo en **Inteligencia Artificial y Data Science**.

En IA **no trabajamos con valores sueltos**, sino con:

* conjuntos de datos,
* listas de valores,
* resultados de modelos,
* m√©tricas y predicciones.

R est√° dise√±ado para trabajar **directamente con colecciones de datos**, sin necesidad de usar bucles al principio.

---

### ¬øPor qu√© los vectores son clave en IA?

En Machine Learning, los vectores se usan para representar:

* notas, edades, temperaturas, sensores‚Ä¶
* predicciones de un modelo
* etiquetas reales (`TRUE / FALSE`)
* resultados intermedios de c√°lculos

En R, muchas operaciones de IA se hacen **aplicando una operaci√≥n a todo un vector a la vez**.


## 0) Preparaci√≥n (comprobaci√≥n)
Ejecuta la celda para confirmar que est√°s en R.


In [None]:
R.version.string


## 1) Crear vectores con `c()`

Un **vector** es una **lista ordenada de valores del mismo tipo**
(n√∫meros, texto o valores l√≥gicos).

En R, los vectores son la **estructura b√°sica para trabajar con datos**, y se usan constantemente en:

* an√°lisis de datos,
* Machine Learning,
* evaluaci√≥n de modelos,
* procesamiento de resultados.

En IA **no trabajamos con valores sueltos**, sino con conjuntos de datos completos, y en R esos conjuntos suelen representarse como vectores.

---

### La funci√≥n `c()`

La funci√≥n `c()` viene de *combine* (combinar) y se usa para **crear vectores**.

Ejemplo:



In [None]:
edades <- c(16, 17, 18, 19, 20)
edades


### Regla importante en R

En Python, una list puede tener n√∫meros y textos mezclados. En R, Un vector **solo puede contener valores del mismo tipo**.

Si mezclas tipos, R **forzar√°** a que todos sean del mismo tipo.

Ejemplo:

In [None]:
# OJO: R fuerza a que todos los datos sean del mismo tipo (Coerci√≥n)
mezcla <- c(1, 2, "tres")
mezcla
class(mezcla)
# Resultado: "character" (convierte todo a texto)

‚ö†Ô∏è **Esto es muy importante en IA**, porque un error de tipos puede estropear un an√°lisis completo.

### üîß Ejercicio 1

Crea un vector llamado `predicciones`
con 5 valores num√©ricos entre 0 y 1
(por ejemplo: 0.2, 0.8, 0.6, 0.9, 0.4)
y mu√©stralo.


In [None]:
# TODO: completa
predicciones <- c(0.2, 0.8, 0.6, 0.9, 0.4)
predicciones

## 2) Operaciones vectorizadas

En R, las operaciones matem√°ticas se aplican **directamente a vectores completos**.

Si sumas, restas, multiplicas o divides un n√∫mero por un vector,
R aplica la operaci√≥n a **cada elemento autom√°ticamente**, sin necesidad de bucles.

Esto se llama **operar de forma vectorizada**.

In [None]:
edades <- c(16, 17, 18, 19, 20)

edades + 1        # suma 1 a cada edad
edades * 2        # multiplica por 2 cada edad
edades / 2        # divide cada edad entre 2


---

### ¬øPor qu√© esto es importante en IA?

En Inteligencia Artificial trabajamos con:

* listas de datos,
* sensores,
* resultados de modelos,
* predicciones.

La vectorizaci√≥n permite:

* c√≥digo m√°s corto,
* menos errores,
* mejor rendimiento con muchos datos.

---

### Comparaci√≥n r√°pida con Python

En Python, sin librer√≠as como NumPy, necesitar√≠as un bucle:

```python
for i in edades:
    print(i + 1)
```

En R, **no hace falta**.

üí° **Idea clave**

> En R, primero pensamos en vectores y despu√©s (si hace falta) en bucles.

### üîß Ejercicio 2

A partir del vector `predicciones`,
crea un nuevo vector `predicciones_ajustadas`
multiplicando todas las predicciones por 100
para expresarlas en porcentaje.

Mu√©stralo.




In [None]:
# TODO: completa
predicciones_ajustadas <- predicciones * 100
predicciones_ajustadas

---

## 3) Funciones b√°sicas con vectores

R incluye muchas **funciones integradas** para trabajar con vectores.
Estas funciones se usan constantemente en **an√°lisis de datos y Machine Learning** para describir y resumir informaci√≥n.

Las m√°s habituales son:

* `length(x)` ‚Üí n√∫mero de elementos del vector
* `sum(x)` ‚Üí suma de los valores
* `mean(x)` ‚Üí media (promedio)
* `min(x)` ‚Üí valor m√≠nimo
* `max(x)` ‚Üí valor m√°ximo

---

### Ejemplo




In [None]:
length(edades)
sum(edades)
mean(edades)
min(edades)
max(edades)


---

### ¬øPor qu√© esto es importante en IA?

Estas funciones permiten:

* entender c√≥mo se comportan los datos,
* detectar valores extremos,
* resumir resultados de modelos,
* comparar distintas ejecuciones de un algoritmo.

En Machine Learning, **antes de entrenar un modelo**, siempre se analizan los datos con este tipo de funciones.



### Datos incompletos (muy com√∫n)

En Data Science real, los datos vienen sucios. Python usa **NaN** o **None**. R usa **NA**. 



In [None]:
# Datos sucios (muy com√∫n en ML)
datos_sucios <- c(10, 20, NA, 40)

mean(datos_sucios) 
# Resultado: NA (R es conservador, si hay un desconocido, el resultado es desconocido)

# La soluci√≥n:
mean(datos_sucios, na.rm = TRUE)

### üîß Ejercicio 3

Sobre el vector `predicciones`, calcula:

- n√∫mero de predicciones
- media de las predicciones
- predicci√≥n m√≠nima y m√°xima


In [None]:
# TODO: completa
length(predicciones)
mean(predicciones)
min(predicciones)
max(predicciones)


## 4) Acceder a elementos (indexado)

En R, los **√≠ndices empiezan en 1**, no en 0 como en Python.
Este es uno de los errores m√°s comunes al empezar.

‚ö†Ô∏è **Recuerda**:

* primer elemento ‚Üí posici√≥n **1**
* √∫ltimo elemento ‚Üí posici√≥n `length(x)`

---

### Ejemplos b√°sicos


In [None]:
edades <- c(16, 17, 18, 19, 20)

edades[1]
edades[3]
edades[2:4]
edades[c(1, 5)] 


### Comparaci√≥n r√°pida con Python

* En Python: `x[0]` ‚Üí primer elemento
* En R: `x[1]` ‚Üí primer elemento

üí° **Regla mental √∫til**

> En R, contar empieza en 1.

---

### ¬øPor qu√© esto importa en IA?

Al trabajar con datos y modelos:

* seleccionamos subconjuntos de datos,
* inspeccionamos valores concretos,
* analizamos resultados extremos (m√≠nimos, m√°ximos).

Un error en el indexado puede hacer que analices **el dato equivocado**.

---


### Un detalle importante en R

En R, usar un √≠ndice negativo **no significa lo mismo que en Python**.

```r
x[-1]
```

Esto significa:

> ‚Äúdevu√©lveme todos los elementos **excepto** el primero‚Äù.

En Python, `x[-1]` devuelve el √∫ltimo elemento.
En R, **no**.

In [None]:
edades[-1] # todas excepto la primera


### üîß Ejercicio 4

Usando un vector `predicciones`, muestra:
- la primera predicci√≥n,
- la √∫ltima predicci√≥n,
- las predicciones de la posici√≥n 2 a la 4.


In [None]:
# TODO: completa
predicciones[1]
predicciones[5]
predicciones[2:4]

## 5) Comparaciones y vectores l√≥gicos

En R puedes **comparar un vector completo** y el resultado es **otro vector**, pero de valores l√≥gicos (`TRUE` / `FALSE`).

Cada comparaci√≥n se aplica **elemento a elemento**.

Ejemplo:


In [None]:
edades <- c(16, 17, 18, 19, 20)

mayores_edad <- edades >= 18
mayores_edad


## 6) Filtrar datos (indexado l√≥gico)

Si usas un **vector l√≥gico dentro de `[]`**, R devuelve **solo los elementos cuyo valor es `TRUE`**.

Ejemplo:filtrar los mayores de edad



In [None]:
edades <- c(16, 17, 18, 19, 20)

edades[edades >= 18]


### üîß Ejercicio 5

Filtra las predicciones que sean:
- mayores o iguales que 0.5
- menores que 0.5

In [None]:
# TODO: completa
predicciones[predicciones >= 0.5]
predicciones[predicciones < 0.5]


## 7)  Crear funciones propias en R 

En Machine Learning no solo usamos funciones que ya existen (`mean()`, `sum()`, etc.).
Muy a menudo **creamos nuestras propias funciones** para:

* evaluar modelos,
* reutilizar c√°lculos,
* evitar repetir c√≥digo,
* hacer el c√≥digo m√°s claro.

---

##  Ejemplo: funci√≥n para evaluar un modelo

Supongamos que tenemos la **precisi√≥n** de un modelo y queremos devolver un mensaje autom√°tico.

###  En R, una funci√≥n se crea con `function()`





In [None]:
evaluar_modelo <- function(accuracy) {
  if (accuracy >= 0.80) {
    return("Modelo aceptable")
  } else {
    return("Modelo no aceptable")
  }
}

Usamos la funci√≥n as√≠:

In [None]:
resultado <- evaluar_modelo(0.83)
print(resultado)

---

##  Qu√© est√° pasando aqu√≠

* `evaluar_modelo` ‚Üí nombre de la funci√≥n
* `accuracy` ‚Üí par√°metro de entrada
* `{}` ‚Üí cuerpo de la funci√≥n
* `return()` ‚Üí valor que devuelve la funci√≥n

> üí° Una funci√≥n es **una m√°quina**: entra un valor, sale un resultado.

---

##  Comparaci√≥n directa con Python 

### En Python har√≠amos algo as√≠:

```python
def evaluar_modelo(accuracy):
    if accuracy >= 0.80:
        return "Modelo aceptable"
    else:
        return "Modelo no aceptable"
```

### Diferencias clave R vs Python

| Aspecto       | R                     | Python      |
| ------------- | --------------------- | ----------- |
| Palabra clave | `function()`          | `def`       |
| Asignaci√≥n    | `<-`                  | `=`         |
| Bloques       | `{}`                  | indentaci√≥n |
| Indentaci√≥n   | recomendada           | obligatoria |
| `return`      | opcional (pero clara) | habitual    |


En R, **las llaves mandan**, no los espacios.

---
### üîß Ejercicio 6 Crear tu primera funci√≥n de IA

### Enunciado

Crea una funci√≥n llamada `evaluar_error` que:

1. Reciba un valor llamado `error`
2. Si el error es **menor que 0.2**, devuelva:
   `"Error bajo"`
3. En caso contrario, devuelva:
   `"Error alto"`
4. Prueba la funci√≥n con al menos **dos valores distintos**

---

In [None]:
# TODO: completa
evaluar_error <- function(error) {
  if (error < 0.2) {
    return("Error bajo")
  } else {
    return("Error alto")
  }
}

prueba1 <- evaluar_error(0.15)
print(prueba1)
prueba2 <- evaluar_error(0.25)
print(prueba2)

### üîß Ejercicio 7  depuraci√≥n 

El siguiente c√≥digo **no funciona correctamente**.
Arr√©glalo para que la funci√≥n funcione bien.




In [None]:
evaluar_modelo <- function(accuracy) {
  if (accuracy >= 0.80) {
    return("Modelo aceptable")
  } else {
    return("Modelo no aceptable")
  }
}



## Mini-reto final ‚Äî Detecci√≥n simple de valores an√≥malos (outliers)

En an√°lisis de datos y Machine Learning es importante detectar **valores an√≥malos** (outliers), ya que pueden afectar negativamente al rendimiento de un modelo.

En este ejercicio analizaremos los **errores de un modelo**.

---

### Datos iniciales

0.12, 0.15, 0.11, 0.14, 0.13, 0.16, 0.12, 0.14, 0.15, 0.13, 0.11, 0.12, 0.14, 0.13, 0.15, 0.16, 0.12, 0.14, 0.13, 0.11, 0.18, 0.17, 0.16, 0.15, 0.14, 0.13, 0.45, 0.50, 0.60


Cada valor representa el error cometido por un modelo en distintas observaciones.

---

### üîß Enunciado

1. Calcula la **media** del vector `errores`.
2. Filtra los errores que sean **mayores que la media**.
3. Crea una funci√≥n que muestre:

   * la media de los errores,
   * los errores considerados altos,
   * cu√°ntos errores son mayores que la media.

---

### Pistas

* Usa `mean()` para calcular la media.
* Usa comparaciones vectorizadas (`>`) para detectar errores altos.
* Usa `length()` para contar cu√°ntos valores cumplen una condici√≥n.
* Usa indexado l√≥gico con `[]` para filtrar.


In [None]:
# TODO: completa
errores <- c(0.12, 0.15, 0.11, 0.14, 0.13, 0.16, 0.12, 0.14, 0.15, 0.13, 0.11, 0.12, 0.14, 0.13, 0.15, 0.16, 0.12, 0.14, 0.13, 0.11, 0.18, 0.17, 0.16, 0.15, 0.14, 0.13, 0.45, 0.50, 0.60)

mean(errores)

errores_altos <- errores > 0.2
errores_altos

length(errores_altos[errores_altos == TRUE])

# usa indexado logico con [] para filtrar los errores altos
errores_altos_valores <- errores[errores_altos]
errores_altos_valores
