# Algoritmos clásicos implementados en R

## Algoritmos de Ordenamiento

### Merge Sort 

In [95]:
n <- 10
v <- sample(c(-10000:10000),n,replace=T)

MergeSort <- function(l,r,a){
    if(l == r){
        return(a) # Es un solo elemento, ya esta ordenado
    } else {
        mi <- (l+r) %/% 2 # Punto medio
        left <- a[c(l:mi)-l+1] # Tomamos la primera mitad del arreglo
        right <- a[c((mi+1):r)-l+1] # Tomamos el resto
        lsize <- length(left) # Declaramos longitud 
        rsize <- length(right) # Declaramos longitud
        L <- MergeSort(l,mi,left) # Ordenamos las partes por separado
        R <- MergeSort(mi+1,r,right)
        ans <- NULL # Respuesta vacia inicialmente
        p1 <- 1 # Posiciones iniciales
        p2 <- 1
        while(p1 <= lsize && p2 <= rsize){ # Mientras haya elementos por comparar
            if( (L[p1] < R[p2])){ # Si el de la izquierda es menor, lo agregamos
                ans <- c(ans,L[p1]) 
                p1 <- p1 + 1
            } else { # Si el de la derecha es menor, lo agregamos
                ans <- c(ans,R[p2])
                p2 <- p2 + 1
            }
        }
        while(p1 <= lsize){ # Agregamos restante si hay
            ans <- c(ans,L[p1])
            p1 <- p1 + 1
        }
        while(p2 <= rsize){ # Agregamos restante si hay
            ans <- c(ans,R[p2])
            p2 <- p2 + 1
        }
        return(ans) # Devolvemos respuesta
    }
}

print(v)
Ordered <- MergeSort(1,n,v)
print(Ordered) # Ordenado con Merge Sort
print(sort(v)) # Ordenado con sort nativo

 [1]  -289 -2405  1835  5975  5178   920 -2376  8690  1731  9907
 [1] -2405 -2376  -289   920  1731  1835  5178  5975  8690  9907
 [1] -2405 -2376  -289   920  1731  1835  5178  5975  8690  9907


## Usados en Matemática y Teoría de Números

### Binary Search / Método de Bisección

Este algoritmo sirve para hallar una posición entre un conjunto de elementos ordenados en función a un predicado (proposición que se evalúa en el elemento y toma `verdadero` o `falso`) tal que sea la primera contradicción o la última verdad.

In [7]:
# Binary Search para hallar la posición del elemento más pequeño que sea mayor o igual a un valor X (lower_bound)
X <- sample(c(0:1000),1)
n <- 20
v <- sample(c(-1000:1000),n,replace=T) # Generamos un vector de 20 elementos aleatoriamente (pueden repetirse)
ordered_vector <- sort(v) # Ordenamos el vector y lo asignamos a uno extra

lo <- 1
hi <- n
while(lo < hi){
    mi <- lo + (hi-lo)%/%2
    if(ordered_vector[mi] < X) lo = mi+1
    else hi = mi
}
print(X)
print(ordered_vector)
cat(sprintf("El elemento de posicion %d con valor %d es el primero en ser mayor o igual a %d\n",lo,ordered_vector[lo],X))

[1] 458
 [1] -986 -883 -673 -627 -624 -511 -478 -348 -346 -227 -193 -126  146  276  417
[16]  443  610  781  871  921
El elemento de posicion 17 con valor 610 es el primero en ser mayor o igual a 458


In [8]:
# Binary Search para hallar la posición del elemento más grande que sea menor o igual a un valor X (upper_bound)
X <- sample(c(0:1000),1)
n <- 20
v <- sample(c(-1000:1000),n,replace=T) # Generamos un vector de 20 elementos aleatoriamente (pueden repetirse)
ordered_vector <- sort(v) # Ordenamos el vector y lo asignamos a uno extra

lo <- 1
hi <- n
while(lo < hi){
    mi <- lo + (hi-lo+1)%/%2
    if(ordered_vector[mi] <= X) lo = mi
    else hi = mi-1
}
print(X)
print(ordered_vector)
cat(sprintf("El elemento de posicion %d con valor %d es el ultimo en ser menor o igual a %d\n",lo,ordered_vector[lo],X))

[1] 784
 [1] -961 -897 -818 -801 -467 -459 -417 -406 -391 -163 -150 -100   62  182  192
[16]  443  631  671  879  920
El elemento de posicion 18 con valor 671 es el ultimo en ser menor o igual a 784


In [9]:
# Binary Search como método de bisección para hallar la raiz cuadrada aproximada de un número
X <- sample(c(0:10000),1)
lo <- 0.0
hi <- X
for(i in c(1:60)){
    mi = (lo+hi)/2.0
    if(mi*mi < X) lo = mi
    else hi = mi
}
cat(sprintf("La raiz cuadrada aproximada de %d es %.10f\n",X,lo))

La raiz cuadrada aproximada de 1386 es 37.2290209380


### Criba de Eratóstenes

#### Versión Tradicional

La versión tradicional de la criba maneja un arreglo de booleanos de tal forma que al finalizar el algoritmo se dé que `p[i]=TRUE` si y solamente si $i$ es primo. Su complejidad es $O(nloglogn)$ siendo $n$ el límite superior de los números

In [27]:
n <- 100
primo <- rep(TRUE,n)
primo[1] <- FALSE
for(i in c(2:sqrt(n))){
    if(primo[i]){
        for(j in seq.int(i*i,n,i)){
            primo[j] = FALSE
        }
    }
}
print(which(primo))

 [1]  2  3  5  7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97


#### Versión Lineal

La versión lineal de la criba maneja un arreglo de enteros tal que `pf[i]` guarda el factor primo más pequeño de `i`, además de manejar un arreglo extra donde se irán guardando los primos en el rango. Como su nombre lo dice, su complejidad es $O(n)$ siendo $n$ el límite superior de los números

In [29]:
n <- 100
pf <- rep(0,n)
primos <- NULL
for(i in c(2:n)){
    if(pf[i] == 0){
        pf[i] = i
        primos <- c(primos,i)
    }
    j <- 1
    while(j <= length(primos) && primos[j] <= pf[i] && i*primos[j] <= n){
        pf[i*primos[j]] <- primos[j]
        j <- j+1
    }
}
print(pf)
print(primos)

  [1]  0  2  3  2  5  2  7  2  3  2 11  2 13  2  3  2 17  2 19  2  3  2 23  2  5
 [26]  2  3  2 29  2 31  2  3  2  5  2 37  2  3  2 41  2 43  2  3  2 47  2  7  2
 [51]  3  2 53  2  5  2  3  2 59  2 61  2  3  2  5  2 67  2  3  2 71  2 73  2  3
 [76]  2  7  2 79  2  3  2 83  2  5  2  3  2 89  2  7  2  3  2  5  2 97  2  3  2
 [1]  2  3  5  7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97


### Exponenciación Rápida

Con este algoritmo se puede obtener el valor de $a^{b}$ en $O(log_{2}{b})$.

In [10]:
fast_expo <- function(a,b){
    r <- 1 # La respuesta base es 1
    while(b > 0){ # Mientras b no sea 0, podemos seguir
        if(bitwAnd(b,1)) r <- r*a # Si el valor actual de b es impar (su ultimo bit es 1) entonces multiplicamos
        b <- b %/% 2 # Desplazamos 1 bit a la derecha a B
        a <- a*a # A se eleva al cuadrado
    }
    return(r) # Devolvemos el resultado
}
print(fast_expo(3,4))

[1] 81


### Generar todos los subconjuntos de un conjunto

Con este algoritmo se pueden generar los $2^{n}$ subconjuntos de un conjunto de $n$ elementos usando `bitmask` para cada posición, de tal forma que 1 implica que en esa distribución tomaremos el elemento y 0 que no. Tiene complejidad $O(n\cdot 2^{n})$ pues para cada bitmask hay que recorrer los n elementos para verificar si están presentes o no. Hay una optimización para que solamente recorra la sumatoria exacta de $\sum\limits_{i=0}^{2^{n}}popcount(i)$ usando la técnica de **Least Significant One**. $popcount$ es la cantidad de bits prendidos.

In [19]:
n <- 10
S <- sample(c(0:100),n,replace=F)
print("Conjunto inicial:")
print(S)
for(bitmask in c(0:(2^n - 1))){ # Mascaras en base binaria
    subset <- NULL
    for(position in c(0:(n-1))){ # Indexado en 0
        move_until_position <- bitwShiftR(bitmask,position)
        if(bitwAnd(move_until_position,1)) subset <- c(subset,S[position+1]) # +1 para indexarlo en 1
    }
    print(subset)
}

[1] "Conjunto inicial:"
 [1] 28 12 95 63 51 32 64 74  7  6
NULL
[1] 28
[1] 12
[1] 28 12
[1] 95
[1] 28 95
[1] 12 95
[1] 28 12 95
[1] 63
[1] 28 63
[1] 12 63
[1] 28 12 63
[1] 95 63
[1] 28 95 63
[1] 12 95 63
[1] 28 12 95 63
[1] 51
[1] 28 51
[1] 12 51
[1] 28 12 51
[1] 95 51
[1] 28 95 51
[1] 12 95 51
[1] 28 12 95 51
[1] 63 51
[1] 28 63 51
[1] 12 63 51
[1] 28 12 63 51
[1] 95 63 51
[1] 28 95 63 51
[1] 12 95 63 51
[1] 28 12 95 63 51
[1] 32
[1] 28 32
[1] 12 32
[1] 28 12 32
[1] 95 32
[1] 28 95 32
[1] 12 95 32
[1] 28 12 95 32
[1] 63 32
[1] 28 63 32
[1] 12 63 32
[1] 28 12 63 32
[1] 95 63 32
[1] 28 95 63 32
[1] 12 95 63 32
[1] 28 12 95 63 32
[1] 51 32
[1] 28 51 32
[1] 12 51 32
[1] 28 12 51 32
[1] 95 51 32
[1] 28 95 51 32
[1] 12 95 51 32
[1] 28 12 95 51 32
[1] 63 51 32
[1] 28 63 51 32
[1] 12 63 51 32
[1] 28 12 63 51 32
[1] 95 63 51 32
[1] 28 95 63 51 32
[1] 12 95 63 51 32
[1] 28 12 95 63 51 32
[1] 64
[1] 28 64
[1] 12 64
[1] 28 12 64
[1] 95 64
[1] 28 95 64
[1] 12 95 64
[1] 28 12 95 64
[1] 63 64
[1] 28

### Test de primalidad de Miller-Rabin

Este test es muy usado en teoría de números para determinar si un número es probablemente primo o no. Toma complejidad de $O(klog^{3}{n})$

In [98]:
n <- 43

mul_mod <- function(a,b,m){ # Usamos Exponenciacion Rapida pero para multiplicar
    r <- 0
    while(b > 0){
        if(bitwAnd(b,1)) r <- (r+a)%%m
        a <- (a+a)%%m
        b <- b %/% 2
    }
    return(r)
}

pow_mod <- function(a,b,m){ # Usamos exponenciacion rapida con multiplicacion rapida modular
    r <- 1
    a <- a %% m
    while(b > 0){
        if(bitwAnd(b,1)){
            r <- mul_mod(r,a,m)
        }
        a <- mul_mod(a,a,m)
        b <- b %/% 2
    }
    return(r)
}



MillerRabin <- function(n,k){ # De acuerdo al algoritmo clasico
    if(n == 2 || n == 3 || n == 5 || n == 7) return(TRUE) # Casos rapidos
    if(n <= 9) return(FALSE) # Casos rapidos (1 no verificado)
    r <- 0
    NminusOne <- n-1
    while(NminusOne %% 2 == 0){ # Expresamos n = 2^{r}.d
        NminusOne <- NminusOne %/% 2
        r <- r + 1
    }
    d <- NminusOne
    tests <- sample.int((n-2),k,replace=F) # Tomamos k enteros diferentes entre 2 y n-2
    for(a in tests){ # Tomamos test
        x <- pow_mod(a,d,n) # Usamos x = a^d mod n
        continue <- FALSE
        if(x == 1 || x == n-1) continue <- TRUE # Si x = 1 o x = n-1 pasa el test
        if(continue == FALSE){
            for(times in c(1:(r-1))){ # Repetimos r-1 veces
                x <- mul_mod(x,x,n) # Tomamos x = x^2 mod n
                if(x == 1) return(FALSE) # Si x = 1 es compuesto
                if(x == n-1) continue <- TRUE # Si x = n-1 pasa el test
                if(continue) break
            }
            if(continue == FALSE){ # Si no pasa el test, es compuesto
                return(FALSE)
            }
        }
    }
    return(TRUE) # Pasa todos los test, es probablemente primo
}

if(MillerRabin(n,20)){
    cat(sprintf("%d es probablemente primo",as.integer(n)))
} else {
    cat(sprintf("%d es compuesto",as.integer(n)))
}

43 es probablemente primo

## Usados en Grafos

### Matriz de Adyacencia

Para representar un grafo podemos usar una matriz $M_{V\times V}$ donde $M_{ij}$ tiene un valor no infinito que determina el peso de la arista entre los nodos $i$ y $j$ o infinito si no existe tal arista.

Además, podríamos usar un array de arrays (no una matriz) para guardar en $G_{i}$ el arreglo con todos los vecinos del nodo $i$ y sus respectivos pesos de arista.

In [53]:
n <- 10
MatAdy <- matrix(sample(c(0:1),n*n,replace=T),nrow=n,ncol=n)
cat(sprintf("Matriz de Adyacencia:\n"))
print(MatAdy)

cat(sprintf("Formando la Lista de Adyacencia:\n"))

G <- rep(list(NULL),n) # Creamos una lista de n arrays vacios al inicio
for(i in c(1:n)){
    carry <- NULL # Inicializamos un array al vacio
    for(j in c(1:n)){ # Revisamos para cada posiblea arista (i,j)
        if(MatAdy[i,j]){ # Existe la arista
            carry <- c(carry,j) # Agregamos al array de vecinos al nodo j
        }
    }
    G[[i]] <- c(G[[i]],carry) # Agregamos al array en la posicion i el array de vecinos
}
print(G)
cat(sprintf("Accediendo a la lista de Adyacencia del nodo 5:\n"))
print(G[[5]])
cat(sprintf("Iterando sobre sus elementos:\n"))
for(i in G[[5]]){ # Iteramos sobre los elementos de la lista del nodo 5, recordar L[[k]] es para listas
    print(i)
}

Matriz de Adyacencia:
      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
 [1,]    0    1    1    1    1    1    1    0    0     0
 [2,]    0    0    1    0    0    0    0    0    0     1
 [3,]    0    1    0    1    1    1    0    1    1     1
 [4,]    0    1    0    1    0    1    1    1    0     0
 [5,]    0    0    1    0    1    0    0    1    1     1
 [6,]    1    1    1    1    1    0    1    1    1     1
 [7,]    0    1    1    1    0    1    0    0    0     1
 [8,]    0    1    0    0    0    1    0    0    0     0
 [9,]    0    1    0    1    0    1    1    1    0     0
[10,]    1    0    1    0    1    1    0    0    1     1
Formando la Lista de Adyacencia:
[[1]]
[1] 2 3 4 5 6 7

[[2]]
[1]  3 10

[[3]]
[1]  2  4  5  6  8  9 10

[[4]]
[1] 2 4 6 7 8

[[5]]
[1]  3  5  8  9 10

[[6]]
[1]  1  2  3  4  5  7  8  9 10

[[7]]
[1]  2  3  4  6 10

[[8]]
[1] 2 6

[[9]]
[1] 2 4 6 7 8

[[10]]
[1]  1  3  5  6  9 10

Accediendo a la lista de Adyacencia del nodo 5:
[1]  3  5  8  9 10
It

### Depth-First Search (Búsqueda en Profundidad)

In [64]:
# Inicializamos el Grafo

n <- 10
MatAdy <- matrix(sample(c(0:1),n*n,replace=T),nrow=n,ncol=n)
G <- rep(list(NULL),n)
for(i in c(1:n)){
    carry <- NULL
    for(j in c(1:n)){
        if(MatAdy[i,j]){
            carry <- c(carry,j)
        }
    }
    G[[i]] <- c(G[[i]],carry)
}

# Definimos la función DFS para explorar el grafo
# Mantenemos los siguientes atributos por nodo
# Tiempo de entrada
# Tiempo de salida
# Situación: Visitado o no

Tiempo <- 1
vis <- rep(0,n)
Tentrada <- rep(-1,n)
Tsalida <- rep(-1,n)

Explorar <- function(u){
    print(u) # Imprimimos el nodo que exploramos
    Tentrada[u] <<- Tiempo # Acabamos de entrar en este tiempo a este nodo
    vis[u] <<- TRUE # Marcamos como visitado al nodo
    Tiempo <<- Tiempo+1 # Aumentamos el tiempo en 1 unidad
    for(v in G[[u]]){ # Revisamos los vecinos
        if(!vis[v]){ # Si aun no se visitó, entonces debemos explorar desde ahi para la componente actual
            Explorar(v) 
        }
    }
    Tsalida[u] <<- Tiempo # Salimos de este nodo en este tiempo
}

DFS <- function(){
    for(i in range(1:n)){ # Verificamos para cada nodo
        if(!vis[i]){ # Si no esta visitado, aun no forma parte de alguna componente
            print("Empezando una nueva componente conexa")
            Explorar(i) # Mandamos a explorar desde el nodo i
        }
    }
    print(Tentrada) # Imprimimos tiempos de entrada
    print(Tsalida) # Imprimimos tiempos de salida
}
DFS()

[1] "Empezando una nueva componente conexa"
[1] 1
[1] 5
[1] 4
[1] 2
[1] 6
[1] 3
[1] 10
[1] 7
[1] 8
[1] 9
 [1]  1  4  6  3  2  5  8  9 10  7
 [1] 11 11 11 11 11 11 11 10 11 11


### Breadth-First Search (Búsqueda en Anchura)

In [73]:
# Inicializamos el Grafo

n <- 10
MatAdy <- matrix(sample(c(0:1),n*n,replace=T),nrow=n,ncol=n)
G <- rep(list(NULL),n)
for(i in c(1:n)){
    carry <- NULL
    for(j in c(1:n)){
        if(MatAdy[i,j]){
            carry <- c(carry,j)
        }
    }
    G[[i]] <- c(G[[i]],carry)
}

# Definimos la función BFS para explorar el grafo desde el nodo 1
# Mantenemos los siguientes atributos por nodo
# Distancia más pequeña entre (1,u)

print(G)

BFS <- function(source){ # Vamos a hallar las distancias mas cortas desde el nodo source
    D <- rep(Inf,n) # Inicializamos todas las distancias a Infinito
    D[source] <- 0 # La distancia de un nodo a si mismo es 0
    Q <- c(source) # Encolamos el nodo source
    while(length(Q)!=0){ # Mientras hayan nodos pendientes de revisar
        u <- Q[1] # Desencolamos el siguiente nodo en la cola
        Q <- Q[-1] # Quitamos el nodo del frente de la cola
        for(v in G[[u]]){ # Para cada vecino del nodo
            if(D[v] > D[u]+1){ # Si su distancia actual es mayor (Infinito) a la del nodo que analizamos + 1
                D[v] <- D[u]+1 # Reemplazamos la distancia
                Q <- c(Q,v) # Encolamos
            }
        }
    }
    return(D) Devolvemos el array de distancias por cada nodo
}

D <- BFS(1)
print(D)

[[1]]
[1]  1  5  8 10

[[2]]
[1] 1 2 3 7 8 9

[[3]]
[1] 2 3 4 5 7 8

[[4]]
[1] 1 4 5 6 9

[[5]]
[1]  1  4  5  9 10

[[6]]
[1] 3 4 5 7

[[7]]
[1] 4 8

[[8]]
[1] 1 3 5 6 9

[[9]]
[1]  1  2  4  6  7  8  9 10

[[10]]
[1] 3 4 8

 [1] 0 3 2 2 1 2 3 1 2 1


## Estructuras de Datos

### Segment Tree

El Segment Tree es una estructura usada para responder consultas que tomen elementos de un arreglo y puedan ser procesadas de manera asociativa en $O(logn)$. Se construye en $O(n)$ siendo $n$ la cantidad de elementos en el arreglo. Además permite modificar un valor en el arreglo en $O(logn)$ sin perder la coherencia con el estado del nuevo arreglo.

In [1]:
# Segment Tree para obtener la suma en un rango
n <- 10
v <- sample(c(-100000:100000),n,replace=T)
st <- rep(0,4*n)

build <- function(pos=1, l=1, r=n){ # Construimos el nodo pos, que dará la suma del rango [l,r]
    if(l == r){ # Un solo elemento, caso base
        st[pos] <<- v[l] # Asignamos directamente
    } else {
        mi <- (l+r) %/% 2 # Partimos el rango a la mitad para generar sus dos subintervalos
        build(2*pos,l,mi) # Construimos el rango de la izquierda
        build(2*pos+1,mi+1,r) # Construimos el rango de la derecha
        st[pos] <<- st[2*pos]+st[2*pos+1] # El intervalo actual será la suma de los dos subintervalos ya construidos
    }
}

update <- function(x,y,pos=1,l=1,r=n){ # Actualizar el valor de la posicion x a y
    if(l == r){ # Ya estamos en el elemento
        st[pos] <<- y # Asignamos directamente
        v[x] <<- y
    } else {
        mi <- (l+r) %/% 2
        if(l <= x && x <= mi){ # Si está en el subrango de la izquierda solo actualizamos ese lado
            update(x,y,2*pos,l,mi)
        } else { # Sino, actualizamos solo a la derecha
            update(x,y,2*pos+1,mi+1,r)
        }
        st[pos] <<- st[2*pos]+st[2*pos+1]
    }
}

query <- function(x,y,pos=1,l=1,r=n){ # Devolvemos la suma de valores en el rango de posiciones [x,y]
    if(y < l || r < x) return(0) # No pertenece al intervalo que deseamos sumar, devolvemos el elemento neutro 
    if(x <= l && r <= y) return(st[pos]) # Este intervalo está completamente dentro, devolver de frente para evitar procesar mas
    mi <- (l+r) %/% 2
    L <- query(x,y,2*pos,l,mi) # Obtenemos el aporte del subrango izquierdo
    R <- query(x,y,2*pos+1,mi+1,r) # Obtenemos el aporte del subrango derecho
    return(L+R) # Devolvemos la suma
}

build()
print(v)
print(query(1,3))
update(1,0)
print(v)
print(query(1,3))

 [1]  50334 -44468  34269  91311 -24092  92564 -54091  92593  18956 -66201
[1] 40135
 [1]      0 -44468  34269  91311 -24092  92564 -54091  92593  18956 -66201
[1] -10199


## SQRT Decomposition

El SQRT Decomposition es una estructura usada para responder consultas en rango con una complejidad de $O(\sqrt{n})$, asi como modificar algun valor en el arreglo con una complejidad de $O(\sqrt{n})$, aunque en el caso de suma acumulada es $O(1)$.

In [30]:
n <- 9
M <- as.integer(sqrt(n))
total <- 0
v <- sample(c(-100000:100000),n,replace=T)
SQRTD <- rep(0,M)

build <- function(){
    idx <- 0
    for(i in c(1:n)){
        if((i-1) %% M == 0){
            idx <- idx + 1
        }
        SQRTD[idx] <<- SQRTD[idx] + v[i]
    }
    total <<- idx
    print(SQRTD)
}

update <- function(x,val){
    last_val <- v[x]
    idx <- ((x-1) %/% M) + 1
    SQRTD[idx] <<- SQRTD[idx] - last_val
    v[x] <<- val
    SQRTD[idx] <<- SQRTD[idx] + v[x]
}

query <- function(x,y){
    ans <- 0
    while((x-1)%%M!=0 && x < y){
        ans <- ans + v[x]
        x <- x + 1
    }
    idx <- (x-1)%/%M + 1
    while(x + M <= y && idx <= total){
        ans <- ans + SQRTD[idx]
        idx <- idx + 1
        x <- x + M
    }
    while(x <= y){
        ans <- ans + v[x]
        x <- x+1
    }
    return(ans)
}

build()
print(v)
print(query(1,n))
update(7,0)
print(v)
print(query(1,n))

[1]   17464 -237891 -179184
[1] -21650 -23680  62794 -78928 -93891 -65072 -79402 -75408 -24374
[1] -399611
[1] -21650 -23680  62794 -78928 -93891 -65072      0 -75408 -24374
[1] -320209
