In [33]:
import random
from llist import sllist
from math import sqrt, factorial
from functools import reduce

# Parte 2: Funciones matemáticas / estadísticas


Dados un conjunto de n números, las siguientes funciones matemáticas / estadísticas:

- Máximo
- Media
- Moda
- Mediana
- Desviación estándar
- Permutaciones del conjunto
- Variaciones del conjunto tomados de r elementos (r«n)
- Variaciones con repetición del conjunto de r elementos (r«n)

Y los diferentes escenarios propuestos:

- Los valores están cargados en un vector
- Los valores están cargados en una lista
- Los valores están ordenados en un vector de mayor a menor
- Los valores están precargados en un estructura sugerida por el grupo.

Resuelva:

1. Proponga algoritmos para cada una de las resoluciones
2. Analice la complejidad algorítmica (tiempo y espacio) de cada caso teniendo en cuenta el mejor, peor y caso promedio.
3. Compare entre cada función su complejidad gráficamente.
4. Programe los algoritmos.


**Nota: Las python `list` estan implementadas internamente como `array`.**  
Fuente: https://wiki.python.org/moin/TimeComplexity

## Los valores están cargados en un vector

In [34]:
vector = [random.randint(0,99) for i in range(100)]
print(vector)

[11, 18, 53, 61, 60, 15, 12, 69, 80, 48, 34, 24, 15, 74, 71, 16, 25, 82, 38, 15, 52, 67, 33, 45, 44, 34, 43, 60, 91, 34, 98, 76, 7, 80, 67, 54, 28, 42, 8, 29, 89, 92, 3, 38, 80, 7, 96, 46, 51, 67, 55, 89, 35, 14, 34, 59, 34, 82, 11, 83, 49, 97, 4, 86, 48, 82, 1, 89, 90, 72, 27, 72, 10, 62, 36, 0, 9, 49, 79, 96, 56, 63, 1, 34, 88, 22, 37, 42, 89, 1, 31, 20, 54, 81, 77, 64, 13, 1, 70, 9]


**a) Máximo**

In [35]:
# Tiempo O(n)
# Tamaño O(n + 1) -> O(n)

maximo = vector[0]
for elemento in vector:
    maximo = max(maximo, elemento)
    
print(maximo)

98


**b) Media**

In [36]:
# Tiempo O(n)
# Tamaño O(n + 1) -> O(n)

media = 0
cantidad = 0
for elemento in vector:
    media += elemento
    cantidad += 1
    
media = media/cantidad

print(media)

47.89


**c) Moda**

In [37]:
# Tiempo O(n) //Asumiendo que insert y get del dict es O(1)
# Tamaño O(n + n) -> O(n)

apariciones = {}
moda = vector[0]
for elemento in vector:
    apariciones[elemento] = apariciones.get(elemento, 0) + 1
    moda = moda if apariciones[moda] > apariciones[elemento] else elemento

print(moda)
print(apariciones)
print(apariciones[moda])

34
{11: 2, 18: 1, 53: 1, 61: 1, 60: 2, 15: 3, 12: 1, 69: 1, 80: 3, 48: 2, 34: 6, 24: 1, 74: 1, 71: 1, 16: 1, 25: 1, 82: 3, 38: 2, 52: 1, 67: 3, 33: 1, 45: 1, 44: 1, 43: 1, 91: 1, 98: 1, 76: 1, 7: 2, 54: 2, 28: 1, 42: 2, 8: 1, 29: 1, 89: 4, 92: 1, 3: 1, 96: 2, 46: 1, 51: 1, 55: 1, 35: 1, 14: 1, 59: 1, 83: 1, 49: 2, 97: 1, 4: 1, 86: 1, 1: 4, 90: 1, 72: 2, 27: 1, 10: 1, 62: 1, 36: 1, 0: 1, 9: 2, 79: 1, 56: 1, 63: 1, 88: 1, 22: 1, 37: 1, 31: 1, 20: 1, 81: 1, 77: 1, 64: 1, 13: 1, 70: 1}
6


**d) Mediana**

In [38]:
# Verificar si hay otro metodo
# Tiempo O(n log(n))
# Tamaño O(n + n) -> O(n)

ordenado = sorted(vector)

if len(vector) % 2 == 1:
    print(ordenado[len(vector) // 2])
else:
    print((ordenado[len(vector) // 2 - 1] + ordenado[len(vector) // 2]) / 2)

48.0


**e) Desviación estándar**

In [39]:
# media Calculada en un ejercicio anterior en O(n)
# Tiempo O(n)
# Tamaño O(n + 1)-> O(n)

varianza = 0
for elemento in vector:
    varianza += (media - elemento)**2

varianza = varianza/cantidad
desvio = sqrt(varianza)
print (desvio)

29.06781553539928


**f) Permutaciones del conjunto**

In [40]:
# Verificar si hay otro metdo
# Encontrar la cantidad de apariciones de cada uno es O(n)
# Tiempo Costo factorial es O(k) => Total: O(Sumatoria(apariciones) + n) + (numeros distintos)) => Peor caso O(n + n + n)= O(n) => Mejor caso O(n) => Caso promedio O(n) 
#                                       apariciones!             cant!      reduce
# Tamaño O(n + numeros_distintos)
# Sumatoria(apariciones) = n

permutaciones = factorial(cantidad)//reduce(lambda x,y: x*y, [factorial(aparicion) 
                                                                  for aparicion in apariciones.values()])

print(permutaciones)

84783964635998562695303116294115877619092709247032857152526619462353520735346454805236080016034310343219472184981414372966400000000000000000000000


**g) Variaciones del conjunto tomados de r elementos (r«n)**

In [41]:
# Variaciones de 'n' elementos tomados de a 'r'
# v = n!/(n-r)!
# sin repetición -> primero hay que filtrar los repetidos
# O(n) -> filter(vector) + O(1) -> calcular número

vector_filt = list(set(vector))
print(vector_filt)

r = 2 # tomados de a dos elementos, por ejemplo
variaciones = factorial(len(vector_filt)) // factorial(len(vector_filt) - r)
print(variaciones)

[0, 1, 3, 4, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 22, 24, 25, 27, 28, 29, 31, 33, 34, 35, 36, 37, 38, 42, 43, 44, 45, 46, 48, 49, 51, 52, 53, 54, 55, 56, 59, 60, 61, 62, 63, 64, 67, 69, 70, 71, 72, 74, 76, 77, 79, 80, 81, 82, 83, 86, 88, 89, 90, 91, 92, 96, 97, 98]
4830


**h) Variaciones con repetición del conjunto de r elementos (r«n)**

In [42]:
# Variaciones de 'n' elementos tomados de a 'r'
# hay repetición
# O(1) -> calcular número

r = 2  # tomados de a 2, por ejemplo
variaciones_rep = len(vector) ** r
print(variaciones_rep)

10000


## Los valores están cargados en una lista

In [43]:
lista = sllist(vector)

**a) Máximo**

In [44]:
# Tiempo O(n)
# Tamaño O(n + 1) -> O(n)

maximo = lista.first()
for elemento in lista:
    maximo = max(maximo, elemento)

print(maximo)

98


**b) Media**

In [45]:
# Tiempo O(n)
# Tamaño O(n + 1) -> O(n)

media = 0
cantidad = 0
for elemento in lista:
    media += elemento
    cantidad += 1
    
media = media/cantidad
print(media)

47.89


**c) Moda**

In [46]:
# Tiempo O(n) //Asumiendo que insert y get del dict es O(1)
# Tamaño O(n + n) -> O(n)

apariciones = {}
moda = lista.first()
for elemento in lista:
    apariciones[elemento] = apariciones.get(elemento, 0) + 1
    moda = moda if apariciones[moda] > apariciones[elemento] else elemento

print(moda)
print(apariciones[moda])

34
6


**d) Mediana**

In [47]:
# Verificar si hay otro metodo
# Tiempo O(n log(n))
# Tamaño O(n + n) -> O(n)
#

l = sllist(sorted(lista))

if l.size % 2 == 1:
    # Cantidad impar
    for i in range(l.size//2 + 1):
        mediana = l.popleft()
else:
    # Cantidad par
    for i in range(l.size//2):
        r = l.popleft()
    s = l.popleft()
    mediana = (r + s) / 2

print(mediana)

48.0


**e) Desviación estándar**

In [48]:
# media Calculada en un ejercicio anterior en O(n)

varianza = 0
for elemento in lista:
    varianza += (media - elemento)**2

varianza = varianza/cantidad
desvio = sqrt(varianza)
print(desvio)

29.06781553539928


**f) Permutaciones del conjunto**

In [49]:
# Verificar si hay otro metdo
# Encontrar la cantidad de apariciones de cada uno es O(n)
# Tiempo Costo factorial es O(k) => Total e O(Sumatoria(apariciones) + n) + (numeros distintos)) => Peor caso O(n + n + n)= O(n) => Mejor caso O(n) => Caso promedio O(n) 
#                                       apariciones!             cant!      reduce
# Tamaño O(n + numeros_distintos)
# Sumatoria(apariciones) = n

permutaciones = factorial(cantidad)//reduce(lambda x,y: x*y, [factorial(aparicion)
                                                                  for aparicion in apariciones.values()])

print(permutaciones)

84783964635998562695303116294115877619092709247032857152526619462353520735346454805236080016034310343219472184981414372966400000000000000000000000


**g) Variaciones del conjunto tomados de r elementos (r«n)**

In [50]:
# Variaciones de 'n' elementos tomados de a 'r'
# v = n!/(n-r)!
# sin repetición -> primero hay que filtrar los repetidos
# O(n) -> filter(lista) + O(1) -> calcular número

lista_filt = list(set(vector))
print(lista_filt)

r = 2 # tomados de a dos elementos, por ejemplo
variaciones = factorial(len(lista_filt)) // factorial(len(lista_filt) - r)
print(variaciones)

[0, 1, 3, 4, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18, 20, 22, 24, 25, 27, 28, 29, 31, 33, 34, 35, 36, 37, 38, 42, 43, 44, 45, 46, 48, 49, 51, 52, 53, 54, 55, 56, 59, 60, 61, 62, 63, 64, 67, 69, 70, 71, 72, 74, 76, 77, 79, 80, 81, 82, 83, 86, 88, 89, 90, 91, 92, 96, 97, 98]
4830


**h) Variaciones con repetición del conjunto de r elementos (r«n)**

In [51]:
# Variaciones de 'n' elementos tomados de a 'r'
# hay repetición
# O(1) -> calcular número

r = 2  # tomados de a 2, por ejemplo
variaciones_rep = len(lista) ** r
print(variaciones_rep)

10000


## Los valores están ordenados en un vector de mayor a menor

In [52]:
vector = sorted(vector, reverse=True)
print(vector)

[98, 97, 96, 96, 92, 91, 90, 89, 89, 89, 89, 88, 86, 83, 82, 82, 82, 81, 80, 80, 80, 79, 77, 76, 74, 72, 72, 71, 70, 69, 67, 67, 67, 64, 63, 62, 61, 60, 60, 59, 56, 55, 54, 54, 53, 52, 51, 49, 49, 48, 48, 46, 45, 44, 43, 42, 42, 38, 38, 37, 36, 35, 34, 34, 34, 34, 34, 34, 33, 31, 29, 28, 27, 25, 24, 22, 20, 18, 16, 15, 15, 15, 14, 13, 12, 11, 11, 10, 9, 9, 8, 7, 7, 4, 3, 1, 1, 1, 1, 0]


**a) Máximo**

In [53]:
# Tiempo O(1) Mejor, peor, promedio
# Tamaño O(n + 1) Mejor, peor, promedio

maximo = vector[0]

**b) Media** 

In [54]:
# Tiempo O(n) Mejor, peor, promedio
# Tamaño O(n + 1) Mejor, peor, promedio

media = 0
cantidad = 0
for elemento in vector:
    media += elemento
    cantidad += 1
    
media = media/cantidad
print(media)

47.89


**c) Moda**

In [55]:
# Tamaño O(n + 1) mejor, peor, promedio
# Tiempo O(n) mejor, peor, promedio

apariciones_actual = 0
elemento_previo = None
maxima_aparicion = 0
moda = None

for elemento in vector:
    if elemento != elemento_previo:
        moda = elemento_previo if maxima_aparicion < apariciones_actual else moda
        maxima_aparicion = apariciones_actual if maxima_aparicion < apariciones_actual else maxima_aparicion
        elemento_previo = elemento
        apariciones_actual = 0
    apariciones_actual += 1

maxima_aparicion = apariciones_actual if maxima_aparicion < apariciones_actual else maxima_aparicion
moda = elemento_previo if maxima_aparicion < apariciones_actual else moda

print(moda)
print(maxima_aparicion)

34
6


**d) Mediana**

In [56]:
# Tiempo O(1) mejor, peor, promedio (asumo len(vector) e O(1))
# Tamaño O(n + 1) mejor, peor, promedio

if len(vector) % 2 == 1:
    print(ordenado[len(vector) // 2])
else:
    print((ordenado[len(vector) // 2 - 1] + ordenado[len(vector) // 2]) / 2)

48.0


**e) Desviación estándar**

In [57]:
# media Calculada en un ejercicio anterior en O(n)
# Tiempo O(n) mejor, peor, promedio (asumo len(vector) e O(1))
# Tamaño O(1) mejor, peor, promedio

varianza = 0
for elemento in vector:
    varianza += (media - elemento)**2

varianza = varianza/cantidad
desvio = sqrt(varianza)

print(desvio)

29.06781553539928


**f) Permutaciones del conjunto**

In [58]:
# Verificar si hay otro metdo
# Encontrar la cantidad de apariciones de cada uno es O(n)
# Tiempo Costo factorial es O(k) => Total e O(Sumatoria(apariciones) + n) + (numeros distintos)) => Peor caso O(n + n + n)= O(n) => Mejor caso O(n) => Caso promedio O(n) 
#                                       apariciones!             cant!      reduce
# Tamaño O(n + numeros_distintos)
# Sumatoria(apariciones) = n

permutaciones = factorial(cantidad)//reduce(lambda x,y: x*y, [factorial(aparicion)
                                                                  for aparicion in apariciones.values()])

print(permutaciones)

84783964635998562695303116294115877619092709247032857152526619462353520735346454805236080016034310343219472184981414372966400000000000000000000000


**g) Variaciones del conjunto tomados de r elementos (r«n)**

In [59]:
# Variaciones de 'n' elementos tomados de a 'r'
# v = n!/(n-r)!
# sin repetición -> primero hay que filtrar los repetidos
# O(n) -> filter(lista) + O(1) -> calcular número

vector_set = [vector[0]]
previous_element = vector[0]
for element in vector:
    if previous_element == element:
        continue
    vector_set.append(element)
    previous_element = element


r = 2 # tomados de a dos elementos, por ejemplo
variaciones = factorial(len(vector_set)) // factorial(len(vector_set) - r)
print(variaciones)

4830


**h) Variaciones con repetición del conjunto de r elementos (r«n)**

In [60]:
# Variaciones de 'n' elementos tomados de a 'r'
# hay repetición
# O(1) -> calcular número

r = 2  # tomados de a 2, por ejemplo
variaciones_rep = len(lista) ** r
print(variaciones_rep)

10000


## Los valores están precargados en un estructura sugerida por el grupo.

**a) Máximo**

In [61]:
# Se puede utilizar un Heap de máximos
# Colocar todos los elementos en el Heap es O(n)
# Obtener el máximo es O(1)
#
# El heap implmentado es de mínimos,
# para que sea de máximos, se multiplica
# cada valor por -1 y se invierte el orden.
# Luego, cuando se retiran se lo vuelve a
# multiplicar por -1.

from heapq import heappop, heappush

h = []

for v in vector:
    heappush(h, -v)
    
maximo = -heappop(h)

print(maximo)

98


**b) Media** 

In [62]:
# No importa la estructura que se utilice,
# se deben recorrer todos los elementos
# para poder calcular la media.
#
# Se puede utilizar cualquiera de las estructuras
# previamente mencionadas.
#
# Siempre será O(n)

**c) Moda**

In [63]:
# Se cargan los valores del
# vector en un 'diccionario' y se guardan
# como valor un contador que se aumenta
# cada vez que se encuentre una nueva aparición
# del mismo elemento -> O(n)
#
# Luego se genera un heap de máximos
# con las tuplas (valor, ocurrencias)
#   -> O(k*log(k)) con k = cantidad de números
#                             diferentes.
# 
# Finalmente se obtine el primer elemento
# que es el máximo de ocurrecias -> O(1)
#
# Espacio: O(k) [k: cantidad de elementos diferentes
#    peor caso -> O(n)] + O(n) [vector incial]
#  -> resultado: O(n)

from heapq import heappop, heappush

d = {}

for val in vector:
    if val not in d:
        d[val] = 1
    else:
        d[val] += 1

its = list(d.items())

h = []

for e in its:
    heappush(h, (-e[1], e[0]))
    
m = heappop(h)

moda = m[1]
valor = -m[0]

print("Moda: {} con valor: {}".format(moda, valor))

Moda: 34 con valor: 6


**d) Mediana**

In [64]:
# La mejor opción es utilizar
# un vector, ordenarlo y dependiendo
# del tamaño hacer:
#
# Par:
#    mediana = media(ordenado[len(v)/2], ordenado[len(v)/2+1])
# Impar:
#    mediana = ordenado[len(v)/2]
#

**e) Desviación estándar**

In [65]:
# Teniendo calculada la Media,
# la desviación estándar, depende de
# todos los elementos del vector,
# con lo cual, es independiente
# de la estructura utilizada.
# 
# Siempre será O(n)

**f) Permutaciones del conjunto**

In [66]:
# Se calculan las ocurrencias
# de cada uno de los elementos,
# guardándolas en un diccionario.
# 
# Se calculan las permutaciones
# como: n!/(p1!*p2!*..*pk!)

d = {}

for val in vector:
    if val not in d:
        d[val] = 1
    else:
        d[val] += 1

ocurrencias = map(lambda x: x[1], list(d.items()))

apariciones = reduce(lambda x,y: x * y, [factorial(o) for o in ocurrencias])

permutaciones = factorial(len(vector))//apariciones

print(permutaciones)

84783964635998562695303116294115877619092709247032857152526619462353520735346454805236080016034310343219472184981414372966400000000000000000000000


**g) Variaciones del conjunto tomados de r elementos (r«n)**

In [67]:
# Es calcular un número que
# depende del tamaño del vector
# y de la cantidad de elementos a
# tomar: v = n!/(n-r)!

**h) Variaciones con repetición del conjunto de r elementos (r«n)**

In [68]:
# Es calcular un número
# que depende de len(v) y de
# la cantidad de elementos a tomar:
# v = n**r