In [2]:
import random
from llist import sllist
from math import sqrt, factorial
from functools import reduce

# Parte 2: Funciones matemáticas / estadísticas


Dados un conjunto de n números, las siguientes funciones matemáticas / estadísticas:

- Máximo
- Media
- Moda
- Mediana
- Desviación estándar
- Permutaciones del conjunto
- Variaciones del conjunto tomados de r elementos (r«n)
- Variaciones con repetición del conjunto de r elementos (r«n)

Y los diferentes escenarios propuestos:

- Los valores están cargados en un vector
- Los valores están cargados en una lista
- Los valores están ordenados en un vector de mayor a menor
- Los valores están precargados en un estructura sugerida por el grupo.

Resuelva:

1. Proponga algoritmos para cada una de las resoluciones
2. Analice la complejidad algorítmica (tiempo y espacio) de cada caso teniendo en cuenta el mejor, peor y caso promedio.
3. Compare entre cada función su complejidad gráficamente.
4. Programe los algoritmos.


**Nota: Las python `list` estan implementadas internamente como `array`.**  
Fuente: https://wiki.python.org/moin/TimeComplexity

## Los valores están cargados en un vector

In [3]:
vector = [random.randint(0,99) for i in range(100)]
print(vector)

[40, 73, 60, 78, 16, 62, 1, 31, 69, 33, 50, 26, 48, 33, 37, 86, 65, 61, 1, 53, 98, 96, 80, 21, 2, 66, 48, 20, 42, 52, 54, 72, 69, 22, 27, 28, 35, 36, 74, 74, 38, 89, 77, 9, 73, 9, 96, 98, 66, 21, 44, 50, 0, 2, 0, 25, 37, 79, 70, 8, 11, 32, 56, 89, 39, 50, 27, 78, 83, 57, 50, 48, 79, 90, 82, 69, 19, 61, 4, 14, 33, 86, 24, 69, 62, 98, 29, 50, 15, 86, 63, 26, 18, 26, 5, 40, 58, 22, 62, 75]


**a) Máximo**

In [68]:
# Tiempo O(n)
# Tamaño O(n + 1) -> O(n)

maximo = vector[0]
for elemento in vector:
    maximo = max(maximo, elemento)
    
print(maximo)

99


**b) Media**

In [7]:
# Tiempo O(n)
# Tamaño O(n + 1) -> O(n)

media = 0
cantidad = 0
for elemento in vector:
    media += elemento
    cantidad += 1
    
media = media/cantidad

print(media)

52.29


**c) Moda**

In [4]:
# Tiempo O(n) //Asumiendo que insert y get del dict es O(1)
# Tamaño O(n + n) -> O(n)

apariciones = {}
moda = vector[0]
for elemento in vector:
    apariciones[elemento] = apariciones.get(elemento, 0) + 1
    moda = moda if apariciones[moda] > apariciones[elemento] else elemento

print(moda)
print(apariciones)
print(apariciones[moda])

57
{94: 2, 60: 3, 10: 2, 4: 1, 14: 2, 6: 2, 21: 3, 20: 1, 85: 1, 55: 3, 57: 4, 31: 4, 78: 1, 40: 2, 25: 3, 97: 2, 7: 1, 68: 1, 81: 2, 37: 2, 32: 3, 77: 1, 42: 2, 66: 1, 34: 1, 92: 2, 33: 1, 70: 1, 64: 1, 83: 1, 72: 2, 75: 1, 80: 2, 74: 1, 95: 1, 54: 2, 99: 2, 61: 1, 96: 1, 71: 1, 17: 1, 67: 1, 63: 1, 88: 1, 84: 2, 16: 2, 5: 1, 13: 1, 45: 1, 79: 1, 52: 2, 26: 1, 93: 1, 1: 2, 69: 1, 2: 1, 27: 1, 76: 2, 82: 1, 9: 1, 59: 1, 53: 1, 86: 1, 62: 1, 98: 1}
4


**d) Mediana**

In [5]:
# Verificar si hay otro metodo
# Tiempo O(n log(n))
# Tamaño O(n + n) -> O(n)

ordenado = sorted(vector)

if len(vector) % 2 == 1:
    print (ordenado[len(vector) // 2])
else:
    print((ordenado[len(vector) // 2] + ordenado[len(vector) // 2 + 1 ]) / 2)

57.0


**e) Desviación estándar**

In [10]:
# media Calculada en un ejercicio anterior en O(n)
# Tiempo O(n)
# Tamaño O(n + 1)-> O(n)

varianza = 0
for elemento in vector:
    varianza += (media - elemento)**2

varianza = varianza/cantidad
desvio = sqrt(varianza)
print (desvio)

29.162405593503426


**f) Permutaciones del conjunto**

In [12]:
# Verificar si hay otro metdo
# Encontrar la cantidad de apariciones de cada uno es O(n)
# Tiempo Costo factorial es O(k) => Total: O(Sumatoria(apariciones) + n) + (numeros distintos)) => Peor caso O(n + n + n)= O(n) => Mejor caso O(n) => Caso promedio O(n) 
#                                       apariciones!             cant!      reduce
# Tamaño O(n + numeros_distintos)
# Sumatoria(apariciones) = n

permutaciones = factorial(cantidad)//reduce(lambda x,y: x*y, [factorial(aparicion) 
                                                                  for aparicion in apariciones.values()])

print(permutaciones)

39742483423124326263423335762866817633949707459546651790246852872978212844693650689954412507516082973384127586710037987328000000000000000000000000


**g) Variaciones del conjunto tomados de r elementos (r«n)**

In [14]:
# Variaciones de 'n' elementos tomados de a 'r'
# v = n!/(n-r)!
# sin repetición -> primero hay que filtrar los repetidos
# O(n) -> filter(vector) + O(1) -> calcular número

vector_filt = list(set(vector))
print(vector_filt)

r = 2 # tomados de a dos elementos, por ejemplo
variaciones = factorial(len(vector_filt)) // factorial(len(vector_filt) - r)
print(variaciones)

[1, 2, 4, 5, 6, 7, 9, 10, 13, 14, 16, 17, 20, 21, 25, 26, 27, 31, 32, 33, 34, 37, 40, 42, 45, 52, 53, 54, 55, 57, 59, 60, 61, 62, 63, 64, 66, 67, 68, 69, 70, 71, 72, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 88, 92, 93, 94, 95, 96, 97, 98, 99]
4160


**h) Variaciones con repetición del conjunto de r elementos (r«n)**

In [15]:
# Variaciones de 'n' elementos tomados de a 'r'
# hay repetición
# O(1) -> calcular número

r = 2  # tomados de a 2, por ejemplo
variaciones_rep = len(vector) ** r
print(variaciones_rep)

10000


## Los valores están cargados en una lista

In [74]:
lista = sllist(vector)

**a) Máximo**

In [109]:
# Tiempo O(n)
# Tamaño O(n + 1) -> O(n)

maximo = lista.first()
for elemento in lista:
    maximo = max(maximo, elemento)

print(maximo)

99


**b) Media**

In [106]:
# Tiempo O(n)
# Tamaño O(n + 1) -> O(n)

media = 0
cantidad = 0
for elemento in lista:
    media += elemento
    cantidad += 1
    
media = media/cantidad
print(media)

47.89


**c) Moda**

In [107]:
# Tiempo O(n) //Asumiendo que insert y get del dict es O(1)
# Tamaño O(n + n) -> O(n)

apariciones = {}
moda = lista.first()
for elemento in lista:
    apariciones[elemento] = apariciones.get(elemento, 0) + 1
    moda = moda if apariciones[moda] > apariciones[elemento] else elemento

print(moda)
print(apariciones[moda])

91
5


**d) Mediana**

In [78]:
# Verificar si hay otro metodo
# Tiempo O(n log(n))
# Tamaño O(n + n) -> O(n)
#
# Suponiendo que el resultado de ordenar es un vector

ordenado = sorted(lista)

if len(lista) % 2 == 1:
    print(ordenado[len(lista) // 2])
else:
    print((ordenado[len(lista) // 2] + ordenado[len(lista) // 2 + 1 ]) / 2)

47.0


**e) Desviación estándar**

In [79]:
# media Calculada en un ejercicio anterior en O(n)

varianza = 0
for elemento in lista:
    varianza += (media - elemento)**2

varianza = varianza/cantidad
desvio = sqrt(varianza)
print(desvio)

29.880058567546353


**f) Permutaciones del conjunto**

In [104]:
# Verificar si hay otro metdo
# Encontrar la cantidad de apariciones de cada uno es O(n)
# Tiempo Costo factorial es O(k) => Total e O(Sumatoria(apariciones) + n) + (numeros distintos)) => Peor caso O(n + n + n)= O(n) => Mejor caso O(n) => Caso promedio O(n) 
#                                       apariciones!             cant!      reduce
# Tamaño O(n + numeros_distintos)
# Sumatoria(apariciones) = n

permutaciones = factorial(cantidad)//reduce(lambda x,y: x*y, [factorial(aparicion)
                                                                  for aparicion in apariciones.values()])

print(permutaciones)

71536470161623787274162004373160271741109473427183973222444335171360783120448571241917942513528949352091429656078068377190400000000000000000000000


**g) Variaciones del conjunto tomados de r elementos (r«n)**

In [4]:
# Variaciones de 'n' elementos tomados de a 'r'
# v = n!/(n-r)!
# sin repetición -> primero hay que filtrar los repetidos
# O(n) -> filter(lista) + O(1) -> calcular número

lista_filt = list(set(vector))
print(lista_filt)

r = 2 # tomados de a dos elementos, por ejemplo
variaciones = factorial(len(lista_filt)) // factorial(len(lista_filt) - r)
print(variaciones)

[0, 1, 2, 4, 5, 8, 9, 11, 14, 15, 16, 18, 19, 20, 21, 22, 24, 25, 26, 27, 28, 29, 31, 32, 33, 35, 36, 37, 38, 39, 40, 42, 44, 48, 50, 52, 53, 54, 56, 57, 58, 60, 61, 62, 63, 65, 66, 69, 70, 72, 73, 74, 75, 77, 78, 79, 80, 82, 83, 86, 89, 90, 96, 98]
4032


**h) Variaciones con repetición del conjunto de r elementos (r«n)**

In [None]:
# Variaciones de 'n' elementos tomados de a 'r'
# hay repetición
# O(1) -> calcular número

r = 2  # tomados de a 2, por ejemplo
variaciones_rep = len(lista) ** r
print(variaciones_rep)

## Los valores están ordenados en un vector de mayor a menor

In [82]:
vector = sorted(vector, reverse=True)
print(vector)

[99, 98, 97, 96, 96, 94, 94, 93, 91, 91, 91, 91, 91, 90, 90, 89, 88, 88, 83, 82, 81, 80, 79, 76, 74, 74, 72, 68, 68, 68, 66, 64, 62, 60, 59, 59, 58, 58, 58, 55, 55, 54, 54, 52, 52, 51, 51, 50, 48, 46, 44, 44, 44, 43, 42, 39, 38, 37, 37, 36, 35, 34, 33, 33, 32, 32, 30, 28, 27, 27, 26, 26, 25, 23, 23, 22, 20, 20, 19, 18, 17, 15, 15, 13, 13, 12, 12, 11, 9, 8, 8, 8, 8, 7, 5, 3, 2, 1, 1, 0]


**a) Máximo**

In [16]:
# Tiempo O(1) Mejor, peor, promedio
# Tamaño O(n + 1) Mejor, peor, promedio

maximo = vector[0]

**b) Media** 

In [84]:
# Tiempo O(n) Mejor, peor, promedio
# Tamaño O(n + 1) Mejor, peor, promedio

media = 0
cantidad = 0
for elemento in vector:
    media += elemento
    cantidad += 1
    
media = media/cantidad
print(media)

47.89


**c) Moda**

In [101]:
# Tamaño O(n + 1) mejor, peor, promedio
# Tiempo O(n) mejor, peor, promedio

apariciones_actual = 0
elemento_previo = None
maxima_aparicion = 0
moda = None

for elemento in vector:
    if elemento != elemento_previo:
        moda = elemento_previo if maxima_aparicion < apariciones_actual else moda
        maxima_aparicion = apariciones_actual if maxima_aparicion < apariciones_actual else maxima_aparicion
        elemento_previo = elemento
        apariciones_actual = 0
    apariciones_actual += 1

maxima_aparicion = apariciones_actual if maxima_aparicion < apariciones_actual else maxima_aparicion
moda = elemento_previo if maxima_aparicion < apariciones_actual else moda

print(moda)
print(maxima_aparicion)

91
5


**d) Mediana**

In [102]:
# Tiempo O(1) mejor, peor, promedio (asumo len(vector) e O(1))
# Tamaño O(n + 1) mejor, peor, promedio

if len(vector) % 2 == 1:
    print(ordenado[len(vector) // 2])
else:
    print((ordenado[len(vector) // 2] + ordenado[len(vector) // 2 + 1 ]) / 2)

47.0


**e) Desviación estándar**

In [103]:
# media Calculada en un ejercicio anterior en O(n)
# Tiempo O(n) mejor, peor, promedio (asumo len(vector) e O(1))
# Tamaño O(1) mejor, peor, promedio

varianza = 0
for elemento in vector:
    varianza += (media - elemento)**2

varianza = varianza/cantidad
desvio = sqrt(varianza)

print(desvio)

29.880058567546353


**f) Permutaciones del conjunto**

In [None]:
# Verificar si hay otro metdo
# Encontrar la cantidad de apariciones de cada uno es O(n)
# Tiempo Costo factorial es O(k) => Total e O(Sumatoria(apariciones) + n) + (numeros distintos)) => Peor caso O(n + n + n)= O(n) => Mejor caso O(n) => Caso promedio O(n) 
#                                       apariciones!             cant!      reduce
# Tamaño O(n + numeros_distintos)
# Sumatoria(apariciones) = n

permutaciones = factorial(cantidad)//reduce(lambda x,y: x*y, [factorial(aparicion)
                                                                  for aparicion in apariciones.values()])

print(permutaciones)

**g) Variaciones del conjunto tomados de r elementos (r«n)**

In [None]:
# Variaciones de 'n' elementos tomados de a 'r'
# v = n!/(n-r)!
# sin repetición -> primero hay que filtrar los repetidos
# O(n) -> filter(lista) + O(1) -> calcular número

lista_filt = sllist(set(lista))
print(lista_filt)

r = 2 # tomados de a dos elementos, por ejemplo
variaciones = factorial(len(lista_filt)) // factorial(len(lista_filt) - r)
print(variaciones)

**h) Variaciones con repetición del conjunto de r elementos (r«n)**

In [None]:
# Variaciones de 'n' elementos tomados de a 'r'
# hay repetición
# O(1) -> calcular número

r = 2  # tomados de a 2, por ejemplo
variaciones_rep = len(lista) ** r
print(variaciones_rep)

## Los valores están precargados en un estructura sugerida por el grupo.

**a) Máximo**

In [3]:
# Se puede utilizar un Heap de máximos
# Colocar todos los elementos en el Heap es O(n)
# Obtener el máximo es O(1)
#
# El heap implmentado es de mínimos,
# para que sea de máximos, se multiplica
# cada valor por -1 y se invierte el orden.
# Luego, cuando se retiran se lo vuelve a
# multiplicar por -1.

from heapq import heappop, heappush

h = []

for v in vector:
    heappush(h, -v)
    
maximo = -heappop(h)

print(maximo)

99


**b) Media** 

In [4]:
# No importa la estructura que se utilice,
# se deben recorrer todos los elementos
# para poder calcular la media.
#
# Se puede utilizar cualquiera de las estructuras
# previamente mencionadas.
#
# Siempre será O(n)

**c) Moda**

In [9]:
# Se cargan los valores del
# vector en un 'diccionario' y se guardan
# como valor un contador que se aumenta
# cada vez que se encuentre una nueva aparición
# del mismo elemento -> O(n)
#
# Luego se genera un heap de máximos
# con las tuplas (valor, ocurrencias)
#   -> O(k*log(k)) con k = cantidad de números
#                             diferentes.
# 
# Finalmente se obtine el primer elemento
# que es el máximo de ocurrecias -> O(1)
#
# Espacio: O(k) [k: cantidad de elementos diferentes
#    peor caso -> O(n)] + O(n) [vector incial]
#  -> resultado: O(n)

from heapq import heappop, heappush

d = {}

for val in vector:
    if val not in d:
        d[val] = 1
    else:
        d[val] += 1

its = list(d.items())

h = []

for e in its:
    heappush(h, (-e[1], e[0]))
    
m = heappop(h)

moda = m[1]
valor = -m[0]

print("Moda: {} con valor: {}".format(moda, valor))

Moda: 93 con valor: 5


**d) Mediana**

In [None]:
# La mejor opción es utilizar
# un vector, ordenarlo y dependiendo
# del tamaño hacer:
#
# Par:
#    mediana = media(ordenado[len(v)/2], ordenado[len(v)/2+1])
# Impar:
#    mediana = ordenado[len(v)/2]
#

**e) Desviación estándar**

In [None]:
# Teniendo calculada la Media,
# la desviación estándar, depende de
# todos los elementos del vector,
# con lo cual, es independiente
# de la estructura utilizada.
# 
# Siempre será O(n)

**f) Permutaciones del conjunto**

In [10]:
# Se calculan las ocurrencias
# de cada uno de los elementos,
# guardándolas en un diccionario.
# 
# Se calculan las permutaciones
# como: n!/(p1!*p2!*..*pk!)

d = {}

for val in vector:
    if val not in d:
        d[val] = 1
    else:
        d[val] += 1

ocurrencias = map(lambda x: x[1], list(d.items()))

apariciones = reduce(lambda x,y: x * y, [factorial(o) for o in ocurrencias])

permutaciones = factorial(len(vector))//apariciones

print(permutaciones)

110395787286456461842842599341296715649860298498740699417352369091606146790815696360984479187544674926067021074194549964800000000000000000000000


**g) Variaciones del conjunto tomados de r elementos (r«n)**

In [None]:
# Es calcular un número que
# depende del tamaño del vector
# y de la cantidad de elementos a
# tomar: v = n!/(n-r)!

**h) Variaciones con repetición del conjunto de r elementos (r«n)**

In [None]:
# Es calcular un número
# que depende de len(v) y de
# la cantidad de elementos a tomar:
# v = n**r