learninspy/core/neurons.py

#!/usr/bin/env python
# -*- coding: utf-8 -*-

"""
En este módulo se implementa un esquema de "neuronas" para manejar los arreglos referidos
a pesos sinápticos en las capas de una red neuronal. Ello implica tanto operaciones algebraicas
sobre matrices y vectores como la aplicación de funciones de activación y costo.
"""

__author__ = 'leferrad'

from learninspy.utils.asserts import *

import pyspark.rdd


"""
# Queda experimental ...
class DistributedNeurons(object):
    # Vectores son guardados como vectores columna
    def __init__(self, mat, shape):
        if isinstance(mat, pyspark.rdd.PipelinedRDD):
            self.matRDD = mat
        else:  # mat es un np.array
            if len(shape) == 1:
                shape += (1,)  # Le agrego la dimension que le falta
            if shape[1] != 1:
                mat = mat.T  # Guardo por columnas
                if shape[0] == 1:
                    shape = shape[::-1]  # Invierto para que sea vector columna
            self.matRDD = sc.parallelize(mat)

        self.rows = shape[0]
        self.cols = shape[1]

    # OPERADORES:

    def __mul__(self, other):
        return DistributedNeurons(self.matRDD.map(lambda x: x * other), self.shape)

    def __div__(self, other):
        return DistributedNeurons(self.matRDD.map(lambda x: x / other), self.shape)

    def __add__(self, other):
        rdd = other.matrix()
        return DistributedNeurons(self.matRDD.zip(rdd).map(lambda (x, y): x + y), self.shape)

    def __sub__(self, other):
        rdd = other.matrix()
        return DistributedNeurons(self.matRDD.zip(rdd).map(lambda (x, y): x - y), self.shape)

    def __pow__(self, power, modulo=None):
        return DistributedNeurons(self.matRDD.map(lambda x: x ** power), self.shape)

    # TRANSFORMACIONES:
    @assert_sametype
    @assert_samedimension
    def mul_elemwise(self, rdd):
        rdd = rdd.matrix()
        return DistributedNeurons(self.matRDD.zip(rdd).map(lambda (x, y): x * y), self.shape)

    @assert_sametype
    @assert_samedimension
    def sum_array(self, rdd):
        rdd = rdd.matrix()
        return DistributedNeurons(self.matRDD.zip(rdd).map(lambda (x, y): x + y), self.shape)

    def activation(self, fun):
        return DistributedNeurons(self.matRDD.map(lambda x: fun(x)), self.shape)

    @assert_sametype
    @assert_samedimension
    def mse_d(self, y):
        y = y.matrix()
        n = self.count()
        error = self.matRDD.zip(y).map(lambda (o, t): t - o)
        errorDiv = error.map(lambda val: val * (2.0 / n))
        return DistributedNeurons(errorDiv, self.shape)

    def dropout(self, p):
        # Aplicable para vectores unicamente
        index = np.random.rand(*self.shape) > p
        indexRDD = sc.parallelize(index)  # Vector RDD de bools, que indican que valor "tirar"
        # Notar que se escala el resultado diviendo por p
        # Retorno arreglo con dropout, y el vector con indices de las unidades "tiradas"
        zipped = self.matRDD.zip(indexRDD)
        dropped = zipped.map(lambda (x, y): (x * y) / p)
        return DistributedNeurons(dropped, self.shape), indexRDD

    def zip(self, rdd):
        return self.matRDD.zip(rdd)

    # ACCIONES:

    def mul_array(self, array): # Lento
        # Ver decoradores para chequear dimensiones validas
        if isinstance(array, np.ndarray):
            array = DistributedNeurons(array, array.shape)
        return self.mul_arrayrdd(array)

    def mul_array2(self,array):  #Uso operaciones de numpy
        if isinstance(array, DistributedNeurons) or isinstance(array, pyspark.rdd.PipelinedRDD):
            array = array.collect()
        shape = self.rows, array.shape[1]
        return DistributedNeurons(self.collect().dot(array), shape)

    @assert_sametype
    @assert_matchdimension
    def mul_arrayrdd(self, rdd):
        # Supongo que la matriz que multiplica a rdd esta transpuesta
        shape = self.rows, rdd.cols  # mul es un np.ndarray
        rdd = rdd.matrix()
        zipped = self.matRDD.zip(rdd)
        mapped = zipped.map(lambda (col, row): np.outer(col, row))
        mul = mapped.reduce(lambda x, y: x + y)
        if shape[1] == 1:  # Si es vector columna
            mul = mul.reshape(-1)  # lo redimensiono para que sea 1D
        return DistributedNeurons(mul, shape)

    @assert_sametype
    @assert_matchdimension
    def mul_arrayrdd2(self, rdd): # No anda bien pq devuelve un vector fila (en el reduce)
        # Supongo que la matriz que multiplica a rdd esta transpuesta
        shape = self.rows, rdd.cols  # mul es un np.ndarray
        rdd = rdd.matrix()
        zipped = self.matRDD.zip(rdd)
        mapped = zipped.map(lambda (col, row): (1, np.outer(col, row)))
        mul = mapped.reduceByKey(lambda x, y: x + y).map(lambda (k, v): v)
        if shape[1] == 1: # Si es vector columna, redimensiono para que sea 1D
            mul = mul.map(lambda col: col.reshape(-1))
        return DistributedNeurons(mul, shape)

    def outer(self, array):
        if isinstance(array, DistributedNeurons) or isinstance(array, pyspark.rdd.PipelinedRDD):
            array = array.collect()
        mat = self.collect()
        res = np.outer(mat, array)
        shape = res.shape
        return DistributedNeurons(res, shape)

    @assert_sametype
    @assert_samedimension
    def dot(self, rdd):
        rdd = rdd.matrix()
        return self.mul_elemwise(rdd).sum()

    def l1(self):
        gradient = self.matRDD.map(lambda x: np.sign(x))
        cost = self.matRDD.map(lambda x: abs(x).sum()).sum()
        return cost, DistributedNeurons(gradient, self.shape)

    def l2(self):
        gradient = self.matRDD
        cost = self.matRDD.map(lambda x: (x ** 2).sum()).sum()
        return cost, DistributedNeurons(gradient, self.shape)

    def loss(self, fun, y):
        y = DistributedNeurons(y, y.shape)
        return self.mse(y)

    def loss_d(self, fun, y):
        y = DistributedNeurons(y, y.shape)
        return self.mse_d(y)

    @assert_sametype
    @assert_samedimension
    def mse(self, y):
        y = y.matrix()
        n = self.count()
        error = self.matRDD.zip(y).map(lambda (o, t): (t - o) ** 2)
        sumError = error.sum()
        return sumError / (1.0 * n)

    def softmax(self):
        # Uso de tip de implementacion (http://ufldl.stanford.edu/wiki/index.php/Exercise:Softmax_Regression)
        maxmat = self.matRDD.max()
        matminus = self.matRDD.map(lambda x: x - maxmat)
        exp = np.exp
        matexp = matminus.map(lambda o: exp(o))
        sumexp = matexp.sum()
        softmat = matexp.map(lambda o: o / sumexp)
        return DistributedNeurons(softmat, self.shape)

    def collect(self):
        return np.array(self.matRDD.collect()).T  # Se transpone para retornar por filas

    def sum(self):
        return self.matRDD.sum()

    # MISC

    def persist(self):
        self.matRDD.cache()
        return

    def unpersist(self):
        self.matRDD.unpersist()
        return

    @property
    def shape(self):
        return self.rows, self.cols

    def count(self):
        rows, cols = self.shape
        return rows * cols

    def matrix(self):
        return self.matRDD

"""
# ----------------------------


class LocalNeurons(object):
    """
    Clase principal para representar los pesos sinápticos **W** de una red neuronal
    y el vector de bias **b**. Provee funcionalidades algebraicas para operar matrices y vectores,
    así como también normas regularizadoras y la aplicación de funciónes de activación y de costo.
    No obstante, esta clase es usada directamente por :class:`.NeuralLayer`, por lo cual
    no es herramienta de libre utilidad.

    .. note:: Es preciso aclarar que su estructuración se debe a que está pensada para ser compatible con su par *DistributedNeurons*, pero que en esta versión se encuentra inhabilitada.

    :param mat: numpy.array o list o pyspark.rdd.RDD, que corresponde a la matriz **W**
                o vector **b** a alojar para operar.
    :param shape: tuple, que corresponde a la dimensión que debe tener *mat*. Útil sólo cuando se
                utilizan arreglos distribuidos.

    >>> shape = (5,3)
    >>> w = np.asarray(np.random.uniform(low=-np.sqrt(6.0 / (shape[0] + shape[1])), \ ...
    >>>                high=+np.sqrt(6.0 / (shape[0] + shape[1])),
    >>>                size=shape), dtype=np.dtype(float))
    >>> weights = LocalNeurons(w, shape)

    """
    # NOTA: Vectores son guardados como vectores columna
    def __init__(self, mat, shape):

        if isinstance(mat, pyspark.rdd.RDD):
            mat = mat.collect()
        if len(shape) == 1:
            shape += (1,)  # Le agrego la dimension que le falta
        if isinstance(mat, list):
            mat = np.array(mat)
        self.matrix = mat.reshape(shape)
        self.rows = shape[0]
        self.cols = shape[1]

    # ### Operadores ###

    def __mul__(self, other):
        if isinstance(other, LocalNeurons):
            other = other.matrix
        return LocalNeurons(self.matrix * other, self.shape)

    def __div__(self, other):
        if isinstance(other, LocalNeurons):
            other = other.matrix
        return LocalNeurons(self.matrix / other, self.shape)

    def __sub__(self, other):
        if isinstance(other, LocalNeurons):
            other = other.matrix
        return LocalNeurons(self.matrix - other, self.shape)

    def __add__(self, other):
        if isinstance(other, LocalNeurons):
            other = other.matrix
        return LocalNeurons(self.matrix + other, self.shape)

    def __pow__(self, power, modulo=None):
        return LocalNeurons(self.matrix ** power, self.shape)

    def __eq__(self, other):
        return np.array_equiv(self.matrix, other)

    #def __sizeof__(self):
    #    return self.matrix.nbytes + sys.getsizeof(self.rows) + sys.getsizeof(self.cols)  # TODO: mejorar estimación

    # ### Operaciones algebraicas ###

    @assert_matchdimension
    def mul_array(self, array):
        """
        Realiza el producto matricial entre el arreglo alojado *self.matrix* y *array*.

        :param array: numpy.array o :class:`~learninspy.core.neurons.LocalNeurons`
        :return: :class:`~learninspy.core.neurons.LocalNeurons`
        """
        if isinstance(array, LocalNeurons):
            array = array.matrix
        arrshape = array.shape
        if len(arrshape) == 1:
            arrshape += (1,)  # Le agrego la dimension que le falta
        shape = self.rows, arrshape[1]
        return LocalNeurons(self.matrix.dot(array), shape)

    def outer(self, array):
        """
        Producto exterior entre vectores. Equivalente a *numpy.outer*.

        :param array: numpy.array o :class:`~learninspy.core.neurons.LocalNeurons`
        :return: :class:`~learninspy.core.neurons.LocalNeurons`
        """
        if isinstance(array, LocalNeurons):
            array = array.matrix
        res = np.outer(self.matrix, array)
        shape = res.shape
        return LocalNeurons(res, shape)

    @assert_samedimension
    def mul_elemwise(self, array):
        """
        Producto elemento a elemento con *array*. Equivalente a utilizar *numpy.multiply* entre dos arreglos.

        :param array: numpy.array o :class:`~learninspy.core.neurons.LocalNeurons`
        :return: :class:`~learninspy.core.neurons.LocalNeurons`

        .. note:: el arreglo *array* debe tener igual dimensión que el arreglo *self.matrix* alojado.
        """
        if isinstance(array, LocalNeurons):
            array = array.matrix
        return LocalNeurons(np.multiply(self.matrix, array), self.shape)

    @assert_samedimension
    def sum_array(self, array):
        """
        Suma elemento a elemento con *array*.

        :param array: numpy.array o :class:`~learninspy.core.neurons.LocalNeurons`
        :return: :class:`~learninspy.core.neurons.LocalNeurons`

        .. note:: el arreglo *array* debe tener igual dimensión que el arreglo *self.matrix* alojado.
        """
        if isinstance(array, LocalNeurons):
            array = array.matrix
        return LocalNeurons(self.matrix + array, self.shape)

    def sum(self, axis=None):
        """
        Suma de los elementos del arreglo alojado. Equivalente a *numpy.array.sum*

        :param axis: None o int o tuple de ints, optional. Indicando dimensión/es a tomar en la suma.
        :return: numpy.array
        """
        return np.sum(self.matrix, axis=axis)

    def transpose(self):
        """
        Transpone el arreglo alojado en la instancia. Equivale a *numpy.array.transpose()*.

        :return: :class:`~learninspy.core.neurons.LocalNeurons`
        """
        return LocalNeurons(self.matrix.transpose(), self.shape[::-1])

    # ### Funciones de activación ###

    def activation(self, fun):
        """
        Aplica una función de activación *fun* sobre cada entrada del arreglo *self.matrix* alojado.

        :param fun: función soportada en :mod:`~learninspy.core.activations`.
        :return: :class:`~learninspy.core.neurons.LocalNeurons`
        """
        return LocalNeurons(map(lambda x: fun(x), self.matrix), self.shape)

    def softmax(self):
        """
        Aplica la función *Softmax* sobre el vector alojado.
        Ver más info en Wikipedia: `Softmax function <https://en.wikipedia.org/wiki/Softmax_function>`_

        :return: numpy.ndarray
        """
        # Uso de tip de implementacion (http://ufldl.stanford.edu/wiki/index.php/Exercise:Softmax_Regression)
        x = self.matrix
        x = x - max(x)  # Se previene llegar a valores muy grandes del exp(x)
        exp_x = np.exp(x)
        softmat = exp_x / sum(exp_x)
        return LocalNeurons(softmat, self.shape)

    # ### Funciones de error ###

    def loss(self, fun, y):
        """
        Aplica una función de error entre el vector almacenado y la entrada *y*.

        :param fun: función soportada en :mod:`~learninspy.core.loss`
        :param y: list o numpy.ndarray
        :return: float
        """
        return fun(self.matrix, y)

    def loss_d(self, fun, y):
        """
        Aplica una función derivada de error entre el vector almacenado y el vector *y*.

        :param fun: función derivada soportada en :mod:`~learninspy.core.loss`
        :param y: list o numpy.ndarray
        :return: :class:`~learninspy.core.neurons.LocalNeurons`
        """
        return LocalNeurons(fun(self.matrix, y), self.shape)

    # ### Normas de regularización sobre pesos ###

    def dropout(self, p, seed=123):
        """
        Aplica DropOut [srivastava2014dropout]_ sobre el arreglo alojado, anulando sus elementos con una probabilidad *p*.

        El resultado es un arreglo con entradas aleatoriamente anuladas con probabilidad *p*,
        y la máscara o arreglo binario de igual dimensión que el anterior,
        en donde se almacena *1* en las entradas donde respectivamente se aplicó DropOut y *0* en el resto.

        :param p: float, tal que :math:`0<p<1`
        :return: tuple de :class:`~learninspy.core.neurons.LocalNeurons`, numpy.ndarray

        **Referencias**:

        .. [srivastava2014dropout] Srivastava, N., Hinton, G., Krizhevsky, A., Sutskever, I., & Salakhutdinov, R. (2014):
            "Dropout: A simple way to prevent neural networks from overfitting".
            The Journal of Machine Learning Research, 15(1), 1929-1958.
        """
        np.random.seed(seed)
        # Aplicable para vectores unicamente
        index = np.random.rand(*self.shape) > p  # Vector de bools, que indican que valor "tirar"
        # Notar que se escala el resultado diviendo por p
        # Retorno arreglo con dropout, y el vector con indices de las unidades "tiradas"
        dropped = self.matrix * index / p
        return LocalNeurons(dropped, self.shape), index

    def l1(self):
        """
        Norma **L1** sobre la matriz almacenada.
        Se retorna una tupla con el resultado y además el gradiente de dicha norma.

        :math:`L_1(W)=\displaystyle\sum\limits_{i}^{n_{rows}} \sum\limits_{j}^{n_{cols}} |W_{i,j}|, \quad
        \\dfrac{\partial}{\partial W_{i,j}} L_1(W)= sign(W_{i,j})`

        :return: tuple de float, :class:`~learninspy.core.neurons.LocalNeurons`

        .. note:: El cálculo no suele aplicarse a un vector de bias *b*,
            ya que afecta poco en el resultado final.
        """
        cost = sum(sum(abs(self.matrix)))
        gradient = np.sign(self.matrix)  # en x=0 no es diferenciable, pero que sea igual a 0 la derivada anda bien
        return cost, LocalNeurons(gradient, self.shape)

    def l2(self):
        """
        Norma **L2** sobre la matriz almacenada.
        Se retorna una tupla con el resultado y además el gradiente de dicha norma.

        :math:`L_2(W)=\\dfrac{1}{2} \displaystyle\sum\limits_{i}^{n_{rows}} \sum\limits_{j}^{n_{cols}} (W_{i,j})^2, \quad
        \\dfrac{\partial}{\partial W_{i,j}} L_2(W)= W_{i,j}`

        :return: tuple de float, :class:`~learninspy.core.neurons.LocalNeurons`

        .. note:: El cálculo no suele aplicarse a un vector de bias *b*,
            ya que afecta poco en el resultado final.
        """
        cost = sum(sum(self.matrix ** 2)) * 0.5  # Multiplico por 0.5 para hacer mas simple el gradiente
        gradient = self.matrix
        return cost, LocalNeurons(gradient, self.shape)

    # ### Misc ###

    @property
    def shape(self):
        """
        Dimensiones del arreglo alojado.

        :return: tuple
        """
        return self.rows, self.cols

    def count(self):
        """
        Cantidad de elementos de la matriz almacenada. Siendo MxN las dimensiones, retorna el producto de ambas.

        :return: int
        """
        return self.rows * self.cols

    def collect(self):
        """
        Retorna el arreglo alojado.

        :return: numpy.ndarray
        """
        return self.matrix