# Implementación de LIBMF en Python


- Aide Jazmín González Cruz
- Yusuri Arciga Reyes
- Karina Lizette Gamboa Puente
- Oscar Arturo Bringas López


### Instalación:

Antes de usar la librería `libmf` se necesita instalar usando la instrucción en bash o en un pyenv, dependiendo donde se este trabajando.

**$ pip install libmf**


Importando librerías necesarias

In [1]:
from libmf import mf
import random as r
import numpy as np
import pandas as pd
import csv
import src.utils as utils

Using file found in /home/aide/.pyenv/versions/itam_intro_to_ds/lib/python3.7/site-packages:
/home/aide/.pyenv/versions/itam_intro_to_ds/lib/python3.7/site-packages/libmf.cpython-37m-x86_64-linux-gnu.so


Leyendo `data sets`

In [2]:
# Train data set
df_train = pd.read_csv("01dataBaseTrainTrxRec.csv")
# Test data set
df_test = pd.read_csv("05dataBaseTestKeyRec.csv")

Seleccionando variables de entrenamiento

In [3]:
train = df_train[["codCliente", "codEstab", "ratingMonto"]]
train.head(5)

Unnamed: 0,codCliente,codEstab,ratingMonto
0,7649,43629,0.014072
1,24604,4326,0.001667
2,15289,4326,0.000127
3,5190,59776,0.001167
4,16635,31043,0.047386


Guardando datos en archivo txt (necesarios para implementación en R)

In [9]:
train.to_csv('train.txt', sep=" ", quoting=csv.QUOTE_NONE, escapechar=" ", header=False)
df_test.to_csv('test.txt', sep=" ", quoting=csv.QUOTE_NONE, escapechar=" ", header=False)

La librería de `libmf` trabaja con arreglos, por lo que se transforma los `data set` en este formato:

In [4]:
A = train.to_numpy()
T = df_test.to_numpy()

Creamos el objeto `MF` de la librería `libmf`:

In [5]:
engine = mf.MF()

Asignamos valores a los parámetros para hacer comparable el método con lo que se corre en R.

In [6]:
engine.k = 10 # Latent values
engine.nr_theads = 1 # Hilos
engine.fun = 1 # MAE

Se entrena llamando al método `fit`

In [7]:
r.seed(123)
engine.fit(A)

Se hace la predicción usando el `data set` test:

In [8]:
engine.predict(T)

array([13839.422, 20401.754, 17943.264, ..., 27500.432, 18346.553,
       28664.438], dtype=float32)

Se obtiene el *cross validation*

In [9]:
engine. mf_cross_validation(A)

16276.000029536543

Con esta librería no se pueden obtener directamente los factores $P$ y $Q$, ya que sólo son métodos

In [10]:
p = engine.p_factors
p

<bound method MF.p_factors of <libmf.mf.MF object at 0x7f74926403d0>>

In [11]:
q = engine.q_factors
q

<bound method MF.q_factors of <libmf.mf.MF object at 0x7f74926403d0>>

La documentación de `libmf` para Python es muy escaso por lo que dejamos esta implementación hasta esta parte. Sin embargo se logró obtener la predicción.

**Referencias:**
    

- [libmf](https://github.com/cjlin1/libmf)
- [python-libmf](https://github.com/PorkShoulderHolder/python-libmf/tree/master/libmf)
    