# ⭐Machine Learning 👩‍🏫

💙🧡💚🤓

¿Alguna ves has escuchado el término de machine learning o aprendizaje automático?, ¿Es algo que está de moda? ¿Realmente es útil? ¿Es para científicos y súper computadoras?🤔.  El machine learning es una disciplina ligada a la inteligencia artificial y a la estadística que le permite a nuestros ordenadores aprender a resolver problemas sin ser explícitamente programados para ello. El resultado que obtenemos con machine learning son algoritmos capaces de hacer predicciones y tomar decisiones sin programación previa y con datos que no han visto nunca. 😮🤖

Vamos a crear un juego de piedra, papel o tijeras entrenando una red neuronal, la cual aprenderá a juegar y a ganar. Con este pequeño tutorial veras que con algunas herramientas ya estarás entrenado tu primer algoritmo de aprendizaje automático. 

### Creamos una lista para las opciones de nuestro juego 🎲



Una lista es una estructura de datos, los cuales pueden ser compuestos pero su cantidad no varía a lo largo del tiempo. La notación para lista es una secuencia de valores encerrados entre corchetes y separados por comas. Para nuestro caso tenemos una lista de opciones del juego.

In [1]:
options = ["piedra", "tijeras", "papel"]

Hacemos una pequeña función donde escribimos las reglas del juego, Tenemos dos jugadores llamados p1 y p2 y vamos a ver cuáles son las opciones para ganar.

In [2]:
def search_winner(p1, p2):
    if p1 == p2:
        result = 0
    
    elif p1 == "piedra" and p2 == "tijeras":
        result = 1
    elif p1 == "piedra" and p2 == "papel":
        result = 2
    elif p1 == "tijeras" and p2 == "piedra":
        result = 2
    elif p1 == "tijeras" and p2 == "papel":
        result = 1
    elif p1 == "papel" and p2 == "piedra":
        result = 1
    elif p1 == "papel" and p2 == "tijeras":
        result = 2
        
    return result

Probamos de la función que acabamos de crear  y vemos el resultado

In [3]:


search_winner("papel", "tijeras")



2

In [4]:
search_winner("tijeras","tijeras")

0

⚡Creamos  un pequeño test, para seguir haciendo pruebas. Además hacemos una iteración y pintamos la validación del test

In [6]:


test = [
    ["piedra", "piedra", 0],
    ["piedra", "tijeras", 1],
    ["piedra", "papel", 2]
]

for partida in test:
    print("player1: %s player2: %s Winner: %s Validation: %s" % (
        partida[0], partida[1], search_winner(partida[0], partida[1]), partida[2]
    ))
    

player1: piedra player2: piedra Winner: 0 Validation: 0
player1: piedra player2: tijeras Winner: 1 Validation: 1
player1: piedra player2: papel Winner: 2 Validation: 2


⚡Después, se crea una pequeña función que sea random, para el jugador 1 y el jugador 2

In [7]:
from random import choice
def get_choice():
    return choice(options)

⚡Una pequeña prueba, para ver nuestros resultados con la función random

In [8]:
for i in range(10):
    player1 = get_choice()
    player2 = get_choice()
    print("player1: %s player2: %s Winner: %s " % (
        player1, player2, search_winner(player1, player2)
    ))

player1: tijeras player2: papel Winner: 1 
player1: tijeras player2: piedra Winner: 2 
player1: papel player2: tijeras Winner: 2 
player1: papel player2: papel Winner: 0 
player1: tijeras player2: tijeras Winner: 0 
player1: piedra player2: papel Winner: 2 
player1: piedra player2: tijeras Winner: 1 
player1: piedra player2: piedra Winner: 0 
player1: piedra player2: tijeras Winner: 1 
player1: tijeras player2: papel Winner: 1 


# Red Neuronal 🧠

Empecemos con nuestra red neuronal, vamos a hacer una función que convierta los string a una lista de ceros y uno para que nuestra red neuronal entienda mejor. Donde la piedra es [1,0,0], si es tijeras es [0,1,0] y si es papel es [0,0,1].
Imagínate que las maquinas se hablan entre ellas y a esto se le denomina lenguaje de maquina o código de máquina, este lenguaje es una serie de instrucciones en forma de ceros y unos las cuales se ejecutan de manera secuencial. 
                    👩‍💻

In [9]:
def str_to_list(option):
    if option=="piedra":
        res = [1,0,0]
    elif option=="tijeras":
        res = [0,1,0]
    else:
        res = [0,0,1]
    return res

data_X = list(map(str_to_list, ["piedra", "tijeras", "papel"]))
data_y = list(map(str_to_list, ["papel", "piedra", "tijeras"]))

print(data_X)
print(data_y)

[[1, 0, 0], [0, 1, 0], [0, 0, 1]]
[[0, 0, 1], [1, 0, 0], [0, 1, 0]]


⚡Ahora vamos a empezar con la red neuronal. Importamos la libreria scikit-learn.

Scikit-learn es una librería ideal para diseñar y entrenar redes neuronales, esta librería es usada por spotify, Evernote y utiliza algoritmos de clasificación, regresión y agrupamiento.

📍http://scikit-learn.org/stable/

In [10]:
from sklearn.neural_network import MLPClassifier

In [11]:
clf = MLPClassifier(verbose=False, warm_start=True)

In [12]:
model = clf.fit([data_X[0]], [data_y[0]])
print(model)

MLPClassifier(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
       beta_2=0.999, early_stopping=False, epsilon=1e-08,
       hidden_layer_sizes=(100,), learning_rate='constant',
       learning_rate_init=0.001, max_iter=200, momentum=0.9,
       nesterovs_momentum=True, power_t=0.5, random_state=None,
       shuffle=True, solver='adam', tol=0.0001, validation_fraction=0.1,
       verbose=False, warm_start=True)




⚡Hacemos una función jugar a aprender. La idea es que nuestra red neuronal empiece a aprender a ganar por medio de la experiencia.  En la función definimos la predicción que debe ser igual o superior al 95%.  

In [13]:
def play_and_learn(iters=10, debug=False):
    score = {"win": 0, "loose": 0}
    
    data_X = []
    data_y = []
    
    for i in range(iters):
        player1 = get_choice()
        
        predict = model.predict_proba([str_to_list(player1)])[0]
        
        if predict[0] >= 0.95:
            player2 = options[0]
        elif predict[1] >= 0.95:
            player2 = options[1]
        elif predict[2] >= 0.95:
            player2 = options[2]
        else:
            player2 = get_choice()
            
        if debug==True:
            print("Player1: %s Player2 (modelo): %s --> %s" % (player1, predict, player2))
        
        winner = search_winner(player1, player2)
        if debug==True:
            print("Comprobamos: p1 VS p2: %s" % winner)
        
        if winner==2:
            data_X.append(str_to_list(player1))
            data_y.append(str_to_list(player2))
            
            score["win"]+=1
        else:
            score["loose"]+=1
        
    return score, data_X, data_y

In [14]:
score, data_X, data_y = play_and_learn(1, debug=True)
print(data_X)
print(data_y)
print("Score: %s %s %%" % (score, (score["win"]*100/(score["win"]+score["loose"]))))
if len(data_X):
    model = model.partial_fit(data_X, data_y)

Player1: papel Player2 (modelo): [ 0.14636809  0.14044832  0.88290292] --> tijeras
Comprobamos: p1 VS p2: 2
[[0, 0, 1]]
[[0, 1, 0]]
Score: {'win': 1, 'loose': 0} 100.0 %


In [15]:
i = 0
historic_pct = []
while True:
    i+=1
    score, data_X, data_y = play_and_learn(1000, debug=False)
    pct = (score["win"]*100/(score["win"]+score["loose"]))
    historic_pct.append(pct)
    print("Iter: %s - score: %s %s %%" % (i, score, pct))
    
    if len(data_X):
        model = model.partial_fit(data_X, data_y)
    
    if sum(historic_pct[-9:])==900:
        break

Iter: 1 - score: {'win': 557, 'loose': 443} 55.7 %
Iter: 2 - score: {'win': 534, 'loose': 466} 53.4 %
Iter: 3 - score: {'win': 538, 'loose': 462} 53.8 %
Iter: 4 - score: {'win': 539, 'loose': 461} 53.9 %
Iter: 5 - score: {'win': 569, 'loose': 431} 56.9 %
Iter: 6 - score: {'win': 548, 'loose': 452} 54.8 %
Iter: 7 - score: {'win': 323, 'loose': 677} 32.3 %
Iter: 8 - score: {'win': 361, 'loose': 639} 36.1 %
Iter: 9 - score: {'win': 325, 'loose': 675} 32.5 %
Iter: 10 - score: {'win': 327, 'loose': 673} 32.7 %
Iter: 11 - score: {'win': 308, 'loose': 692} 30.8 %
Iter: 12 - score: {'win': 363, 'loose': 637} 36.3 %
Iter: 13 - score: {'win': 331, 'loose': 669} 33.1 %
Iter: 14 - score: {'win': 358, 'loose': 642} 35.8 %
Iter: 15 - score: {'win': 338, 'loose': 662} 33.8 %
Iter: 16 - score: {'win': 336, 'loose': 664} 33.6 %
Iter: 17 - score: {'win': 331, 'loose': 669} 33.1 %
Iter: 18 - score: {'win': 334, 'loose': 666} 33.4 %
Iter: 19 - score: {'win': 298, 'loose': 702} 29.8 %
Iter: 20 - score: {'w

Iter: 160 - score: {'win': 577, 'loose': 423} 57.7 %
Iter: 161 - score: {'win': 552, 'loose': 448} 55.2 %
Iter: 162 - score: {'win': 547, 'loose': 453} 54.7 %
Iter: 163 - score: {'win': 536, 'loose': 464} 53.6 %
Iter: 164 - score: {'win': 773, 'loose': 227} 77.3 %
Iter: 165 - score: {'win': 791, 'loose': 209} 79.1 %
Iter: 166 - score: {'win': 778, 'loose': 222} 77.8 %
Iter: 167 - score: {'win': 778, 'loose': 222} 77.8 %
Iter: 168 - score: {'win': 773, 'loose': 227} 77.3 %
Iter: 169 - score: {'win': 782, 'loose': 218} 78.2 %
Iter: 170 - score: {'win': 770, 'loose': 230} 77.0 %
Iter: 171 - score: {'win': 783, 'loose': 217} 78.3 %
Iter: 172 - score: {'win': 783, 'loose': 217} 78.3 %
Iter: 173 - score: {'win': 772, 'loose': 228} 77.2 %
Iter: 174 - score: {'win': 769, 'loose': 231} 76.9 %
Iter: 175 - score: {'win': 774, 'loose': 226} 77.4 %
Iter: 176 - score: {'win': 769, 'loose': 231} 76.9 %
Iter: 177 - score: {'win': 786, 'loose': 214} 78.6 %
Iter: 178 - score: {'win': 755, 'loose': 245} 

In [16]:


from bokeh.plotting import figure, show
from bokeh.io import push_notebook, show, output_notebook
output_notebook()

In [17]:
x = range(len(historic_pct))
y = historic_pct

p = figure(
    title="Porcetaje de aprendizaje en cada iteración",
    x_axis_label="Iter", y_axis_label="%", width=900)

p.line(x, y, legend=None, line_width=1)
show(p)

In [18]:


model.predict_proba([str_to_list("piedra")])



array([[ 0.00634374,  0.00956034,  0.98551249]])