# Introdução a Machine Learning

![image.png](http://www.santodigital.com.br/wp-content/uploads/2017/09/5-exemplos-de-uso-do-machine-learning-em-empresas.jpg)

#### Objetivos

+ Entender conceitos fundamentais de machine learning
+ Diferenciar aplicação de algoritmos de classificação, predição, recomendação e regressão. 
+ Entender conceitos de aprendizado supervisionado, não supervisionado e aprendizado com reforço
+ Aplicar decision tree com dataset do Spotify




*** Machine Learning *** O aprendizado de máquina (machine learning) é um ramo da inteligência artificial (AI) que é estudado desde a década de 60, nos ultimos anos tecnicas de machine learning ganharam muita força devido a avanços em data mining e big data. 

A ideia principal de algoritmos de machine learning é ensinar a máquina a partir de exemplos, ou seja sem programa-la explicitamente construindo *** algoritmos genéricos *** baseados nos dados disponíveis. Por exemplo um algoritmo que foi criado para detectar alfabetos maiúsculos e minúsculos também pode ser usado para classificar e-mails com spam e sem spam.

O cientista da computação [Tom M. Mitchell](https://en.wikipedia.org/wiki/Tom_M._Mitchell) citou o seguinte texto:

*“A computer program is said to learn from experience E with some class of tasks T and performance measure P if its performance at tasks in T, as measured by P, improves with experience E.” *

“Um programa de computador que é encarregado de uma classe de  tarefas T tem sua performance medida por P, se o programa adquire experiência E na tarefa T seu desempenho P aumenta em função de E." (tradução livre)

Considerando um jogo de xadrez 

* E = Experiência do algoritmo em jogos de xadrez
* T = Tarefa de jogar xadrez
* P = Probabilidade de vencer o proximo jogo

![image.png](https://slideplayer.com.br/slide/358312/2/images/35/Curva+de+aprendizagem.jpg)



## Porquê estudar machine learning

Existem problemas que consistem em encontrar padrões em dados possíveis apenas para cérebros humanos, porém quanto maior a quantidade de dados disponíveis maior o tempo disprendido para que a tarefa seja realizada, neste ponto que a machine learning entra em ação. O objetivo do machine learning é tornar possível que a máquina aprenda por sí mesma de forma semelhante a humana, tal estratégia deu tão certo que o machine learning está presente em tantos segmentos de tecnologia que nem percebemos.

## Tipos de Machine Learning

+ *** Aprendizado Supervisionado ***
+ *** Aprensizado não supervisionado ***
+ *** Aprendizado por reforço ***

![image.png](https://cdn-images-1.medium.com/max/1398/0*_cgWPP25djXBauNZ.png)


### Aprendizado Supervisionado

Na prática o aprendizado supervisionado é o tipo mais utilizado em aplicações de machine learning.
No aprendizado supervisionado o algoritmo tenta aprender a partir de exemplos alimentados previamente ao sistema, onde o são buscados padrões que identificam um comportamento e presume-se que tais padrões se repetem no futuro.

Matematicamente falando temos uma entrada X e uma saída Y, onde pode usar um algoritmo que encontra uma função que é capaz de mapear a saída em função da entrada, pode-se expressar como:

$$ Y = f(X) $$

Exemplo:

![image.png](https://cdn-images-1.medium.com/max/800/1*GE2joNHaJKIKIiwxT5jE4Q.png)



### Lista de algoritmos mais encontrados

+ Nearest Neighbor
+ Naive Bayes
+ Decision Trees
+ Linear Regression
+ Support Vector Machines (SVM)
+ Neural Networks


Existem dois tipos de algoritmos de machine learning que utilizam a filosofia de aprendizagem supervisionada, chamados ***classificação*** e ***regressão***.

#### Algoritmos de classificação:
Um algoritmo de classificação é usado quando possuímos uma variável de entrada e a saída está relacionada a qual grupo tal entrada pertence, exemplo: Classificação por cores, ou gênero musical.

![image.png](https://cdn-images-1.medium.com/max/1600/1*PM4dqcAe6N7kWRpXKwgWag.png)

#### Algoritmos de regressão:
Um problema de regressão é quando a variável de saída é um valor real, como "peso" ou "altura".

![image.png](https://3qeqpr26caki16dnhd19sv6by6v-wpengine.netdna-ssl.com/wp-content/uploads/2013/11/ensemble.png)

## Aprendisado Não supervisionado

![img.png](https://www.tecnologiae.com.br/wp-content/uploads/2017/04/aprendizagem-maquina-e1493300647272.png)

Na aprendizagem não supervisionada os algoritmos não possuem variáveis de saída correspondente a seus dados de entrada, portanto diferente do aprendizado supervisionado não existem respostas corretas e a máquina que tem a função de encontrá-las. 

Essa família de algoritmos é usada principalmente na detecção de padrões e modelagem descritiva. Esses algoritmos usam técnicas nos dados de entrada para criar regras, detectar padrões e agrupar os pontos de dados que ajudam a obter insights significativos que descrevem melhor os dados para o usuário. 


#### Algoritmos mais comuns:
+ k-means clustering, Association Rules

![image.png](https://ds055uzetaobb.cloudfront.net/image_optimizer/ff1732816ba08239c0d3b200c3a9708070885705.jpg)

## Aprendizado por reforço

Algoritmos baseados em aprendisado por reforço são aplicados em casos onde é necessário interagir com o ambiente de modo dinâmico e realizar um objetivo específico (como dirigir um carro). O programa recebe feedback em termos de recompensas e punições enquanto navega pelo espaço do problema.

Com esse algoritmo, a máquina é treinada para tomar decisões específicas com treino contínuo a partir de tentativa e erro. 

"A aprendizagem por reforço é um paradigma computacional de aprendizagem em que um agente aprendiz procura maximizar uma medida de desempenho baseada nos reforços (recompensas ou punições) que recebe ao interagir com um ambiente desconhecido (Ribeiro, C. H. C. (1999)). Mais especificamente, o agente atua em um ambiente formado por um conjunto de possíveis estados, e pode escolher ações dentro de um conjunto de ações possíveis. Ele recebe um valor de reforço cada vez que executa uma ação, indicando o valor imediato da transição de estado resultante. Ao longo do tempo, isto produz uma seqüência de pares estado-ação e respectivos valores de reforço. A tarefa do agente é aprender uma política de controle (seqüência de ações) que maximize a soma esperada destes reforços, descontando (usualmente de modo exponencial) as recompensas ou punições proporcionalmente ao seu atraso temporal. " [fonte](http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0103-17592004000300008)


![img.png](https://cdn-images-1.medium.com/max/800/1*koj-1K7EmiERGx9l_Okjnw.png)



## Bibliotecas Python



![img.png](http://www.marekrei.com/blog/wp-content/uploads/2016/01/CYh2GMnWkAELDTL.jpg)

A maioria dos algoritmos já estão implementados e as bibliotecas abaixo tornam possível seu uso em diferentes níveis de abstração

+ [scikit-learn (machine learning algorithms)](http://scikit-learn.org/) 
+ [TensorFlow (deep learning with neural networks)](https://github.com/tensorflow/tensorflow)
+ [theano (deep learning with neural networks)]()
+ [keras (high-level neural networks API)](https://keras.io/)

# Resumo

A figura abaixo resume a utilização dos algoritmos

![image.png](https://cdn-images-1.medium.com/max/800/1*ZCeOEBhvEVLmwCh7vr2RVA.png)




*** REFERÊNCIAS ***  

https://towardsdatascience.com/decision-trees-in-machine-learning-641b9c4e8052

https://towardsdatascience.com/introduction-to-machine-learning-db7c668822c4

https://towardsdatascience.com/machine-learning/home

https://www.kaggle.com/geomack/spotifyclassification

https://towardsdatascience.com/decision-trees-in-machine-learning-641b9c4e8052

