# **O que é Machine Learning?**

**Aprendizado de máquina** é a ciência (e a arte) da programação de computadores de modo que eles possam **aprender** com os **dados**.

# **Para que serve o Machine Learning?**

Entre suas várias utilidades, vale ressaltar:


*   Analisar dados e prever um determinado valor;
    *   A regressão é um termo utilizado para quando tentamos encontrar uma relação entre variáveis. Essa é uma típica tarefa de aprendizado supervisionado, o qual deseja-se estimar o valor, dada uma entrada de uma característica (geralmente, existem varias features de entrada e, as vezes, diversos valores de saídas). Os rótulos são fornecidos na etapa de treinamento.
*   Processamento de linguagem natural;
*   Detecção de anomalias;
*   Análise de padrões (classificação e clusterização);
    *   A **classificação** é uma típica tarefa de aprendizado supervisionado, cujo o objetivo é classificar objetos baseado nas features e rótulos fornecidos.
    *   A **clusterização** é um método de segmentação de dados que partilham tendências e padrões semelhantes. Este tipo de estudo não tem uma variável dependente. É uma típica tarefa de aprendizado não supervisionado, o qual o algoritmo identifica as características semelhantes no conjunto de dados e realiza a segmentação destes em grupos com características semelhantes.
*   Criar um bot inteligente para um jogo;





# **Tipos de Aprendizados**

Os aprendizados podem ser dividos conforme alguns critérios, os quais é possível combiná-los, dependendo do problema a ser solucionado:

*   Ser ou não treinado com supervisão humana (supervisionado, não supervisionado, semi-supervisionado e aprendizado por reforço);
*   Aprender gradativamente com os dados em tempo real (aprendizado online x aprendizado em batch);
*   Se funcionam comparando dados antigos com dados novos ou se detectam padrões em dados de treinamento (aprendizado baseado em instâncias vs aprendizado baseado em modelo)

Para a primeira possibilidade, o link abaixo traz uma explicação para tal:

http://www2.decom.ufop.br/terralab/tipos-de-aprendizado-de-maquina-e-algumas-aplicacoes/



## **Aprendizado Supervisionado**

O **aprendizado supervisionado** é um paradigma de aprendizado de máquina, que tem como objetivo adquirir informações de relacionamento entre entrada e saída de um sistema, baseado em um conjunto de amostras de treinamento. 

Um algoritmo de aprendizado supervisionado analisa os dados de treino e produz uma função inferida que será utilizada para mapear novos exemplos. Para deixar menos abstrato, a classificação de emails como Spam ou não Spam são utilizam técnicas de aprendizado supervisionado.

<center><img src="img/exemploClassificacao.png?raw=1" alt="Drawing" style="width: 600px;height: 400px"/></center>

### **Classificação**

A classificação é o processo de categorizar um determinado conjunto de dados em classes. No exemplo da classificação de e-mails como spam, teríamos um exemplo de classificação binária, no qual o modelo através dos dados fornecidos, precisaria gerar como resposta se o e-mail é spam ou não.

Alguns dos algoritmos mais famosos são:

*    KNN
*    Naive Bayes
*    Logistic Regression
*    Support Vector Machines
*    Decision Trees

### **Regressão**

Os modelos de regressão são utilizados quando queremos prever valores, por exemplo, prever o preço de uma casa ou o número de produtos que serão vendidos em determinado mês.
Alguns modelos são famosos para realizar regressão, são eles:

*    Linear Regression
*    Polynomial Regression
*    Logistic Regression
*    Principal Components Regression (PCR)

## **Aprendizado Não Supervisionado**

O aprendizado não supervisionado consiste em treinar uma máquina a partir de dados que não estão rotulados e/ou classificados. Os algoritmos que fazem isso buscam descobrir padrões ocultos que agrupam as informações de acordo com semelhanças ou diferenças, por exemplo.

Para que isso fique mais claro, vamos imaginar um algoritmo de aprendizado não supervisionado, que receba uma imagem contendo cachorros e gatos.

<center>
    <img src="img/exemploAgrupamento.jpg?raw=1" alt="Drawing" style="width: 650px;height: 300px"/>
</center>

Ao receber essa imagem nada se sabe sobre as características que cada animal possui, ou seja, não é possível categorizá-los. Porém, esse algoritmo será responsável por descobrir semelhanças, padrões e/ou diferenças que permitam diferenciar cães e gatos.

No exemplo citado anteriormente utilizamos uma técnica chamada de agrupamento (**Clustering**), porém existem outras técnicas como regras de associação (**Association Rules**) e redução de dimensionalidade (**Dimensionality Reduction**). Falaremos um pouco de cada uma delas abaixo.

### **Agrupamento**

Essa técnica consiste em agrupar os dados com base nas suas semelhanças ou diferenças. Dessa forma, os dados não são rotulados e o algoritmo aprende sem uma supervisão humana. Esses algoritmos de agrupamento ainda podem ser subdivididos em **agrupamentos exclusivos**, **sobrepostos**, **hierárquicos** e **probabilísticos**.

### **Aprendizado de regras por associação**

Ao usar as regras de associação, buscamos descobrir relações que descrevem grandes porções dos dados. A associação é muito utilizada em análises de cestas de compras, no qual a empresa pode tentar entender relações de preferências de compras entre os produtos.
Alguns dos algoritmos mais famosos são:

*   Apriori;
*   Eclat;
*   FP-Growth;



### **Redução de dimensionalidade**

Existem casos nos quais ao estudar um conjunto de dados, podemos encontrar nele um grande número de recursos (dimensões). Por mais que existam situações onde isso é positivo, o excesso pode impactar o desempenho dos algoritmos causando, por exemplo, o overfitting. 

Utilizando a técnica de redução de dimensionalidade, será feita uma redução no número de recursos, de forma que torne-os gerenciáveis por parte do modelo, além de preservar a integridade dos dados.
E para executar essa tarefa existem algumas técnicas que podem ser utilizadas, como: **Missing Values Ratio, Low Variance Filter, High Correlation Filter, Random Forests / Ensemble Trees, Principal Component Analysis (PCA), Backward Feature Elimination e Forward Feature Construction**.

## **Aprendizado Semissupervisionado**

A rotulação dos dados custa tempo e dinheiro. Dessa forma, é muito comum trabalharmos com dados rotulados e não rotulados. Isso é o que chamamos de aprendizado semissupervisionado, o qual temos dados pré-definidos em nosso sistema, mas, por conta da quantidade, alguns não estão. Um exemplo clássico é o Google Fotos, o qual define que uma pessoa está presente em múltiplas fotos (clusterização), mas você precisa dar um rótulo a ela, informando ao algoritmo quem é aquela pessoa.

## **Aprendizado por reforço**

Para entendermos como funciona o aprendizado por reforço, devemos analisar a seguinte imagem:

<center><img src="img/modeloRL.png" alt="Drawing" style="width: 550px;height: 300px"/></center>

O primeiro passo é definir os elementos presentes na imagem, o agente (**Agent**) é aquele que toma as decisões com base nas recompensas e punições, esse agente pode realizar uma ação (**Action**) que irá variar de acordo com o contexto. O ambiente (**Environment**) é o mundo físico ou virtual em que o agente opera, a recompensa (**reward**) é o **feedback do ambiente baseado na ação tomada e o estado (**state**) é a situação atual do agente.

<center><img src="img/exemploRL.png" alt="Drawing" style="width: 400px;height: 300px"/></center>

A imagem acima demonstra um exemplo de como o aprendizado por reforço pode ser utilizado. Nesse caso, o robô é o nosso agente e ele está situado no estado inicial do nosso **ambiente**, que é representado pelo **“labirinto”** que o robô terá de percorrer. Desta forma, o **objetivo** é chegar ao **diamante** evitando os **obstáculos (fogueiras)**. 

Definido o objetivo, o robô deve buscar pelo melhor caminho possível para chegar até o diamante. Dessa forma, a cada ação do robô, ele poderá caminhar em uma determinada direção, caso ele escolha corretamente, ele irá inserir pesos diferentes, para diferentes respostas. Com isso, espera-se que ao final o robô consiga realizar seu objetivo de forma que obtenha a maior recompensa cumulativa.

#### **Além da classificação dos aprendizados quanto a supervisão, também é feita uma análise acerca de como ocorre o treinamento. Dessa forma, define-se se o algoritmo aprende ou não em tempo real.**

## Aprendizado em batch (por ciclo)

O **aprendizado em batch** é feito de maneira offline. Dessa forma, uma vez que o modelo é treinado, este é feito baseado em um determinado **dataset**. Caso deseja-se que o sistema tenha acesso a um novo conjunto de dados (como um novo tipo de spam no caso do email), este deve ser treinado novamente com o conjunto de dados novos e os antigos, que foram utilizados.

Tal forma de aprendizado consome uma enorme quantidade de processamento e tempo, uma vez que o modelo é treinado com todos os dados disponíveis. De certa forma, o sistema que utiliza o modelo de aprendizado em batch pode se adaptar às mudanças sendo treinado novamente.

Caso a implementação real necessite de uma constante atualização dos dados do conjunto, tal forma de treinamento, talvez, não seja a mais viável. Isso se da, pois a quantidade de dados para treinamento cresce a medida que novos dados são disponibilizados. Como tal modo não aprende em tempo real, é recomendado que o modelo seja treinado semanalmente, ao invés de diariamente, visto que o consumo de processamento e o tempo para treinamento podem ser um ponto de conflito.

## **Aprendizado Online (Incremental)**

O **aprendizado online** é feito incrementalmente, ou seja, a medida que novos dados são disponibilizados, este aprende em tempo real. De certa forma, o modelo é, previamente, treinado com um conjunto de dados menor (suficiente para que se obtenha um desempenho ideal). Tal forma de aprendizado é possível, pois as instâncias dos dados são fornecidas em sequência, individual ou em pequenos grupos, chamados de mini-batches.

Este modelo de aprendizado é indicado quando a entrada de dados no sistema é contínua e sua resposta deve ser instantânea as mudanças. Isso faz com que aprendizado seja realizado constantemente.