# O que é Machine Learning?
https://www.ibm.com/br-pt/topics/machine-learning

`Machine learning` é uma área da inteligência artificial (IA) e da ciência da computação que se concentra no uso de dados e algoritmos para imitar a maneira como os humanos aprendem, melhorando gradualmente sua precisão.
Aprender a partir de datasets, modelagem preditiva para previsão (financeiro, tempo, detecção de fraudes, etc)

Nas últimas duas décadas, os avanços tecnológicos em armazenamento e capacidade de processamento possibilitou a criação de alguns produtos inovadores baseados em machine learning, como o mecanismo de recomendação da Netflix e os carros autônomos.

Machine learning é um componente importante do crescente campo da ciência de dados. Por meio do uso de métodos estatísticos, os algoritmos são treinados para fazer classificações ou previsões, revelando os principais insights em projetos de mineração de dados. Esses insights subsequentemente conduzem a tomada de decisões em aplicativos e negócios, impactando de forma ideal as principais métricas de crescimento.

Os algoritmos de machine learning são normalmente criados usando frameworks que aceleram o desenvolvimento da solução, como TensorFlow e PyTorch.

---------------------------------------------------------------------------------------------------------------------------------------------------------------

# Machine Learning vs. Deep Learning vs. Redes Neurais

![image.png](attachment:image.png)
`Machine learning`, `deep learning` e `redes neurais` são todos subcampos da inteligência artificial. No entanto, as redes neurais, na verdade, representam um subcampo do machine learning e o deep learning é um subcampo das redes neurais.

O deep learning e o machine learning diferem na forma como cada algoritmo aprende. 

O deep learning pode ingerir dados não estruturados em sua forma bruta (por exemplo, texto, imagens) e pode determinar automaticamente o conjunto de recursos que distinguem diferentes categorias de dados umas das outras. 

Isso elimina parte da intervenção humana necessária e permite o uso de conjuntos de dados maiores. Podemos pensar em deep learning como "machine learning escalável", segundo Lex Fridman na palestra do MIT (01:08:05) https://www.youtube.com/watch?v=O5xeyoRL95U.

---------------------------------------------------------------------------------------------------------------------------------------------------------------

# Como o machine learning funciona
https://ischoolonline.berkeley.edu/blog/what-is-machine-learning/

O algoritmo típico de aprendizado de máquina supervisionado consiste em aproximadamente três componentes

### 1- Um processo de decisão

Uma receita de cálculos ou outras etapas que assumem os dados e “adivinhe” que tipo de padrão seu algoritmo está procurando encontrar.

### 2- Uma função de erro

Um método de medir o quão bom era o palpite, comparando-o com exemplos conhecidos (quando eles estão disponíveis). O processo de decisão acertou? Se não, como você quantifica “quão ruim” foi a falta?

### 3- Um processo de otimização de modelo

Um método no qual o algoritmo olha para a falta e, em seguida, atualiza como o processo de decisão chega à decisão final, então, da próxima vez, a falta não será tão boa.

---------------------------------------------------------------------------------------------------------------------------------------------------------------

# Tipos de Aprendizagem

`Supervisionada`, `Não Supervisionada`, `Semi Supervisionada` e por `Reforço`

### > `Supervisionada` VS. `Não Supervisionada`
Exemplo da montagem.

https://blogs.nvidia.com/blog/supervised-unsupervised-learning/

`Supervisionada`: O conjunto de dados que está sendo usado foi pré-rotulado e classificado pelos usuários (1) para permitir que o algoritmo veja o quão preciso é seu desempenho (4).

![Texto Alternativo](img\Supervised_machine_learning_in_a_nutshell.png)


Existem duas áreas principais onde a aprendizagem supervisionada é útil: problemas de `classificação` e problemas de `regressão`.

A aprendizagem supervisionada é, portanto, mais adequada para problemas onde há um conjunto de pontos de referência disponíveis ou uma verdade com a qual treinar o algoritmo. Mas nem sempre estão disponíveis.


---------------------------------------------------------------------------------------------------------------------------------------------

`Não Supervisionada`: O conjunto de dados brutos que está sendo usado não é rotulado e um algoritmo identifica padrões e relacionamentos dentro dos dados sem a ajuda dos usuários.

O conjunto de dados de treinamento é uma coleção de exemplos sem um resultado desejado ou resposta correta. A rede neural então tenta encontrar automaticamente a estrutura nos dados, extraindo recursos úteis e analisando sua estrutura.

![Texto Alternativo](img\hierarchical_features.png)


Modelos de aprendizagem não supervisionados são usados para três tarefas principais: `Clustering`(agrupamento), `Associação` e `redução da dimensionalidade`.

---------------------------------------------------------------------------------------------------------------------------------------------------------------

### > Aprendizagem `Semi Supervisionada`: 

O conjunto de dados contém dados estruturados e não estruturados, que orientam o algoritmo a caminho de chegar a conclusões independentes. A combinação dos dois tipos de dados em um conjunto de dados de treinamento permite que os algoritmos de aprendizado de máquina aprendam a rotular os dados não rotulados.

---------------------------------------------------------------------------------------------------------------------------------------------------------------

### > Aprendizagem por `Reforço`:

O conjunto de dados usa um sistema de “recompensas / punições”, oferecendo feedback ao algoritmo para aprender com suas próprias experiências por tentativa e erro.

---------------------------------------------------------------------------------------------------------------------------------------------------------------
---------------------------------------------------------------------------------------------------------------------------------------------------------------

# Resumo/Notas

"Machine Learning é a ciência (ou arte) de programar máquinas para aprenderem com dados" 
                                                - Aurélien Géron em "Hands-on Machine Learning with Scikit-Learn, Keras & Tensorflow"

### > Modelo
Algoritmo que utiliza informações de entrada (e saída para alguns casos) para aprender
##### m(X) = y

### > Dados
Dados utilizados pelos modelos para o aprendizado

###### - Dados de treino:
Dados fornecidos ao algoritmo para que possa aprender (entre 70% a 80% da base de dados)

###### - Dados de teste:
Dados para verificar se o modelo está tendo boa performance

###### - Variáveis preditoras:
Variáveis de entrada que serão utilizadas para prever a variável alvo (X)

###### - Variável alvo:
Variável predita através das variáveis preditoras (Y)

### > Aprendizado supervisionado
Tarefas de treinamento onde o modelo conhece qual a solução ideal para cada conjunto de dados
###### --- Tarefas de regressão:
Tarefas onde é esperado um valor numérico (normalmente contínuo) de um modelo. Ex: preço de um imóvel, cotação de uma moeda
###### --- Tarefas de classificação:
Tarefas onde o modelo de aprendizado de máquina tem como output uma classe. Ex: prever se uma pessoa possui ou não determinada doença

### > Aprendizado não supervisionado
Tarefas de treinamento onde o modelo não conhece a saída ideal para os dados fornecidos e tenta encontrar padrões entre os mesmos
###### --- Tarefas de agrupamento (clustering):
Agrupar objetos (dados) que possuam alguma semelhança em clusters

### > Métodos de aprendizado
###### --- fit()
Treinar o modelo com dados de TREINO

###### --- predict()
Predizer valores de TESTE com o modelo

### > Passo a passo
#### >> Leitura da base de dados
#### >> Análise exploratória
#### >> Definição e treino do modelo
#### >> Avaliação da performance do modelo