# Teoria

<br>

| Tipo  | Ciência de Dados | Análise Tradicional |
| --- | --- | --- |
| Tipo de Dados | Não estruturados | Estruturados (linhas e colunas) |
| Volume de Dados | Big Data (centenas de Terabytes) | Dezenas de Terabytes ou menos |
| Fluxo de Dados | Contínuo, Big Data | Estático |
| Métodos de Análise | Machine Learning | Visual, Hypothesis-Based |
| Propósito | Data-base Products | Internal Support Decision |

<br>
<br>

Algumas pessoas usam os termos Inteligência Artificial e Aprendizado de Máquina quase como sinônimos. Mas o mais provável quando vemos  empresas fazendo uso de Inteligência Artificial, é que estejam mesmo empregando o Aprendizado de Máquina que é um subcampo da IA que permite aos computadores aprender e realizar tarefas sem serem explicitamente programados. 

Em 2020, mais de 65% das empresas já fazem do Aprendizado de Máquina e a quase a totalidade das empresas acredita que ele será um fator crítico de sucesso para os negócios e, embora nem todos precisem conhecer os detalhes de como isso é feito, todos precisaremos saber o que Aprendizado de Máquina pode e não pode fazer por nós, e as implicações dessa enorme transformação.

## Aprendizado de Máquina: Um Novo Paradigma

O Aprendizado de Máquina, ou *Machine Learning* (ML), é um subcampo da Inteligência Artificial. A IA busca criar sistemas capazes de imitar o comportamento humano inteligente o que pode ser feito de várias formas.

$$  Homem  \rightarrow  Mortal $$
$$ Sócrates \rightarrow  Homem $$
$$ Sócrates \rightarrow  Mortal $$

O uso da lógica formal como acima, ou um circuito autômato finito que controla a porta automática em um shopping, podem reproduzir comportamentos inteligentes. Eles fazem parte do estudo da IA, mas não são parte do Aprendizado de Máquina. Há também uma série de outros termos correlatos e as Ciência de Dados e Deep Learning (Redes Neurais Profundas) são áreas de comumente de interceptam e que, embora não haja fronteiras nitidamente definidas, não são a mesma coisa.




<img src="https://github.com/Rogerio-mack/work/raw/main/IMT/MLparadigmas_IAxDS.png" width=800, align="center">

In [1]:
def Celsius2Fahrenheit(Celsius):
  return Celsius * 9/5 + 32

print( Celsius2Fahrenheit(0) )
print( Celsius2Fahrenheit(27) )

32.0
80.6


In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns


In [3]:
df = pd.DataFrame()
df['celsius'] = np.arange(-20,60)
df['fahrenheit'] = Celsius2Fahrenheit( df['celsius'] )
df.head()

Unnamed: 0,celsius,fahrenheit
0,-20,-4.0
1,-19,-2.2
2,-18,-0.4
3,-17,1.4
4,-16,3.2


In [4]:
from sklearn.linear_model import LinearRegression

X = df[['celsius']]
y = df['fahrenheit']

regressor = LinearRegression()
regressor.fit(X, y)


LinearRegression()

In [7]:
Fahrenheit_prediction = regressor.predict(pd.DataFrame({'celsius':[0,27]}))
print(Fahrenheit_prediction)
print("Coefficients: \n", regressor.coef_, regressor.intercept_)

[32.  80.6]
Coefficients: 
 [1.8] 31.999999999999986


In [9]:
from sklearn.linear_model import LinearRegression

X = df[['fahrenheit']]
y = df['celsius']

regressor = LinearRegression()
regressor.fit(X, y)

LinearRegression()

In [10]:
Celsius_prediction = regressor.predict(pd.DataFrame({'fahrenheit':[32,80.6]}))
print(Celsius_prediction)

[3.55271368e-15 2.70000000e+01]


## Tipos de Aprendizado de Máquina

Os sistemas de Aprendizado de Máquina nem sempre são empregados para inferência e, embora aqui nos dediquemos unicamente a esse tipo de aprendizado (o Aprendizado Supervisionado), é importante você entender que há outras formas de aprendizado e que você aprenderá nas disciplinas subsequentes.

Sistemas de Aprendizado de Máquina podem simplesmente ser **descritivos**, o que significa que o sistema emprega os dados para explicar o que aconteceu. Por exemplo, podemos *segmentar* um conjunto de consumidores com base em suas características (idade, perfil de consumo etc.) e, com isso, direcionar uma campanha de marketing. Você não faz aqui qualquer inferência. Eles são **preditivos**, quando o sistema usa os dados para prever o que pode acontecer. É o caso dos exemplos que vimos antes: você prevê que uma certa transação de cartão de crédito com base em um conjunto de exemplos de outras transações com valor, local, horário, uso do cartão nas últimas 24h etc. é com uma certa probabilidade uma fraude (e neste caso impede que isso ocorra!). E há ainda os sistemas **prescritivos**, em que o sistema usará os dados para fazer sugestões sobre quais ações tomar, como no caso de um robô-aspirador que vai tomando ações no ambiente e se tornando mais eficiente à medida que *aprende*, isto é, à medida que obtêm mais dados sobre o ambiente. Os sistemas de Aprendizado de Máquina são assim divididos em três subcategorias,

* **Aprendizado Supervisionado**  
* **Aprendizado Não Supervisionado**
* **Aprendizado de Reforço**

Havendo ainda sistemas híbridos que combinam descrição, predição e precrição.