# Inteligência Computacional

Robson Mesquita Gomes  
[<robson.mesquita56@gmail>](mailto:robson.mesquita56@gmail.com)

## Introdução

Nessa etapa discorreremos sobre conceitos introdutórios à disciplina e discutiremos alguns dos pilares da construção de soluções nessa àrea.

### Conhecimentos prévios nessessários

Inteligência Computacional é um tema abrangente, o escopo do que pode tratar cada tópico é quase ilimitado. Para nos atermos a base podemos concluir a necessidade de conhecimentos intermediários a avançados em **Teoria dos Consjuntos**, **Probabilidade e Estatística** e **Programação**.

### Reflexões iniciais

Ao pensarmos em Inteligência Computacional e do que ela trata podemos entrar em diversos debates filosóficos. O prórpio nome exige uma definição sobre o que é inteligência e como essa definição se aplicaria à um computador. Pode um computador ser inteligente? O que é então inteligência e conhecimento? O que é aprender? O que é memória e como armazená-la?

A computação é conhecida como ciência exata, porém para várias perguntas a resposta inicial (mesmo que não a final) será um concreto e rispido "depende". Em I.C. não será diferente, ao invés de consolidar uma única resposta absoluta e verdadeira, cada modelo, a sua maneira, responde à essas perguntas de forma diferente, sendo estas respostas verdadeiras ao menos para os problemas para os quais foram criados para resolver.

### Propósito

A criação de modelos em I.C. consiste em produzir ferramentas **autônomas** e **flexíveis** que conseguem **aprender** a partir de **dados** e **resolver problemas** tomando decisões complexas **não previamente programadas**.

## História

Para se compreender os objetivos e características principais de uma àrea, bem como seus principais jargões é necessário entender quais suas origens. Para isso nessa sessão faremos uma breve discussão sobre algumas das principais evoluções em Inteligência Computacional ao longo dos anos.

### Pré-informática

Antes dos anos 50 temos a era pré informática, onde os modelos de previsão eram puramente matemáticos e estatísticos.

### 1950

Da década de 50 em diante a humanidade passa a ter acesso a um ferramental mais informatizado. 

Nos anos inicias haviam mainframes com baixo poder computacional (se comparados com os que temos no século 21). O início da computação também é marcado pelo baixo poder de armazenamento e o que se havia disponível representava um custo muito alto.

Essa época também é marcada pela programação procedural, inferência a partir de dados, conhecimento programável e modelos lógico-simbólicos.

### 1980

Na década de 80 surgem os primeiros modelos de Inteligência Artificial (I.A.). As tecnologias de armazenamento são barateadas possibilitando o uso mais amplo de Bancos de Dados. Surgem novos paradigmas de programação. A Internet dá seus primeiros passos com o início do uso de redes locais.

Esse momento da história também marca o surgimento do conceito de Aprendizagem de Máquina (Machine Learning) onde novos modelos de conhecimento foram desenvolvidos e algoritmos que conseguem "aprender" esses modelos a partir de dados foram criados e o uso dos chamados Dados Estrutuarais foi implementado.

### 2010

A expansão da Internet e facilitação do acesso à informática proporcionou a criação do que é chamado _Big Data_ (dados não estruturados de alta dimensionalidade), essa quantidade de dados possibilitou o desenvolvimento do Aprendizado Profundo (_Deep Learning_), do Paradigma Conexionista (Redes Neurais Covolucionais) e de modelos complexos com dezenas a centenas de módulos (camadas). O processamento desse tipo de modelo foi possível graças ao desenvolvimento das GPUs (Unidades de Processamento Gráfico) que serviram como alicerse para o desenvolvimento de diversas I.A.'s.

## Base da problemática

Um dos pilares da Inteligência Computacional é a seguinte equação:

$$Y=G(X)$$

_Onde $G$ é o **processo gerador de dados** que transforma uma entrada $X$ em uma saída $Y$._

Para resolução de problemáticas relacionadas à Inteligência Computacional não temos acesso a $G$, pois a verdadeira função $G$ é inacessível ou desconhecida, seja por não termos dados suficientes para inferi-la com exatidão ou por descrever um acontecimento em um sistema muito complexo (como o mundo real) cuja inferência de tal função seja extraordinariamente custosa.

Só temos acesso à um conjunto de exemplos, os pares $X,Y$ que foram amostrados. Ainda assim não temos como garantir que essa amostra cobre todos os casos e possibilidades da função desconhecida $G$.

## Modelo I.C.

Como não temos acesso a $G$ buscamos métodos de inferir uma aproximação suficientemente confiável para casos semelhantes aos disponíveis em nossa amostra. Chamamos essa amostra de Modelo I.C.  

_Um **Modelo I.C.** é uma função $f$ que aproxima $G$ com base nos dados de exemplo/amostra $X,Y$._

$$Ỹ = f(X), Ỹ \approx Y$$


### Aproximação do Modelo

Para realizar a aproximação em $f$ precisamos primeiramente selecionar um conjunto de treinamento que servirá para preparar nossa função para o cumprimento de seu propósito.

#### Treinamento ($F$)

Definido o conjunto de treinamento com pares de valores $X$ e $Y$, onde $X$ é a informação conhecida e $Y$ é a informação que desejamos prever a partir de $X$, é utilizada uma função de treinamento ($F$) que "aprende" a transformar $X$ em $Y$ e armazena esse "conhecimento" nos parâmetros ($\theta$). 

Deve ser considerado também que esse treinamento possui algum grau de incerteza, logo possui uma margem de erro ($\epsilon$) a ser considerada.  

Logo podemos definir uma função de treinamento como:

$$\theta,\epsilon = F(X,Y)$$

#### Aproximação ($f$)

Utilizando os parâmetros gerados por $F$ a função $f$ estima um valor $Ỹ$, que aproxima um valor desconhecido $Y$, a partir de valores conhecidos $Y$.

$$Ỹ = f(X, \theta) + \epsilon$$

Note que inevitavelmente o modelo gerado possui uma margem de erro, $\epsilon$, pois trata-se de uma aproximação.

$$\epsilon = Ỹ - Y$$

> _"Essencialmente todos os modelos   
> estão errados, mas alguns são úteis"_  
>  
> [George E. P. Box](https://pt.wikipedia.org/wiki/George_E._P._Box)

### Definição de modelos

De maneira geral podemos afirmar que um Modelo I.C. possui as seguintes características:

- **Método de aprendizado ($F$)**  
  _\[como aprende\]_
- **Modelo de conhecimento ($\theta$)**  
  _\[como representa o "conhecimento"\]_
  - **Caixa Preta**: Método em que se é possível conhecer seu funcionamento e lógica interna
  - **Caixa Branca**: Método em que não se é possível compreender o "conhecimento" gerado pelos algoritmos
- **Método de inferência ($f$)**  
  _\[como se usa\]_
  
Para facilitar a visualização podemos organizar as informações conforme a tabela abaixo.


| Notação  |          Característica          |                            Descrição                               |
|----------|----------------------------------|--------------------------------------------------------------------|
|     X    | Dados de Entrada _(treinamento)_ | Dados que temos                                                    |
|     Y    | Dados de Saída _(treinamento)_   | Dados que desejamos prever                                         |
|     F    | Função de Treinamento            | Aprende $\theta$ a partir dos dados disponíveis                    |
|     f    | Função de Inferência             | Usa $\theta$ para inferir $y$ a partir dos valores $x$ disponíveis |
| $\theta$ | Parâmetros                       | Representação do "conhecimento"                                    |
|$\epsilon$| Incerteza ($ \epsilon = Ỹ - Y $) | Margem de erro padrão das previsões realizadas                     |
|     Ỹ    | Estimativa                       | Previsão de $Y$ (baseado em $X$) mais a incerteza $\epsilon$       |

### Aplicação

Para aplicação de um Modelo I.C. podemos seguir o seguinte passo a passo:

1. Definir problema a ser resolvido;
2. Definir quais dados se têm acesso ($X$);  
3. Avaliar dados disponíveis e, se nessessário, melhorar a qualidade dos mesmos;
4. Defina a abordagem, isso inclui método de treinamento ($F$) e inferência ($f$);
5. Treine e avalie os modelos;
6. $f$ resolve o problema? **se não** retorne ao passo 2, **se sim** implementar solução.

## Resumo

**Sistema observado:**  

$$Y=G(X)$$

_Onde_
- _$G$: Processo gerador de dados, que transforma a informação $X$ em $Y$._

**Aproximação:**

$$\theta, \epsilon = F(X,Y)$$
$$Ỹ = f(X, \theta) + \epsilon$$

_Onde_
- _$F$: Função de treinamento;_
- _$\theta$: Parâmetros;_
- _$\epsilon$: Margem de erro;_
- _$f$: Função de aproximação._