# Introdução à Inteligência Artificial e Redes Neurais Artificiais (Deep Learning)




## O que é Inteligência Artificial?

Relembrando a estrutura geral


Vejamos as possíves subáreas da AI:

<div style="text-align:center;">
    <img src="images\IA_ML_DL.png"  alt="Imagem" style="width: 450px;"/>
</div>

Assim, temos que:
* AI: Campo amplo da ciência da computação que busca criar sistemas capazes de simular comportamentos humanos inteligentes.
* ML: Subárea da AI que se concentra no desenvolvimento de algoritmos e modelos que permitem que os computadores aprendam a partir de dados.
* DL: Subárea do ML que se concentra no desenvolvimento de redes neurais profundas para tarefas de aprendizado de máquina.


A Inteligência Artificial (IA) é o campo da ciência da computação que se dedica a criar sistemas capazes de executar tarefas que normalmente requerem inteligência humana. Essas tarefas incluem:

- Reconhecimento de padrões em imagens, áudios e vídeos.
- Predição de eventos futuros com base em dados históricos.
- Processamento de linguagem natural para interagir com humanos de forma mais intuitiva.
- Otimização de sistemas complexos e tomada de decisão automatizada.

A IA depende fortemente de matemática, estatística e computação para extrair informações útis dos dados e transformar essas informações em ações automatizadas. Entre suas principais subáreas, destacam-se:

1. Aprendizado de Máquina (Machine Learning).
2. Aprendizado Profundo (Deep Learning).
3. Visão Computacional.
4. Processamento de Linguagem Natural.
5. Robótica e Sistemas Autônomos.

---

## Redes Neurais Artificiais: A Inspiração Biológica
As redes neurais artificiais (RNAs) são modelos computacionais inspirados no funcionamento do cérebro humano. Elas são compostas por "neurônios artificiais", que são abstrações matemáticas baseadas nos neurônios biológicos. A estrutura básica de uma RNA é baseada em:

1. **Dendritos**: recebem informações (entradas).
2. **Núcleo Somático**: integra as informações recebidas e produz uma síntese.
3. **Axônios**: transmitem a saída para outros neurônios.



<div style="text-align:center;">
    <img src="images\neuronio_biologico.png"  alt="Imagem" style="width: 450px;"/>
</div>



### Funcionamento do Neurônio Biológico

O neurônio biológico processa informações através de sinais elétricos e químicos. Dendritos recebem sinais de outros neurônios, que são somados no núcleo somático. Se o sinal agregado ultrapassar um determinado limiar, um novo sinal é gerado e transmitido pelo axônio aos próximos neurônios. Este funcionamento pode ser modelado matematicamente para criar algoritmos de aprendizado.

### Analogias no Neurônio Artificial

O neurônio artificial replica esse processo de forma matemática:

- **Entradas (inputs)**: Representam os dendritos, recebendo dados de entrada.
- **Função Somatória**: Soma ponderada das entradas, representando o núcleo somático.
- **Função de Ativação**: Determina a saída do neurônio, simulando a transmissão pelo axônio.

Abaixo, uma tabela comparativa:

| **Neurônio Biológico** | **Neurônio Artificial** |
|--------------------------|---------------------------|
| Dendritos                | Entradas (Vetores ou Matrizes) |
| Núcleo Somático          | Função Somatória         |
| Axônio                   | Saídas (Ativadas por Função) |

---

# Fundamentos Matemáticos das Redes Neurais Artificiais

As redes neurais dependem de conceitos matemáticos fundamentais para processar informações e aprender padrões complexos. Esses conceitos incluem vetores, matrizes e tensores, que formam a base do cálculo em IA.

## Vetores

Um vetor é uma representação unidimensional de dados. Em IA, eles podem representar entradas, pesos ou saídas de um modelo.

### Representação Matemática
Um vetor $ \mathbf{x} $ com $ n $ elementos pode ser escrito como:
$$
\mathbf{x} = \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix}
$$

#### Operações Fundamentais
1. **Produto Escalar**:
   $$
   \mathbf{a}^T \mathbf{b} = \sum_{i=1}^n a_i b_i
   $$

2. **Norma do Vetor** (magnitude):
   $$
   \|\mathbf{x}\| = \sqrt{\sum_{i=1}^n x_i^2}
   $$


<div style="text-align:center;">
    <img src="images\neuronio_artificial.png"  alt="Imagem" style="width: 450px;"/>
</div>


### Exemplos Práticos
1. Representar pixels de uma imagem em escala de cinza como um vetor.
2. Representar variáveis de entrada em um modelo preditivo.

## Matrizes

As matrizes permitem trabalhar com dados bidimensionais, como coleções de vetores.

### Representação Matemática
Uma matriz $ \mathbf{X} $ com $ m $ linhas e $ n $ colunas pode ser representada como:
$$
\mathbf{X} = \begin{bmatrix} x_{11} & x_{12} & \dots & x_{1n} \\ x_{21} & x_{22} & \dots & x_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ x_{m1} & x_{m2} & \dots & x_{mn} \end{bmatrix}
$$

#### Operações Fundamentais
1. **Multiplicação Matricial**:
   $$
   \mathbf{C} = \mathbf{A} \cdot \mathbf{B}
   $$

2. **Transposição**:
   $$
   \mathbf{A}^T = \begin{bmatrix} a_{11} & a_{21} \\ a_{12} & a_{22} \end{bmatrix}
   $$

### Exemplos Práticos
1. Representar uma coleção de imagens como uma matriz onde cada linha é uma imagem vetorizada.
2. Representar pesos conectando camadas em redes neurais.

## Tensores

Os tensores generalizam vetores e matrizes para dimensões superiores, sendo essenciais para modelar dados complexos em IA.

### Representação Matemática
Um tensor de ordem 3 pode ser representado como um conjunto de matrizes:
$$
\mathcal{T} = \begin{bmatrix} \mathbf{A}_1 \\ \mathbf{A}_2 \\ \vdots \\ \mathbf{A}_k \end{bmatrix}
$$

### Exemplos Práticos
1. Imagens RGB são representadas como tensores de ordem 3: Altura, Largura e Canais de Cor.
2. Representação de sequências temporais multimodais.

---

# O Processamento de Informações em Redes Neurais

## Fluxo de Informação

1. **Multiplicação Entrada-Peso**:
   $$
   \mathbf{z} = \mathbf{W}^T \mathbf{x}
   $$

2. **Soma (Função Somatória)**:
   $$
   z = \sum_{i=1}^n w_i x_i + b
   $$

3. **Função de Ativação**:
   $$
   f(z) = \frac{1}{1 + e^{-z}}
   $$

4. **Saída**:
   Os valores calculados são propagados para a próxima camada.

## Backpropagation e Aprendizado

O processo de aprendizado ajusta os pesos para minimizar o erro. Este ajuste é feito através de:

1. **Função de Custo**:
   $$
   J(\mathbf{W}) = \frac{1}{m} \sum_{i=1}^m (\hat{y}_i - y_i)^2
   $$

2. **Descida de Gradiente**:
   $$
   \mathbf{W} = \mathbf{W} - \eta \nabla J(\mathbf{W})
   $$

---

# Interseção entre IA e Matemática Avançada

## Álgebra Linear na Inteligência Artificial

A IA utiliza intensamente conceitos de álgebra linear, como:
- Multiplicações matriciais para modelar relações complexas.
- Decomposição de tensores para otimizar representações de dados.

## Modelos de Altíssima Dimensão

Em modelos modernos, tensores podem ter milhares ou até milhões de dimensões, representando dados de alta complexidade. Exemplos:

- **Redes Convolucionais (CNNs)**: Representam imagens como tensores 4D.
- **Transformers**: Utilizam tensores para processar linguagens naturais.

---

# Conclusão e Reflexões

A combinação de inspiração biológica e matemática avançada torna a IA uma ferramenta poderosa para resolver problemas reais. No entanto, é essencial compreender seus fundamentos para avançar no campo.

## Recomendações de Estudos Adicionais

1. **Matemática Avançada**:
   - Álgebra Linear.
   - Otimização Convexa.

2. **Implementação Prática**:
   - Estudo de frameworks como TensorFlow e PyTorch.
   - Análise de casos práticos em Python.

3. **Referências Clássicas**:
   - "Deep Learning" por Ian Goodfellow et al.
   - "Hands-On Machine Learning" por Aurélien Géron.
