<a href="https://colab.research.google.com/github/hevertonvalerio/TensorFlow/blob/main/Conceitos_TensorFLow.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Síntese dos conceitos

### **TensorFlow**

É uma biblioteca de código aberto usada para construir e treinar modelos de aprendizado de máquina e redes neurais.

### **Processamento de Imagem (Classificação)**

O processamento de imagem envolve técnicas para manipular e analisar imagens digitais. A classificação de imagens é uma tarefa onde o objetivo é **atribuir uma etiqueta à uma imagem** de acordo com seu conteúdo visual. Por exemplo, classificar uma imagem como contendo um "gato" ou um "cachorro".

### **CNNs (Convolutional Neural Networks)**

Redes Neurais Convolucionais são um tipo de rede neural especializada no processamento de dados que têm uma grade de topologia, como imagens. Elas utilizam convoluções para extrair características de diferentes partes da imagem e são altamente eficazes em tarefas de visão computacional.


> Convolução - Operação matemática entre duas funções para produzir uma terceira.

> Topologia - Topologia lida com as propriedades de um objeto que permanecem inalteradas mesmo quando o objeto é distorcido de forma contínua.

Usamos CNNs para construir modelos de classificação de imagens.

É possível utilizar `keras` para definir uma arquitetura de CNN e treinar um modelo para classificar imagens.


In [None]:
   import tensorflow as tf
   from tensorflow import keras

   model = models.Sequential([
       layers.Conv2D(32, (3, 3), activation='relu', input_shape=(64, 64, 3)),
       layers.MaxPooling2D((2, 2)),
       layers.Conv2D(64, (3, 3), activation='relu'),
       layers.MaxPooling2D((2, 2)),
       layers.Conv2D(128, (3, 3), activation='relu'),
       layers.Flatten(),
       layers.Dense(64, activation='relu'),
       layers.Dense(10, activation='softmax')
   ])

   model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

### **Regressão Linear com TensorFlow**

Regressão é uma técnica de aprendizado de máquina usada para prever um valor contínuo. Diferente da classificação, que prevê categorias (qualitativo), a regressão tenta prever um valor (quantitativo). Por exemplo, prever o preço de uma casa com base em suas características.

Para problemas de regressão, podemos usar redes neurais com `layers.Dense`

In [None]:
import tensorflow as tf
from tensorflow import keras
import numpy as np

model = keras.Sequential([keras.layers.Dense(units=1, input_shape=[1])])
model.compile(optimizer='sgd', loss='mean_squared_error', metrics=['mae'])

xs = np.array([-1.0, 0.0, 1.0, 2.0, 3.0, 4.0], dtype=float)
ys = np.array([-3.0, -1.0, 1.0, 3.0, 5.0, 7.0], dtype=float)

model.fit(xs, ys, epochs=250)

print(model.predict([10.0]))

### Transfer Learning

Transfer Learning é uma técnica onde um modelo pré-treinado em um grande conjunto de dados é reutilizado para uma tarefa diferente, mas relacionada. Por exemplo, usar um modelo treinado no ImageNet para classificar imagens médicas.

Com o TensorFlow, é possível carregar modelos pré-treinados como VGG16 ou ResNet e ajustá-los para sua tarefa específica. Aqui está um exemplo de como usar o VGG16 para classificação de imagem:


### VGG16

VGG16 é uma arquitetura de CNN desenvolvida pelo Visual Geometry Group (VGG) da Universidade de Oxford. É uma rede profunda com 16 camadas de convolução, conhecida por sua simplicidade e desempenho robusto em tarefas de classificação de imagem.

In [None]:
 from tensorflow.keras.applications import VGG16

   base_model = VGG16(weights='imagenet', include_top=False, input_shape=(64, 64, 3))
   base_model.trainable = False

   model = models.Sequential([
       base_model,
       layers.Flatten(),
       layers.Dense(64, activation='relu'),
       layers.Dense(10, activation='softmax')
   ])

   model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

### ResNet

ResNet (Residual Network) é uma arquitetura de CNN desenvolvida pela Microsoft. Ela introduz conexões residuais, que ajudam a treinar redes muito profundas (com centenas de camadas) mitigando o problema de vanishing gradient.

In [None]:
   from tensorflow.keras.applications import ResNet50

   base_model = ResNet50(weights='imagenet', include_top=False, input_shape=(64, 64, 3))
   base_model.trainable = False

   model = models.Sequential([
       base_model,
       layers.GlobalAveragePooling2D(),
       layers.Dense(64, activation='relu'),
       layers.Dense(10, activation='softmax')
   ])

   model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])


Com TensorFlow, é possível construir, treinar e ajustar modelos complexos usando técnicas de transferência de aprendizado, arquiteturas avançadas de CNN como VGG16 e ResNet, e aplicar esses modelos em tarefas de classificação de imagem e regressão. Isso permite criar soluções poderosas e eficientes para uma variedade de problemas em ciência de dados e inteligência artificial.

## Redes Neurais

Redes neurais são modelos computacionais inspirados no funcionamento do cérebro humano. Elas são compostas por unidades básicas chamadas neurônios ou nós, organizados em camadas. Cada neurônio recebe um conjunto de entradas, processa essas entradas através de uma função de ativação, e produz uma saída. As redes neurais são amplamente utilizadas em aprendizado de máquina e inteligência artificial para tarefas como classificação, regressão, reconhecimento de padrões, processamento de linguagem natural e muito mais.

#### Componentes Principais de Redes Neurais

1. **Neurônios (Nós)**: Unidades básicas que recebem entradas, processam essas entradas e produzem uma saída.
2. **Camadas**: Organizações de neurônios em:
   - **Camada de Entrada**: Recebe os dados brutos de entrada.
   - **Camadas Ocultas**: Executam processamento intermediário e aprendem características dos dados.
   - **Camada de Saída**: Produz a resposta final do modelo.
3. **Pesos e Bias**: Cada conexão entre neurônios tem um peso que ajusta a importância da entrada e um bias que permite ajustes adicionais.
4. **Função de Ativação**: Função não-linear aplicada à soma ponderada das entradas de um neurônio, introduzindo não-linearidade ao modelo (por exemplo, ReLU, sigmoid, tanh).
5. **Função de Perda**: Mede a diferença entre a previsão do modelo e o valor real, guiando o processo de treinamento.
6. **Otimizadores**: Algoritmos que ajustam os pesos da rede para minimizar a função de perda (por exemplo, SGD, Adam).

### Perceptrons

Perceptron é o tipo mais simples de rede neural, originalmente proposto por Frank Rosenblatt na década de 1950. É um modelo de classificação binária que mapeia um conjunto de entradas para uma única saída binária (0 ou 1).

#### Estrutura de um Perceptron

1. **Entradas (x)**: Vetor de características que representa um exemplo do conjunto de dados.
2. **Pesos (w)**: Vetor de coeficientes que pondera a importância de cada entrada.
3. **Bias (b)**: Termo que permite ajustes adicionais ao valor de entrada total.
4. **Função de Ativação**: No perceptron clássico, a função de ativação é uma função degrau que transforma a soma ponderada das entradas em 0 ou 1.

#### Funcionamento do Perceptron

1. **Cálculo da Soma Ponderada**:
   \[
   z = \sum_{i} w_i x_i + b
   \]
   onde \(x_i\) são as entradas, \(w_i\) são os pesos, e \(b\) é o bias.

2. **Função de Ativação**:
   \[
   y =
   \begin{cases}
   1 & \text{se } z \geq 0 \\
   0 & \text{se } z < 0
   \end{cases}
   \]
   A função de ativação degrau transforma \(z\) em 0 ou 1, dependendo de um limiar.

#### Treinamento do Perceptron

O treinamento do perceptron envolve o ajuste dos pesos e do bias para minimizar o erro de classificação. O algoritmo de aprendizagem do perceptron usa a regra de atualização:

\[
w_i \leftarrow w_i + \Delta w_i
\]
\[
\Delta w_i = \eta (y - \hat{y}) x_i
\]

onde:
- \(\eta\) é a taxa de aprendizagem.
- \(y\) é o valor alvo.
- \(\hat{y}\) é a previsão do perceptron.

### Diferença entre Perceptrons e Redes Neurais Modernas

- **Complexidade**: O perceptron é uma rede neural muito simples, enquanto as redes neurais modernas podem ter muitas camadas (redes profundas) e neurônios, capazes de modelar relações complexas.
- **Funções de Ativação**: Redes neurais modernas utilizam funções de ativação não-lineares mais avançadas (ReLU, sigmoid, tanh), enquanto o perceptron clássico utiliza uma função degrau.
- **Capacidade de Aprendizado**: Perceptrons podem resolver apenas problemas linearmente separáveis. Redes neurais modernas podem lidar com problemas não-linearmente separáveis devido à sua profundidade e não-linearidade.

### Exemplo de Implementação

#### Perceptron

```python
import numpy as np

# Função de ativação degrau
def step_function(x):
    return 1 if x >= 0 else 0

class Perceptron:
    def __init__(self, learning_rate=0.01, n_iters=1000):
        self.lr = learning_rate
        self.n_iters = n_iters
        self.weights = None
        self.bias = None

    def fit(self, X, y):
        n_samples, n_features = X.shape
        self.weights = np.zeros(n_features)
        self.bias = 0

        for _ in range(self.n_iters):
            for idx, x_i in enumerate(X):
                linear_output = np.dot(x_i, self.weights) + self.bias
                y_predicted = step_function(linear_output)

                # Atualização dos pesos
                update = self.lr * (y[idx] - y_predicted)
                self.weights += update * x_i
                self.bias += update

    def predict(self, X):
        linear_output = np.dot(X, self.weights) + self.bias
        y_predicted = [step_function(x) for x in linear_output]
        return np.array(y_predicted)

# Exemplo de uso do perceptron
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([0, 0, 0, 1])  # AND lógico

p = Perceptron(learning_rate=0.1, n_iters=10)
p.fit(X, y)
predictions = p.predict(X)
print(predictions)
```

#### Rede Neural Simples com Keras

```python
import tensorflow as tf
from tensorflow.keras import layers, models
import numpy as np

# Dados de exemplo
xs = np.array([-1.0, 0.0, 1.0, 2.0, 3.0, 4.0], dtype=float)
ys = np.array([-3.0, -1.0, 1.0, 3.0, 5.0, 7.0], dtype=float)

# Definindo o modelo
model = models.Sequential([layers.Dense(units=1, input_shape=[1])])

# Compilando o modelo
model.compile(optimizer='sgd', loss='mean_squared_error')

# Treinando o modelo
model.fit(xs, ys, epochs=500)

# Fazendo previsões
print(model.predict([10.0]))
```

### Conclusão

Perceptrons são o bloco de construção mais simples das redes neurais, sendo capazes de resolver problemas linearmente separáveis. Redes neurais modernas são mais complexas e capazes de lidar com problemas mais difíceis, aproveitando múltiplas camadas e funções de ativação não-lineares para capturar relações complexas nos dados.

# Relação entre as Iteligência Artificial e Ciência de Dados


## Inteligência Artificial (IA)

### 1. *Redes Neurais e Aprendizado Profundo (Deep Learning)*:
   - Redes Neurais Convolucionais (CNNs)
   - Redes Neurais Recorrentes (RNNs)
   - Redes Adversárias Generativas (GANs)

Redes Neurais (NN) e Aprendizado Profundo (DNN)

Correlação
Estrutura de Redes: Redes neurais são a base do aprendizado profundo. Todas as técnicas de aprendizado profundo utilizam redes neurais como a estrutura fundamental.

Modelagem de Dados Complexos: Ambos são usados para modelar e resolver problemas complexos, como reconhecimento de imagens, processamento de linguagem natural e jogos.

In [None]:
# Rede Neural Simples (NN)

import tensorflow as tf
from tensorflow.keras import layers, models

# Apenas uma camada oculta
model_nn = models.Sequential([
    layers.Dense(64, activation='relu', input_shape=(10,)),
    layers.Dense(1)
])

model_nn.compile(optimizer='adam', loss='mean_squared_error')


In [None]:
# Rede Neural Profunda (DNN)

import tensorflow as tf
from tensorflow.keras import layers, models

#Várias camadas ocultas
model_dnn = models.Sequential([
    layers.Dense(64, activation='relu', input_shape=(10,)),
    layers.Dense(64, activation='relu'),
    layers.Dense(64, activation='relu'),
    layers.Dense(1)
])

model_dnn.compile(optimizer='adam', loss='mean_squared_error')


###2. *Machine Learning (Aprendizado de Máquina)*:
   - Aprendizado Supervisionado
   - Aprendizado Não Supervisionado
   - Aprendizado Semi-Supervisionado
   - Aprendizado por Reforço
   - Aprendizado de Transferência


###3. *Visão Computacional*:
   - Reconhecimento de Imagens
   - Detecção de Objetos
   - Segmentação de Imagens
   - Reconhecimento Facial
   - Análise de Vídeo


###4. *Processamento de Linguagem Natural (NLP - Natural Language Processing)*:
   - Análise de Sentimentos
   - Tradução Automática
   - Resposta a Perguntas
   - Resumo Automático
   - Reconhecimento de Entidades Nomeadas

###5. *Robótica*:
   - Robótica Industrial
   - Robôs Autônomos
   - Robótica Médica
   - Robótica de Serviço

###6. *Sistemas Especialistas*:
   - Sistemas de Diagnóstico
   - Sistemas de Recomendação
   - Assistentes Virtuais

###7. *Agentes Inteligentes e Sistemas Multiagentes*:
   - Sistemas de Agentes Autônomos
   - Simulação de Multiagentes

###8. *Raciocínio Automatizado e Planejamento*:
   - Algoritmos de Busca e Otimização
   - Planejamento Automático


###9. *Inteligência Artificial Explicável (XAI - Explainable AI)*:
   - Métodos e técnicas para tornar a IA interpretável e compreensível para humanos

## Ciência de Dados

é ampla e inclui várias subcategorias, cada uma focada em aspectos diferentes do ciclo de vida dos dados e na extração de valor a partir deles. As principais subcategorias incluem:



1. *Coleta de Dados*:
   - Aquisição de Dados: Coleta de dados brutos de várias fontes.
   - Web Scraping: Extração de dados da web.
   - Sensores e IoT: Coleta de dados de dispositivos conectados.

2. *Armazenamento de Dados*:
   - Bancos de Dados Relacionais: SQL, MySQL, PostgreSQL.
   - Bancos de Dados Não Relacionais: NoSQL, MongoDB, Cassandra.
   - Data Warehousing: Armazenamento e gerenciamento de grandes volumes de dados.

3. *Preparação de Dados*:
   - Limpeza de Dados: Remoção de inconsistências e erros.
   - Integração de Dados: Combinação de dados de diferentes fontes.
   - Transformação de Dados: Conversão de dados para formatos adequados.

4. *Análise de Dados*:
   - Estatística Descritiva: Análise e resumo de dados.
   - Análise Exploratória de Dados (EDA): Exploração inicial para descobrir padrões.
   - Análise Preditiva: Modelagem para prever resultados futuros.

5. *Modelagem de Dados*:
   - Machine Learning: Criação de modelos preditivos e descritivos.
   - Deep Learning: Uso de redes neurais profundas para modelagem complexa.
   - Modelos Estatísticos: Aplicação de métodos estatísticos tradicionais.

6. *Visualização de Dados*:
   - Dashboards: Criação de painéis interativos.
   - Gráficos e Plots: Representação visual de dados.
   - Ferramentas de Visualização: Tableau, Power BI, matplotlib, Seaborn.

7. *Interpretação e Comunicação de Resultados*:
   - Storytelling com Dados: Comunicação eficaz dos insights.
   - Relatórios: Elaboração de relatórios detalhados.
   - Apresentações: Comunicação visual dos resultados para stakeholders.

8. *Engenharia de Dados*:
   - Arquitetura de Dados: Design de sistemas de gerenciamento de dados.
   - ETL (Extract, Transform, Load): Processos de extração, transformação e carregamento de dados.
   - Data Pipelines: Automação de fluxos de dados.

9. *Big Data*:
   - Tecnologias de Big Data: Hadoop, Spark.
   - Processamento em Lote: Manipulação de grandes volumes de dados de uma só vez.
   - Processamento em Tempo Real: Manipulação de dados em tempo real.

10. *Ciência de Dados Aplicada*:
    - Ciência de Dados para Negócios: Aplicações em marketing, finanças, saúde, etc.
    - Ciência de Dados em Pesquisa: Aplicações em pesquisa acadêmica e científica.

11. *Ética e Privacidade de Dados*:
    - Governança de Dados: Políticas e práticas para gerenciar dados.
    - Compliance: Conformidade com regulamentações como GDPR.
    - Segurança de Dados: Proteção contra acesso não autorizado e violações.

Essas subcategorias refletem a natureza interdisciplinar da Ciência de Dados, combinando elementos de estatística, computação, e domínio específico para extrair e comunicar insights valiosos a partir dos dados.