# üßë‚ÄçüöÄ Tensorflow

TensorFlow √© um framework de c√≥digo aberto para computa√ß√£o num√©rica baseada em grafos computacionais, otimizado para aprendizado de m√°quina e deep learning, permitindo execu√ß√£o distribu√≠da em CPUs, GPUs e TPUs.

Principais caracter√≠sticas

‚úÖ Manipula√ß√£o de tensores: O nome "TensorFlow" vem do fluxo (flow) de tensores atrav√©s de opera√ß√µes matem√°ticas.

‚úÖ Execu√ß√£o distribu√≠da: Suporte a m√∫ltiplas CPUs, GPUs e TPUs para otimizar o desempenho.

‚úÖ APIs de alto e baixo n√≠vel: Fornece desde o tf.keras (alto n√≠vel) at√© opera√ß√µes matem√°ticas de baixo n√≠vel.

‚úÖ Compatibilidade com diversos dispositivos: Funciona em desktops, servidores, dispositivos m√≥veis e at√© navegadores.

‚úÖ Treinamento e infer√™ncia otimizados: Permite treinar modelos com grandes volumes de dados e otimiz√°-los para deployment.

Em **95%** dos casos de uso que voc√™ encontrar√° n√£o exigir√£o nada al√©m da tf.keras, mas v√°rios mecanismos complexos que exigem processamento massivo de dados utilizam tensoflow, aplica√ß√µes como o *sistema de recomenda√ß√£o do spotify*, *mecanismos de busca da google*, *recomenda√ß√£o de v√≠deos no youtube*, *recomenda√ß√£o e pre√ßos do airbnb* entre outras aplica√ß√µes. Qualquer aplica√ß√£o Keras est√° usando Tensorflow "indiretamente" pois keras √© uma API de alto n√≠vel dentro do tensorflow: **tf.keras**.

# üé≤ Tensors e Opera√ß√µes

Geralmente, um *tensor* √© um array multidimensional, exatamente com oum *ndarray* da **NumPy**, mas ele tamb√©m pode conter um escalar (um valor simples, como 42). Esses tensores s√£oimportantes para criar fun√ß√µes de custos e m√©tricas customizadas, camadas personalizadas etc.

In [1]:
import tensorflow as tf

In [2]:
tf.constant([[1., 2., 3.], [4., 5., 6.]]) #Matriz

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)>

In [3]:
tf.constant(42)

<tf.Tensor: shape=(), dtype=int32, numpy=42>

podemos ver o shape e o dtype dessas constants

In [4]:
array_tf = tf.constant([[1., 2., 3.], [4., 5., 6.]]) #Matriz
array_tf.shape

TensorShape([2, 3])

In [5]:
array_tf.dtype

tf.float32

indexa√ß√£o funciona como no numpy

In [6]:
array_tf[:, 1]

<tf.Tensor: shape=(2,), dtype=float32, numpy=array([2., 5.], dtype=float32)>

In [7]:
array_tf[..., 1, tf.newaxis]

<tf.Tensor: shape=(2, 1), dtype=float32, numpy=
array([[2.],
       [5.]], dtype=float32)>

tipo de opera√ß√µes

In [8]:
tf.square(array_tf)

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[ 1.,  4.,  9.],
       [16., 25., 36.]], dtype=float32)>

In [9]:
array_tf + 10

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[11., 12., 13.],
       [14., 15., 16.]], dtype=float32)>

In [10]:
array_tf @ tf.transpose(array_tf) # O @ √© uma multiplica√ß√£o de matrizes, note que ela multiplicou seus valores, nesse caso, est√° trocando as linhas pelas colunas com o transpose

<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
array([[14., 32.],
       [32., 77.]], dtype=float32)>

essas n√£o s√£o as √∫nicas opera√ß√µes poss√≠veis, o TensorFlow basicamente faz tudo o que o numpy faz, algumas fun√ß√µes podem ter nomes diferentes, mas se procurar, achar√°.

# üìó Tensores e numpy

√â poss√≠vel criar um tensor a partir de um array *NumPy* e vice-versa:

In [11]:
import numpy as np

In [12]:
a = np.array([2., 4., 5.])
a

array([2., 4., 5.])

In [13]:
tf.constant(a)

<tf.Tensor: shape=(3,), dtype=float64, numpy=array([2., 4., 5.])>

In [14]:
tf.square(a)

<tf.Tensor: shape=(3,), dtype=float64, numpy=array([ 4., 16., 25.])>

In [15]:
np.square(array_tf)

array([[ 1.,  4.,  9.],
       [16., 25., 36.]], dtype=float32)

O TensorFlow n√£o faz nenhuma convers√£o de tipos, caso tente realizar alguma opre√ß√£o com tipos diferentes de vari√°veis, obter√° um erro:

In [17]:
tf.constant(2.) + tf.constant(40)

InvalidArgumentError: cannot compute AddV2 as input #1(zero-based) was expected to be a float tensor but is a int32 tensor [Op:AddV2] name: 

o erro abaixo √© pelo fato do tensorflow utilizar float32 ao inv√©s de float64, essa diferen√ßa ajuda na performance.

In [18]:
tf.constant(2.) + tf.constant(40., dtype=tf.float64)

InvalidArgumentError: cannot compute AddV2 as input #1(zero-based) was expected to be a float tensor but is a double tensor [Op:AddV2] name: 

se precisar converter um tipo, utilize o **tf.cast**

In [19]:
t2 = tf.constant(40., dtype=tf.float64)

In [20]:
tf.constant(2.0) + tf.cast(t2, tf.float32) # convertendo primeiro para float32

<tf.Tensor: shape=(), dtype=float32, numpy=42.0>

# üé≤ Vari√°veis

Os valores de tf.Tensor s√£o imut√°veis, n√£o podemos utilizar tensors regulares para implementar pesos em uma rede neural, pois eles precisam ser ajustados pela retropropaga√ß√£o. Al√©m disso, outros par√¢mtros tamb√©m precisam mudar ao longo do tempo, para isso, utilizamos vari√°veis tensors:

Essa parte dificilmente √© usada, pois para adicionarmos pesos temos o **add_weight()**, al√©m de que par√¢metros j√° s√£o atualizados pelos otimizadores.

In [21]:
a = tf.Variable([[1., 2., 3.], [4., 5., 6.]])
a

<tf.Variable 'Variable:0' shape=(2, 3) dtype=float32, numpy=
array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)>

In [22]:
a.assign(2 * a)

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2.,  4.,  6.],
       [ 8., 10., 12.]], dtype=float32)>

In [23]:
a[:, 2].assign([0., 1.])

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2.,  4.,  0.],
       [ 8., 10.,  1.]], dtype=float32)>

In [24]:
a.scatter_nd_update(indices=[[0, 0], [1, 2]], updates=[100., 200.])

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[100.,   4.,   0.],
       [  8.,  10., 200.]], dtype=float32)>

# üì• Gr√°fos

No TensorFlow, um grafo computacional (ou apenas "grafo") √© uma representa√ß√£o dos c√°lculos como um conjunto de n√≥s (opera√ß√µes) e arestas (dados que fluem entre essas opera√ß√µes).

Em vez de executar cada opera√ß√£o imediatamente (como no Python puro), o TensorFlow pode construir um grafo primeiro e depois execut√°-lo de forma otimizada. Isso √© √∫til para acelerar c√°lculos, especialmente em GPUs e TPUs.

‚úÖ **Defini√ß√£o**: O TensorFlow constr√≥i um grafo computacional quando voc√™ define fun√ß√µes decoradas com @tf.function.

‚úÖ **Otimiza√ß√£o**: O grafo otimiza as opera√ß√µes, eliminando redund√¢ncias e paralelizando c√°lculos.

‚úÖ **Execu√ß√£o**: O grafo pode ser salvo, carregado e executado v√°rias vezes sem precisar ser redefinido.

Abaixo tem um exemplo bem simples de uma fun√ß√£o Tensor, ela processa uma entrada e, se for uma string, o √∫ltimo caractere √© removido; se for um float, ele √© convertido em inteiro:

In [36]:
import tensorflow as tf

@tf.function
def process_input(x):
    if tf.is_tensor(x):  # Garantindo que seja um tensor
        x = tf.convert_to_tensor(x)

    # Caso x seja uma string
    if x.dtype == tf.string:
        # Se o tensor for escalar (rank 0), usamos substr para remover o √∫ltimo caractere
        if x.shape.rank == 0:
            return tf.strings.substr(x, 0, tf.strings.length(x) - 1)  # Remove o √∫ltimo caractere
        else:
            return x[:, :-1]  # Caso contr√°rio, pode-se realizar o slicing para tensores maiores
    # Caso x seja um float
    elif x.dtype == tf.float32 or x.dtype == tf.float64:
        return tf.cast(x, tf.int32)  # Converte para inteiro
    else:
        return x  # Retorna o original se n√£o for string ou float

# Testando com diferentes entradas
input_float = tf.constant(3.7, dtype=tf.float32)
input_string = tf.constant("Hello", dtype=tf.string)

output_float = process_input(input_float)
output_string = process_input(input_string)

print(f"Entrada Float: {input_float.numpy()} ‚Üí Sa√≠da: {output_float.numpy()}")
print(f"Entrada String: {input_string.numpy().decode()} ‚Üí Sa√≠da: {output_string.numpy().decode()}")

Entrada Float: 3.700000047683716 ‚Üí Sa√≠da: 3
Entrada String: Hello ‚Üí Sa√≠da: Hell


H√° uma infinidade de possibilidades com o uso de Tensors. O principal objetivo √© a otimiza√ß√£o no tratamento de dados em grande escala. A seguir, teremos um cap√≠tulo dedicado ao pipeline de processamento de dados volumosos. Continue com o [PreProcessingTensorFlow.ipynb](PreProcessingTensorFlow.ipynb)