##### Copyright 2020 The TensorFlow Authors.

In [None]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# Introdu√ß√£o aos tensores

<table class="tfo-notebook-buttons" align="left">
  <td>     <a target="_blank" href="https://www.tensorflow.org/guide/tensor"><img src="https://www.tensorflow.org/images/tf_logo_32px.png">Ver em TensorFlow.org</a>
</td>
  <td>     <a target="_blank" href="https://colab.research.google.com/github/tensorflow/docs-l10n/blob/master/site/pt-br/guide/tensor.ipynb"><img src="https://www.tensorflow.org/images/colab_logo_32px.png">Executar no Google Colab</a>
</td>
  <td>     <a target="_blank" href="https://github.com/tensorflow/docs-l10n/blob/master/site/pt-br/guide/tensor.ipynb"><img src="https://www.tensorflow.org/images/GitHub-Mark-32px.png">Ver fonte no GitHub</a>
</td>
  <td>     <a href="https://storage.googleapis.com/tensorflow_docs/docs-l10n/site/pt-br/guide/tensor.ipynb"><img src="https://www.tensorflow.org/images/download_logo_32px.png">Baixar notebook</a>
</td>
</table>

In [None]:
import tensorflow as tf
import numpy as np

Tensores s√£o vetores multidimensionais com um tipo uniforme (chamado `dtype`). Voc√™ pode ver todos os `dtypes` suportados em `tf.dtypes.DType`.

Se voc√™ estiver familiarizado com [NumPy](https://numpy.org/devdocs/user/quickstart.html){:.external}, os tensores s√£o (mais ou menos) como os `np.arrays`.

Todos os tensores s√£o imut√°veis ‚Äã‚Äãcomo n√∫meros e strings do Python: voc√™ nunca pode atualizar o conte√∫do de um tensor, apenas criar um novo.


## Fundamentos

Primeiro, crie alguns tensores b√°sicos.

Eis um "escalar", ou tensor de "posto 0". Um escalar cont√©m um √∫nico valor e nenhum "eixo" (axis).

In [None]:
# This will be an int32 tensor by default; see "dtypes" below.
rank_0_tensor = tf.constant(4)
print(rank_0_tensor)

Um "vetor", ou tensor de "posto 1", √© como uma lista de valores. Um vetor tem um eixo:

In [None]:
# Let's make this a float tensor.
rank_1_tensor = tf.constant([2.0, 3.0, 4.0])
print(rank_1_tensor)

Uma "matriz", ou tensor de "posto 2" tem dois eixos:

In [None]:
# If you want to be specific, you can set the dtype (see below) at creation time
rank_2_tensor = tf.constant([[1, 2],
                             [3, 4],
                             [5, 6]], dtype=tf.float16)
print(rank_2_tensor)

<table>
<tr>
  <th>Um escalar: formato: <code>[]</code>
</th>
  <th>Um vetor, formato: <code>[3]</code>
</th>
  <th>Uma matriz, formato: <code>[3, 2]</code>
</th>
</tr>
<tr>
  <td>    <img src="images/tensor/scalar.png" alt="Um escalar - o n√∫mero 4">
</td>

  <td>    <img src="images/tensor/vector.png" alt="A linha com 3 se√ß√µes 3, cada qual contendo um n√∫mero.">
</td>
  <td>    <img src="images/tensor/matrix.png" alt="Uma grade 3x2, com cada c√©lula contendo um n√∫mero.">
</td>
</tr>
</table>


Tensores podem ter mais eixos (tamb√©m chamados de dimens√µes). Eis aqui um tensor com tr√™s eixos:

In [None]:
# There can be an arbitrary number of
# axes (sometimes called "dimensions")
rank_3_tensor = tf.constant([
  [[0, 1, 2, 3, 4],
   [5, 6, 7, 8, 9]],
  [[10, 11, 12, 13, 14],
   [15, 16, 17, 18, 19]],
  [[20, 21, 22, 23, 24],
   [25, 26, 27, 28, 29]],])

print(rank_3_tensor)

H√° diversas maneiras de visualizar um tensor com mais de dois eixos.

<table>
<tr>
  <th colspan="3">Um tensor de 3 eixos, formato: <code>[3, 2, 5]</code>
</th>
</tr>
<tr>
</tr>
<tr>
  <td>    <img src="images/tensor/3-axis_numpy.png">
</td>
  <td>    <img src="images/tensor/3-axis_front.png">
</td>

  <td>    <img src="images/tensor/3-axis_block.png">
</td>
</tr>

</table>

Voc√™ pode converter um tensor para um array NumPy usando `np.array` ou o m√©todo `tensor.numpy`:

In [None]:
np.array(rank_2_tensor)

In [None]:
rank_2_tensor.numpy()

Os tensores geralmente cont√™m floats e ints, mas podem tamb√©m conter muitos outros tipos, incluindo:

- n√∫meros complexos
- strings

A classe base `tf.Tensor` requer que os tensores sejam "retangulares", ou seja, que ao longo de cada eixo, cada elemento tenha o mesmo tamanho. No entanto, existem tipos especializados de tensores que podem lidar com diferentes formatos:

- Tensores irregulares (veja [RaggedTensor](#ragged_tensors) abaixo)
- Tensores esparsos (veja [SparseTensor](#sparse_tensors) abaixo)

Voc√™ pode realizar matem√°tica b√°sica com tensores, inclusive adi√ß√£o, multiplica√ß√£o elemento a elemento e multiplica√ß√£o matricial.

In [None]:
a = tf.constant([[1, 2],
                 [3, 4]])
b = tf.constant([[1, 1],
                 [1, 1]]) # Could have also said `tf.ones([2,2], dtype=tf.int32)`

print(tf.add(a, b), "\n")
print(tf.multiply(a, b), "\n")
print(tf.matmul(a, b), "\n")

In [None]:
print(a + b, "\n") # element-wise addition
print(a * b, "\n") # element-wise multiplication
print(a @ b, "\n") # matrix multiplication

Tensores s√£o usados ‚Äã‚Äãem todos os tipos de opera√ß√µes (ou "ops").

In [None]:
c = tf.constant([[4.0, 5.0], [10.0, 1.0]])

# Find the largest value
print(tf.reduce_max(c))
# Find the index of the largest value
print(tf.math.argmax(c))
# Compute the softmax
print(tf.nn.softmax(c))

Observa√ß√£o: normalmente, em qualquer lugar onde uma fun√ß√£o do TensorFlow aceite um `Tensor` como entrada, essa fun√ß√£o tamb√©m aceitar√° qualquer coisa que possa ser convertida num `Tensor` usando `tf.convert_to_tensor`. Veja abaixo um exemplo.

In [None]:
tf.convert_to_tensor([1,2,3])

In [None]:
tf.reduce_max([1,2,3])

In [None]:
tf.reduce_max(np.array([1,2,3]))

## Sobre formatos

Os tensores t√™m formatos. Eis um breve gloss√°rio:

- **Formato**: O comprimento (n√∫mero de elementos) de cada um dos eixos de um tensor.
- **Posto**: N√∫mero de eixos tensores. Um escalar tem posto 0, um vetor tem posto 1, uma matriz tem posto 2.
- **Eixo** ou **Dimens√£o**: Uma dimens√£o espec√≠fica de um tensor.
- **Tamanho**: O n√∫mero total de itens no tensor, o produto dos elementos do vetor de formato.


Observa√ß√£o: Embora voc√™ possa ver algu√©m se referir a um "tensor de duas dimens√µes", um tensor de posto 2 geralmente n√£o descreve um espa√ßo 2D.

Os objetos tensores e `tf.TensorShape` t√™m propriedades convenientes para acess√°-los:

In [None]:
rank_4_tensor = tf.zeros([3, 2, 4, 5])

<table>
<tr>
  <th colspan="2">Um tensor de posto 4, formato: <code>[3, 2, 4, 5]</code>
</th>
</tr>
<tr>
  <td> <img src="images/tensor/shape.png" alt="O formato de um tensor √© como um vetor.">
</td>
<td> <img src="images/tensor/4-axis_block.png" alt="Um tensor de 4 eixos">
</td>
  </tr>
</table>


In [None]:
print("Type of every element:", rank_4_tensor.dtype)
print("Number of axes:", rank_4_tensor.ndim)
print("Shape of tensor:", rank_4_tensor.shape)
print("Elements along axis 0 of tensor:", rank_4_tensor.shape[0])
print("Elements along the last axis of tensor:", rank_4_tensor.shape[-1])
print("Total number of elements (3*2*4*5): ", tf.size(rank_4_tensor).numpy())

Mas observe que os atributos `Tensor.ndim` e `Tensor.shape` n√£o retornam objetos `Tensor`. Se voc√™ precisar de um `Tensor` use a fun√ß√£o `tf.rank` ou `tf.shape`. Essa diferen√ßa √© sutil, mas pode ser importante ao construir grafos (posteriormente).

In [None]:
tf.rank(rank_4_tensor)

In [None]:
tf.shape(rank_4_tensor)

Embora frequentemente nos referimos ao eixos pelos seus √≠ndices, voc√™ deve sempre acompanhar o significado de cada um. Freq√ºentemente, os eixos s√£o ordenados de global para local: primeiro o eixo do lote, seguido pelas dimens√µes espaciais e por √∫ltimo as caracter√≠sticas de cada local. Dessa forma, os vetores de caracter√≠sticas ser√£o regi√µes cont√≠guas da mem√≥ria.

<table>
<tr>
<th>Ordem t√≠pica dos eixos</th>
</tr>
<tr>
    <td> <img src="images/tensor/shape2.png" alt="Acompanhe o que √© cada eixo. Um tensor de 4 eixos talvez seja: Lote, Largura, Altura, Caracter√≠sticas">
</td>
</tr>
</table>

## Indexa√ß√£o

### Indexa√ß√£o de eixo √∫nico

O TensorFlow segue as regras de indexa√ß√£o padr√£o do Python, que s√£o semelhantes √† [indexa√ß√£o de uma lista ou string em Python](https://docs.python.org/3/tutorial/introduction.html#strings){:.external}, e as regras b√°sicas para indexa√ß√£o do NumPy.

- √≠ndices come√ßam em `0`
- √≠ndices negativos contam de tr√°s para frente a partir do final
- dois pontos (`:`) s√£o usados ‚Äã‚Äãpara separar fatias: `start:stop:step`


In [None]:
rank_1_tensor = tf.constant([0, 1, 1, 2, 3, 5, 8, 13, 21, 34])
print(rank_1_tensor.numpy())

A indexa√ß√£o com um escalar remove o eixo:

In [None]:
print("First:", rank_1_tensor[0].numpy())
print("Second:", rank_1_tensor[1].numpy())
print("Last:", rank_1_tensor[-1].numpy())

A indexa√ß√£o com uma fatia `:` mant√©m o eixo:

In [None]:
print("Everything:", rank_1_tensor[:].numpy())
print("Before 4:", rank_1_tensor[:4].numpy())
print("From 4 to the end:", rank_1_tensor[4:].numpy())
print("From 2, before 7:", rank_1_tensor[2:7].numpy())
print("Every other item:", rank_1_tensor[::2].numpy())
print("Reversed:", rank_1_tensor[::-1].numpy())

### Indexa√ß√£o multieixo

Tensores de posto mais alto s√£o indexados passando m√∫ltiplos √≠ndices.

As mesmas regras do caso de eixo √∫nico aplicam-se a cada eixo independentemente.

In [None]:
print(rank_2_tensor.numpy())

Passando um n√∫mero inteiro para cada √≠ndice, o resultado ser√° um escalar.

In [None]:
# Pull out a single value from a 2-rank tensor
print(rank_2_tensor[1, 1].numpy())

Voc√™ pode indexar usando qualquer combina√ß√£o de n√∫meros inteiros e fatias:

In [None]:
# Get row and column tensors
print("Second row:", rank_2_tensor[1, :].numpy())
print("Second column:", rank_2_tensor[:, 1].numpy())
print("Last row:", rank_2_tensor[-1, :].numpy())
print("First item in last column:", rank_2_tensor[0, -1].numpy())
print("Skip the first row:")
print(rank_2_tensor[1:, :].numpy(), "\n")

Eis um exemplo com um tensor de 3 eixos:

In [None]:
print(rank_3_tensor[:, :, 4])

<table>
<tr>
<th colspan="2">Selecionando a √∫ltima caracter√≠stica em todos os locais em cada exemplo do lote</th>
</tr>
<tr>
    <td> <img src="images/tensor/index1.png" alt="Um tensor 3x2x5 com todos os valores no √≠ndice 4 do √∫ltimo eixo selecionado.">
</td>
      <td> <img src="images/tensor/index2.png" alt="Os valores selecionados empacotados num tensor de 2 eixos.">
</td>
</tr>
</table>

Leia o [guia de divis√£o de tensores](https://tensorflow.org/guide/tensor_slicing) para saber como aplicar a indexa√ß√£o para manipular elementos individuais em seus tensores.

## Manipula√ß√£o de formatos

A altera√ß√£o do formato de um tensor √© de grande utilidade.


In [None]:
# Shape returns a `TensorShape` object that shows the size along each axis
x = tf.constant([[1], [2], [3]])
print(x.shape)

In [None]:
# You can convert this object into a Python list, too
print(x.shape.as_list())

Voc√™ pode mudar o formato de um tensor para que ele tenha um novo formato. A opera√ß√£o `tf.reshape` faz isso de forma r√°pida e barata porque os dados subjacentes n√£o precisam ser duplicados.

In [None]:
# You can reshape a tensor to a new shape.
# Note that you're passing in a list
reshaped = tf.reshape(x, [1, 3])

In [None]:
print(x.shape)
print(reshaped.shape)

Os dados mant√™m seu layout na mem√≥ria e um novo tensor √© criado, com o formato solicitado, apontando para os mesmos dados. O TensorFlow usa ordena√ß√£o de mem√≥ria "linha principal" (row-major) no estilo C, onde o incremento do √≠ndice mais √† direita corresponde a uma √∫nica etapa na mem√≥ria.

In [None]:
print(rank_3_tensor)

Se voc√™ achatar um tensor, poder√° ver em que ordem ele est√° disposto na mem√≥ria.

In [None]:
# A `-1` passed in the `shape` argument says "Whatever fits".
print(tf.reshape(rank_3_tensor, [-1]))

Normalmente, o √∫nico uso razo√°vel de `tf.reshape` √© combinar ou dividir eixos adjacentes (ou adicionar/remover valores `1`).

Para este tensor 3x2x5, alterar o formato para (3x2)x5 ou 3x(2x5) s√£o coisas razo√°veis ‚Äã‚Äãa serem feitas, j√° que as fatias n√£o se misturam:

In [None]:
print(tf.reshape(rank_3_tensor, [3*2, 5]), "\n")
print(tf.reshape(rank_3_tensor, [3, -1]))

<table>
<th colspan="3"> Algumas boas altera√ß√µes de formato.</th>
<tr>
  <td> <img src="images/tensor/reshape-before.png" alt="Um tensor 3x2x5">
</td>
  <td>   <img src="images/tensor/reshape-good1.png" alt="Os mesmos dados com formato alterado para (3x2)x5">
</td>
  <td> <img src="images/tensor/reshape-good2.png" alt="Os mesmos dados com formato alterado para 3x(2x5)">
</td>
</tr>
</table>


A altera√ß√£o de formato "funcionar√°" para qualquer novo formato com o mesmo n√∫mero total de elementos, mas n√£o far√° nada de √∫til se voc√™ n√£o respeitar a ordem dos eixos.

Trocar eixos em `tf.reshape` n√£o funciona; voc√™ precisa de `tf.transpose` para isso.


In [None]:
# Bad examples: don't do this

# You can't reorder axes with reshape.
print(tf.reshape(rank_3_tensor, [2, 3, 5]), "\n") 

# This is a mess
print(tf.reshape(rank_3_tensor, [5, 6]), "\n")

# This doesn't work at all
try:
  tf.reshape(rank_3_tensor, [7, -1])
except Exception as e:
  print(f"{type(e).__name__}: {e}")

<table>
<th colspan="3"> Algumas altera√ß√µes de formato ruins.</th>
<tr>
  <td> <img src="images/tensor/reshape-bad.png" alt="Voc√™ n√£o pode reordenar eixos, use tf.transpose para isso">
</td>
  <td> <img src="images/tensor/reshape-bad4.png" alt="Qualquer coisa que misture as fatias de dados provavelmente est√° errada.">
</td>
  <td> <img src="images/tensor/reshape-bad2.png" alt="O novo formato deve caber de forma exata.">
</td>
</tr>
</table>

Voc√™ poder√° se deparar com formatos n√£o totalmente especificados. Ou o formato cont√©m um `None` (o comprimento do eixo √© desconhecido) ou todo o formato √© `None` (o posto do tensor √© desconhecido).

Com exce√ß√£o de [tf.RaggedTensor](#ragged_tensors), esses formatos ocorrer√£o apenas no contexto das APIs simb√≥licas de constru√ß√£o de grafos do TensorFlow:

- [tf.function](function.ipynb)
- A [API funcional Keras](https://www.tensorflow.org/guide/keras/functional).


## Mais sobre `DTypes`

Para inspecionar o tipo de dados de um `tf.Tensor` use a propriedade `Tensor.dtype`.

Ao criar um `tf.Tensor` a partir de um objeto Python, voc√™ pode opcionalmente especificar o tipo de dados.

Se voc√™ n√£o fizer isso, o TensorFlow escolher√° um tipo de dados que possa representar seus dados. O TensorFlow converte n√∫meros inteiros do Python em `tf.int32` e n√∫meros de ponto flutuante do Python em `tf.float32`. Caso contr√°rio, o TensorFlow usar√° as mesmas regras que o NumPy usa ao converter em arrays.

Voc√™ pode fazer um cast de um tipo para outro.

In [None]:
the_f64_tensor = tf.constant([2.2, 3.3, 4.4], dtype=tf.float64)
the_f16_tensor = tf.cast(the_f64_tensor, dtype=tf.float16)
# Now, cast to an uint8 and lose the decimal precision
the_u8_tensor = tf.cast(the_f16_tensor, dtype=tf.uint8)
print(the_u8_tensor)

## Broadcasting

Broadcasting √© um conceito emprestado do [recurso equivalente em NumPy](https://numpy.org/doc/stable/user/basics.broadcasting.html){:.external}. Em suma, sob certas condi√ß√µes, tensores menores s√£o "esticados" automaticamente para caber em tensores maiores ao executar opera√ß√µes combinadas neles.

O caso mais simples e comum √© quando voc√™ tenta multiplicar ou adicionar um tensor a um escalar. Nesse caso, √© feito o broadcast do escalar para que ele tenha o mesmo formato do outro argumento. 

In [None]:
x = tf.constant([1, 2, 3])

y = tf.constant(2)
z = tf.constant([2, 2, 2])
# All of these are the same computation
print(tf.multiply(x, 2))
print(x * y)
print(x * z)

Da mesma forma, eixos com comprimento 1 podem ser esticados para corresponder aos outros argumentos. Ambos os argumentos podem ser esticados na mesma computa√ß√£o.

Neste caso, uma matriz 3x1 √© multiplicada elemento a elemento por uma matriz 1x4 para produzir uma matriz 3x4. Observe como o 1 inicial √© opcional: O formato de y √© `[4]`.

In [None]:
# These are the same computations
x = tf.reshape(x,[3,1])
y = tf.range(1, 5)
print(x, "\n")
print(y, "\n")
print(tf.multiply(x, y))

<table>
<tr>
  <th>Broadcast de uma adi√ß√£o: a <code>[3, 1]</code> vezes a <code>[1, 4]</code> produz <code>[3,4]</code>
</th>
</tr>
<tr>
  <td> <img src="images/tensor/broadcasting.png" alt="Somar uma matriz 3x1 a uma matriz 4x1 resulta em uma matriz 3x4">
</td>
</tr>
</table>


Aqui est√° a mesma opera√ß√£o sem broadcasting:

In [None]:
x_stretch = tf.constant([[1, 1, 1, 1],
                         [2, 2, 2, 2],
                         [3, 3, 3, 3]])

y_stretch = tf.constant([[1, 2, 3, 4],
                         [1, 2, 3, 4],
                         [1, 2, 3, 4]])

print(x_stretch * y_stretch)  # Again, operator overloading

Na maioria das vezes, o broadcasting √© eficiente em termos de tempo e espa√ßo, pois a opera√ß√£o de broadcasting nunca materializa os tensores expandidos na mem√≥ria.

Voc√™ pode ver como vai ficar o broadcast usando `tf.broadcast_to`.

In [None]:
print(tf.broadcast_to(tf.constant([1, 2, 3]), [3, 3]))

Ao contr√°rio de uma opera√ß√£o matem√°tica, por exemplo, `broadcast_to` n√£o faz nada de especial para economizar mem√≥ria. Aqui, voc√™ est√° materializando o tensor.

Pode ficar ainda mais complicado. [Esta se√ß√£o](https://jakevdp.github.io/PythonDataScienceHandbook/02.05-computation-on-arrays-broadcasting.html){:.external} do livro *Python Data Science Handbook* de Jake VanderPlas mostra mais truques de broadcasting (novamente usando NumPy).

## tf.convert_to_tensor

A maioria das ops, como `tf.matmul` e `tf.reshape` aceitam argumentos da classe `tf.Tensor`. No entanto, voc√™ notar√° que no caso acima, objetos Python em forma de tensores s√£o aceitos.

A maioria, mas n√£o todas as opera√ß√µes chamam `convert_to_tensor` em argumentos n√£o tensores. H√° um registro de convers√µes, e a maioria das classes de objetos, como `ndarray`, `TensorShape`, listas Python e `tf.Variable` do NumPy, ser√£o convertidas automaticamente.

Veja `tf.register_tensor_conversion_function` para mais detalhes e, se voc√™ tiver seu pr√≥prio tipo que gostaria de converter automaticamente em um tensor.

## Tensores irregulares

Um tensor com n√∫mero vari√°vel de elementos ao longo de algum eixo √© chamado de "irregular". Use `tf.ragged.RaggedTensor` para dados irregulares.

Por exemplo, isto n√£o pode ser representado como um tensor regular:

<table>
<tr>
  <th>Um `tf.RaggedTensor`, formato: <code>[4, None]</code>
</th>
</tr>
<tr>
  <td> <img src="images/tensor/ragged.png" alt="Um tensor irregular de 2 eixos, cada linha pode ter um comprimento diferente.">
</td>
</tr>
</table>

In [None]:
ragged_list = [
    [0, 1, 2, 3],
    [4, 5],
    [6, 7, 8],
    [9]]

In [None]:
try:
  tensor = tf.constant(ragged_list)
except Exception as e:
  print(f"{type(e).__name__}: {e}")

Em vez disso, crie um `tf.RaggedTensor` usando `tf.ragged.constant`:

In [None]:
ragged_tensor = tf.ragged.constant(ragged_list)
print(ragged_tensor)

O formato de um `tf.RaggedTensor` conter√° alguns eixos com comprimentos desconhecidos:

In [None]:
print(ragged_tensor.shape)

## Tensores de string

`tf.string` √© um `dtype`, o que significa que voc√™ pode representar dados como strings (arrays de bytes de comprimento vari√°vel) em tensores.

Strings s√£o at√¥micas e n√£o podem ser indexadas da mesma forma que as strings do Python. O comprimento da string n√£o √© um dos eixos do tensor. Veja `tf.strings` para conhecer fun√ß√µes para manipul√°-las.

Aqui est√° um tensor de strings escalar:

In [None]:
# Tensors can be strings, too here is a scalar string.
scalar_string_tensor = tf.constant("Gray wolf")
print(scalar_string_tensor)

E um vetor de strings:

<table>
<tr>
  <th>Um vetor de strings, formato: <code>[3,]</code>
</th>
</tr>
<tr>
  <td> <img src="images/tensor/strings.png" alt="O comprimento da string n√£o √© um dos eixos do tensor.">
</td>
</tr>
</table>

In [None]:
# If you have three string tensors of different lengths, this is OK.
tensor_of_strings = tf.constant(["Gray wolf",
                                 "Quick brown fox",
                                 "Lazy dog"])
# Note that the shape is (3,). The string length is not included.
print(tensor_of_strings)

Na listagem acima, o prefixo `b` indica que o dtype `tf.string` n√£o √© uma string unicode, mas uma string de bytes. Consulte o [Tutorial Unicode](https://www.tensorflow.org/tutorials/load_data/unicode) para saber mais sobre como trabalhar com texto Unicode no TensorFlow.

Se voc√™ passar caracteres Unicode, eles ser√£o codificados em utf-8.

In [None]:
tf.constant("ü•≥üëç")

Algumas fun√ß√µes b√°sicas com strings podem ser encontradas em `tf.strings`, incluindo `tf.strings.split`.

In [None]:
# You can use split to split a string into a set of tensors
print(tf.strings.split(scalar_string_tensor, sep=" "))

In [None]:
# ...but it turns into a `RaggedTensor` if you split up a tensor of strings,
# as each string might be split into a different number of parts.
print(tf.strings.split(tensor_of_strings))

<table>
<tr>
  <th>Split de tr√™s strings, formato: <code>[3, None]</code>
</th>
</tr>
<tr>
  <td> <img src="images/tensor/string-split.png" alt="A divis√£o de v√°rias strings retorna um tf.RaggedTensor">
</td>
</tr>
</table>

E `tf.strings.to_number`:

In [None]:
text = tf.constant("1 10 100")
print(tf.strings.to_number(tf.strings.split(text, " ")))

Embora voc√™ n√£o possa usar `tf.cast` para transformar um tensor de string em n√∫meros, voc√™ pode convert√™-lo em bytes e depois em n√∫meros.

In [None]:
byte_strings = tf.strings.bytes_split(tf.constant("Duck"))
byte_ints = tf.io.decode_raw(tf.constant("Duck"), tf.uint8)
print("Byte strings:", byte_strings)
print("Bytes:", byte_ints)

In [None]:
# Or split it up as unicode and then decode it
unicode_bytes = tf.constant("„Ç¢„Éí„É´ ü¶Ü")
unicode_char_bytes = tf.strings.unicode_split(unicode_bytes, "UTF-8")
unicode_values = tf.strings.unicode_decode(unicode_bytes, "UTF-8")

print("\nUnicode bytes:", unicode_bytes)
print("\nUnicode chars:", unicode_char_bytes)
print("\nUnicode values:", unicode_values)

O dtype `tf.string` √© usado para todos os dados de bytes brutos no TensorFlow. O m√≥dulo `tf.io` cont√©m fun√ß√µes para converter dados de e para bytes, inclusive decodifica√ß√£o de imagens e processamento de CSV.

## Tensores esparsos

√Äs vezes, seus dados s√£o esparsos, como um espa√ßo de embedding muito largo. O TensorFlow oferece suporte a `tf.sparse.SparseTensor` e opera√ß√µes relacionadas para armazenar dados esparsos com efici√™ncia.

<table>
<tr>
  <th>Um `tf.SparseTensor`, formato: <code>[3, 4]</code>
</th>
</tr>
<tr>
  <td> <img src="images/tensor/sparse.png" alt="Uma grade 3x4, com valores em apenas duas das c√©lulas.">
</td>
</tr>
</table>

In [None]:
# Sparse tensors store values by index in a memory-efficient manner
sparse_tensor = tf.sparse.SparseTensor(indices=[[0, 0], [1, 2]],
                                       values=[1, 2],
                                       dense_shape=[3, 4])
print(sparse_tensor, "\n")

# You can convert sparse tensors to dense
print(tf.sparse.to_dense(sparse_tensor))