In [1]:
import numpy as np

# Tipos de Dados em Numpy

NumPy suporta uma variedade muito maior de tipos numéricos que Python. A lista abaixo apresenta os tipos de dados em NumPy:

Tipo de Dado | Descrição
-------------|------------------------------------------------------------------------------|
**bool_**        | Boolean (True or False) stored as a **byte**                                     |
**int_**         | Default integer type (same as C long; normally either int64 or int32)        |
**intc**         | Identical to C int (normally int32 or int64)                                 |
**intp**         | Integer used for indexing (same as C ssize_t; normally either int32 or int64)|
**int8**         | Byte (-128 to 127)                                                           |
**int16**        | Integer (-32768 to 32767)                                                    |
**int32**        | Integer (-2147483648 to 2147483647)                                          |
**int64**        | Integer (-9223372036854775808 to 9223372036854775807)                        |
**uint8**        | Unsigned integer (0 to 255)                                                  |
**uint16**       | Unsigned integer (0 to 65535)                                                |
**uint32**       | Unsigned integer (0 to 4294967295)                                           |
**uint64**       | Unsigned integer (0 to 18446744073709551615)                                 |
**float_**       | Shorthand for float64.                                                       |
**float16**      | Half precision float: sign bit, 5 bits exponent, 10 bits mantissa            |
**float32**      | Single precision float: sign bit, 8 bits exponent, 23 bits mantissa          |
**float64**      | Double precision float: sign bit, 11 bits exponent, 52 bits mantissa         |
**complex_**     | Shorthand for complex128.                                                    |
**complex64**    | Complex number, represented by two 32-bit floats                             |
**complex128**   | Complex number, represented by two 64-bit floats                             |

Para sabermos o tipo de dado de um objeto ```ndarray``` usamos a propriedade ```dtype```

In [2]:
array_inteiros = np.array([1, 2, 3])
array_inteiros.dtype

dtype('int32')

In [3]:
array_decimais = np.array([1.33, 2.14, 4.25])
array_decimais.dtype

dtype('float64')

In [4]:
array_caracteres = np.array(['AB', 'CD', 'EF'])
array_caracteres.dtype

dtype('<U2')

In [5]:
array_booleanos = np.array([True, False])
array_booleanos.dtype

dtype('bool')

# Coerção

No NumPy, quando se tem um ndarray com elementos de diferentes tipos de dados, o tipo do ndarray será decidido pelo NumPy usando algumas regras simples.

Essas regras seguem uma ordem, dando preferência aos tipos mais amplos ou que podem abranger outros tipos com segurança. Aqui estão algumas regras básicas:

- Se houver strings ou Unicode no array, o tipo será convertido para `object`.

- Se houver números inteiros e floats, o tipo será convertido para `float`.

- Se houver números complexos, o tipo será convertido para `complex`.

- Se houver booleanos, o tipo será convertido para `boolean`.

O tipo dominante é escolhido para ser capaz de lidar com todos os tipos presentes no array, mantendo a consistência e evitando a perda de informações.

In [6]:
array_misturado = np.array([1, 2.5, True, 'A', 'Hello'])
array_misturado.dtype

dtype('<U32')

# Conversão

É possível definir o tipo de dado de um ndarray atribuindo um valor a propriedade dtype durante sua criação.

In [7]:
array_inteiros = np.array([1, 2, 3, 4, 5], dtype=np.int32)
array_inteiros.dtype

dtype('int32')

Para converter o tipo de dado de um array já existente use a função ```astype()```

In [8]:
# Argumentos: ndarray.astype(dtype, order='K', casting='unsafe', subok=True, copy=True)
array_decimais = array_inteiros.astype(np.float32)
array_decimais.dtype

dtype('float32')

In [9]:
# Outro Exemplo:
array_booleanos = np.array([True, False, False, True])
array_inteiros = array_booleanos.astype(np.int64)
array_inteiros.dtype

dtype('int64')

E se o valor não puder ser convertido?

In [10]:
# ValueError te espera :D
array_caracteres = np.array(['A', 'B', 'C'])
array_inteiros = array_caracteres.astype(np.int64)
array_inteiros

ValueError: invalid literal for int() with base 10: 'A'