In [1]:
import numpy as np

# Tipos de Dados em Numpy

NumPy suporta uma variedade muito maior de tipos numéricos que Python. A lista abaixo apresenta os tipos de dados em NumPy:

- **int8, int16, int32, int64**: Inteiros com sinal de 8, 16, 32 e 64 bits, respectivamente.
- **uint8, uint16, uint32, uint64**: Inteiros sem sinal de 8, 16, 32 e 64 bits, respectivamente.
- **float16, float32, float64, float128**: Números de ponto flutuante de 16, 32, 64 e 128 bits, respectivamente.
- **complex64, complex128, complex256**: Números complexos representados com 64, 128 e 256 bits, respectivamente.
- **bool**: Tipo booleano representando valores True ou False.
- **object**: Tipo genérico que pode conter qualquer tipo de objeto Python.
- **string_**: Tipo para armazenar strings de tamanho fixo.
- **unicode_**: Tipo para armazenar strings Unicode de tamanho fixo.

Para sabermos o tipo de dado de um objeto ```ndarray``` usamos a propriedade ```dtype```

In [2]:
array_inteiros = np.array([1, 2, 3])
array_inteiros.dtype

dtype('int32')

In [3]:
array_decimais = np.array([1.33, 2.14, 4.25])
array_decimais.dtype

dtype('float64')

In [4]:
array_caracteres = np.array(['AB', 'CD', 'EF'])
array_caracteres.dtype

dtype('<U2')

In [5]:
array_booleanos = np.array([True, False])
array_booleanos.dtype

dtype('bool')

# Coerção

No NumPy, quando se tem um ndarray com elementos de diferentes tipos de dados, o tipo do ndarray será decidido pelo NumPy usando algumas regras simples.

Essas regras seguem uma ordem, dando preferência aos tipos mais amplos ou que podem abranger outros tipos com segurança. Aqui estão algumas regras básicas:

- Se houver strings ou Unicode no array, o tipo será convertido para `object`.

- Se houver números inteiros e floats, o tipo será convertido para `float`.

- Se houver números complexos, o tipo será convertido para `complex`.

- Se houver booleanos, o tipo será convertido para `boolean`.

O tipo dominante é escolhido para ser capaz de lidar com todos os tipos presentes no array, mantendo a consistência e evitando a perda de informações.

In [6]:
array_misturado = np.array([1, 2.5, True, 'A', 'Hello'])
array_misturado.dtype

dtype('<U32')

# Conversão

É possível definir o tipo de dado de um ndarray atribuindo um valor a propriedade dtype durante sua criação.

In [7]:
array_inteiros = np.array([1, 2, 3, 4, 5], dtype=np.int32)
array_inteiros.dtype

dtype('int32')

Para converter o tipo de dado de um array já existente use a função ```astype()```

In [8]:
# Argumentos: ndarray.astype(dtype, order='K', casting='unsafe', subok=True, copy=True)
array_decimais = array_inteiros.astype(np.float32)
array_decimais.dtype

dtype('float32')

In [9]:
# Outro Exemplo:
array_booleanos = np.array([True, False, False, True])
array_inteiros = array_booleanos.astype(np.int64)
array_inteiros.dtype

dtype('int64')

E se o valor não puder ser convertido?

In [10]:
# ValueError te espera :D
array_caracteres = np.array(['A', 'B', 'C'])
array_inteiros = array_caracteres.astype(np.int64)
array_inteiros

ValueError: invalid literal for int() with base 10: 'A'