# Numpy



In [1]:
# Importando a biblioteca numpy
import numpy as np

In [2]:
# Criando um array de 1 dimensão
uma_dim = np.array([1,2,3,4])

In [3]:
type(uma_dim)

numpy.ndarray

In [4]:
# Qtde dimensões do array.
uma_dim.ndim

1

In [5]:
# Criando um array de 2 dimensões.
duas_dim = np.array([(1,2,3), (4,5,6)])

In [6]:
# Qtde dimensões do array.
duas_dim.ndim

2

In [7]:
# Cria um array de números aleatórios.
# Um array de 5 linhas e duas dimensões.
np.random.random((5,2))

array([[0.50582859, 0.98770177],
       [0.06039924, 0.33598758],
       [0.50184751, 0.52386642],
       [0.67008898, 0.46945076],
       [0.25095517, 0.52629378]])

In [8]:
# Cria um array com valores esparsos iniciando com o valor 10, menor que 50 e incrementando de 5 em 5.
np.arange(10,50,5)

array([10, 15, 20, 25, 30, 35, 40, 45])

In [9]:
# cria um array linear de 0 a 2 de no máximo 9 elementos.
np.linspace(0,2,9)

array([0.  , 0.25, 0.5 , 0.75, 1.  , 1.25, 1.5 , 1.75, 2.  ])

In [10]:
# Cria um array com valores zerado de 3 linhas e 4 dimensões.
np.zeros((3,4))

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

# Numpy Arrays X Listas

- Arrays Numpy permitem fazermos operações em **arrays inteiros** de forma rápida.
- Listas não permitem operações em todos os elementos da lista.
- Para operações em todos os elementos é preciso interar sobre toda a lista.
- Listas em Python armazenam diferentes tipos de objetos
- Arrays Numpy considera todos os elementos de tipos distintos como strings


In [11]:
# Criando uma lista em Python.
lista = [1,2,3]

In [12]:
# Multiplicar valores da lista por 2.
lista * 2

[1, 2, 3, 1, 2, 3]

In [13]:
# Transforme a variável lista em um array Numpy
lista = np.array(lista)

In [14]:
# Imprimindo o tipo do objeto.
type(lista)

numpy.ndarray

In [15]:
# Multiplicando cada elemento por 2.
lista * 2

array([2, 4, 6])

In [16]:
# Calcular IMC de pessoas.
pesos = [67,81,120,90]
altura = [1.68,1.70,1.75,1.85]

In [17]:
# Faz o calculo usando as listas
(pesos / (altura ** 2))

TypeError: unsupported operand type(s) for ** or pow(): 'list' and 'int'

In [18]:
# Transforme isso em arrays numpy
pesos = np.array(pesos)
altura = np.array(altura)

In [19]:
# Imprime o calculo de cada valor
pesos / altura **2

array([23.73866213, 28.02768166, 39.18367347, 26.29656684])

In [20]:
# Arrays Numpy armazena elementos como strins quando estes não são inteiros ou float
a = np.array([1,3,'Casa',True])

In [21]:
a

array(['1', '3', 'Casa', 'True'], dtype='<U11')

In [22]:
a * 2 

TypeError: ufunc 'multiply' did not contain a loop with signature matching types dtype('<U11') dtype('<U11') dtype('<U11')

# Atributos e Métodos Úteis 

 Métodos disponíveis (digite o . pressione tab)
 
duas_dim. pressione tab

In [23]:
duas_dim

array([[1, 2, 3],
       [4, 5, 6]])

In [24]:
# Retorna a forma do array no formato linhas e colunas.
duas_dim.shape

(2, 3)

In [25]:
# Retorna a quantidade de dimensões.
duas_dim.ndim

2

In [26]:
# Imprimindo o valor máximo do array.
duas_dim.max()

6

In [27]:
# Imprimindo o valor mínimo.
duas_dim.min()

1

In [28]:
# Imprimindo o valor médio de todos os valores do array.
duas_dim.mean()

3.5

In [29]:
# Imprimindo o desvio padrão.
duas_dim.std()

1.707825127659933

In [30]:
# Tipo do array
duas_dim.dtype

dtype('int32')

In [31]:
# Tamanho do array
duas_dim.size

6

In [32]:
# mostra a quantidade
duas_dim.itemsize

4

In [33]:
# Somando todos os elementos do array.
duas_dim.sum()

21

#  Transformando Arrays

In [34]:
# Gera a Transposta da Matriz (Linha -> coluna)
duas_dim.T

array([[1, 4],
       [2, 5],
       [3, 6]])

In [35]:
# Transforma em uma matriz de uma linha.
# É muito comum em bibliotecas como scikit-learn e Keras
duas_dim.reshape(-1)

array([1, 2, 3, 4, 5, 6])

In [36]:
tree = np.random.random((5,3))

In [37]:
tree.shape

(5, 3)

In [38]:
tree

array([[0.29536605, 0.04763225, 0.56506589],
       [0.95932797, 0.81149976, 0.59051367],
       [0.26615845, 0.72361507, 0.79837319],
       [0.73988492, 0.658624  , 0.11505888],
       [0.43245912, 0.4146422 , 0.02176146]])

In [39]:
# Transforma em uma matriz com 3 linhas e 5 colunas
tree.reshape(3,5)

array([[0.29536605, 0.04763225, 0.56506589, 0.95932797, 0.81149976],
       [0.59051367, 0.26615845, 0.72361507, 0.79837319, 0.73988492],
       [0.658624  , 0.11505888, 0.43245912, 0.4146422 , 0.02176146]])

In [40]:
tree.reshape(-1)

array([0.29536605, 0.04763225, 0.56506589, 0.95932797, 0.81149976,
       0.59051367, 0.26615845, 0.72361507, 0.79837319, 0.73988492,
       0.658624  , 0.11505888, 0.43245912, 0.4146422 , 0.02176146])

In [41]:
t=tree.reshape(1,15)
t

array([[0.29536605, 0.04763225, 0.56506589, 0.95932797, 0.81149976,
        0.59051367, 0.26615845, 0.72361507, 0.79837319, 0.73988492,
        0.658624  , 0.11505888, 0.43245912, 0.4146422 , 0.02176146]])

In [42]:
# Adicionando elementos a um array, transformando em um array de 1 linha
duas_dim = np.insert(duas_dim,0,10)

In [43]:
duas_dim

array([10,  1,  2,  3,  4,  5,  6])

In [44]:
# Apagando o elemento da primeira posição do array.
duas_dim = np.delete(duas_dim,[0])

In [45]:
duas_dim

array([1, 2, 3, 4, 5, 6])

In [46]:
# Gerando um arquivo .txt a partir de um array
np.savetxt("dataset_array.txt",duas_dim, delimiter=',')

# Acessando Dimensões no Array

In [47]:
# Gera um array aleatório de 10 linhas e 2 colunas
# formato linha,coluna
meuarray = np.random.random([10,2])
meuarray

array([[0.50087321, 0.08844739],
       [0.32978609, 0.08153054],
       [0.79517827, 0.37120754],
       [0.48720149, 0.34978596],
       [0.9120276 , 0.3352719 ],
       [0.39376357, 0.40474729],
       [0.82239716, 0.70153587],
       [0.52617927, 0.17878854],
       [0.47287823, 0.6985115 ],
       [0.0099072 , 0.98739811]])

In [48]:
# Imprimindo o primeiro elemento (1 linha)
meuarray[0]

array([0.50087321, 0.08844739])

In [49]:
# Imprimindo o primeiro elemento da coluna 1
meuarray[0][0]

0.500873214447358

In [50]:
# Primeiro elemento da coluna 2
meuarray[0][1]

0.08844738662139118

In [51]:
# Segundo elemento da coluna 2
meuarray[1][1]

0.08153053809423594

In [52]:
# Segundo elemento da coluna escrito com virgula.
# O primeiro valor especifica a linha e o segundo valor especifica a coluna.
meuarray[1,1]

0.08153053809423594

In [53]:
# Imprimindo até 3 valores da coluna 2
meuarray[:3,1]

array([0.08844739, 0.08153054, 0.37120754])

In [54]:
# Imprime todas as linhas da coluna 2 * 10
meuarray[:,1] * 10

array([0.88447387, 0.81530538, 3.7120754 , 3.49785956, 3.35271897,
       4.04747291, 7.01535874, 1.78788545, 6.98511498, 9.87398109])

In [55]:
# Comparação retorna indices
meuarray > 0.50

array([[ True, False],
       [False, False],
       [ True, False],
       [False, False],
       [ True, False],
       [False, False],
       [ True,  True],
       [ True, False],
       [False,  True],
       [False,  True]])

In [56]:
# Acessando valores por índices
meuarray[meuarray > 0.50]

array([0.50087321, 0.79517827, 0.9120276 , 0.82239716, 0.70153587,
       0.52617927, 0.6985115 , 0.98739811])

# Carregar Arrays NumPy a partir de arquivos de Texto

In [57]:
# Lendo um arquivo do tipo .txt
dataset = np.loadtxt('dados/dataset_array.txt', delimiter=',')

In [58]:
dataset.shape

(6,)

In [59]:
dataset

array([1., 2., 3., 4., 5., 6.])

In [60]:
# carregando um arquivo dividido em 3 arrays
a, b, c = np.loadtxt('dados/dataset_valores.txt', skiprows=1, unpack=True )

In [61]:
# Array a
a

array([0.4839, 0.1292, 0.1781, 0.7676, 0.5993])

In [62]:
# Array B
b

array([0.4536, 0.6875, 0.3049, 0.5801, 0.4357])

In [63]:
# Array C
c

array([0.3561, 0.6565, 0.8928, 0.2038, 0.741 ])

In [64]:
# Carrega o arquivo ignorando as 2 primeiras linhas e preenchendo os valores vazio por 0
# Obs: os valores string também são convertidos!!

dataset = np.genfromtxt('dados/dataset_valores_vazio.txt', skip_header=2, filling_values=0)

In [65]:
dataset

array([[0.4839, 0.4536, 0.3561],
       [0.1292, 0.6875, 0.    ],
       [0.1781, 0.3049, 0.8928],
       [0.    , 0.5801, 0.2038],
       [0.5993, 0.4357, 0.741 ]])