# Manipulação de arrays Numpy

### Importando o NumPy

In [1]:
# Importando o NumPy
import numpy as np

### Alterando, adicionando e removendo elementos

In [2]:
# Criando um array de 1 dimensão
a1D = np.random.randint(1,200, 12)
a1D

array([138, 111,  78,  97,  13, 151, 135, 131,  21,   8,  37, 156])

In [3]:
# Criando um array de 2 dimensões
a2D = np.random.randint(1,200, (3,4))
a2D

array([[ 28,  28, 175, 119],
       [ 81,   2,  47,  13],
       [168, 147, 110,   8]])

In [4]:
# Criando um array de 3 dimensões
a3D = np.random.randint(1,200, (2,3,6)) # 2 páginas/faces, 3 linhas, 6 colunas
a3D

array([[[132, 155, 182, 172, 152,  54],
        [ 29, 145,  13, 166,  39, 184],
        [ 28, 100,  86, 164, 149, 140]],

       [[ 68,  10,  24, 150, 171,  86],
        [183, 140,  55, 195, 181,  57],
        [107, 166,  78, 104,  52, 130]]])

In [5]:
# Alterando o elemento do índice 0
a1D[0] = -1
a1D

array([ -1, 111,  78,  97,  13, 151, 135, 131,  21,   8,  37, 156])

In [6]:
# Alterando o elemento da linha 1, coluna 2
a2D[1][2] = -1
a2D

array([[ 28,  28, 175, 119],
       [ 81,   2,  -1,  13],
       [168, 147, 110,   8]])

In [7]:
# Alterando o elemento da face 1, linha 2, coluna 4
a3D[1][2][4] = -1
a3D

array([[[132, 155, 182, 172, 152,  54],
        [ 29, 145,  13, 166,  39, 184],
        [ 28, 100,  86, 164, 149, 140]],

       [[ 68,  10,  24, 150, 171,  86],
        [183, 140,  55, 195, 181,  57],
        [107, 166,  78, 104,  -1, 130]]])

In [8]:
# Retorna array com elementos adicionados no final
a1D_modificado = np.append(a1D, [100, 130])
a1D_modificado

array([ -1, 111,  78,  97,  13, 151, 135, 131,  21,   8,  37, 156, 100,
       130])

In [9]:
a1D # a1D não foi modificado

array([ -1, 111,  78,  97,  13, 151, 135, 131,  21,   8,  37, 156])

In [10]:
a2D_modificado = np.append(a2D, [100, 130]) # Lineariza a2D e insere os elementos no final
a2D_modificado

array([ 28,  28, 175, 119,  81,   2,  -1,  13, 168, 147, 110,   8, 100,
       130])

In [11]:
a2D # a2D não foi modificado

array([[ 28,  28, 175, 119],
       [ 81,   2,  -1,  13],
       [168, 147, 110,   8]])

In [12]:
a3D_modificado = np.append(a3D, [100, 130]) # Lineariza a3D e insere os elementos no final
a3D_modificado

array([132, 155, 182, 172, 152,  54,  29, 145,  13, 166,  39, 184,  28,
       100,  86, 164, 149, 140,  68,  10,  24, 150, 171,  86, 183, 140,
        55, 195, 181,  57, 107, 166,  78, 104,  -1, 130, 100, 130])

In [13]:
a3D # a3D não foi modificado

array([[[132, 155, 182, 172, 152,  54],
        [ 29, 145,  13, 166,  39, 184],
        [ 28, 100,  86, 164, 149, 140]],

       [[ 68,  10,  24, 150, 171,  86],
        [183, 140,  55, 195, 181,  57],
        [107, 166,  78, 104,  -1, 130]]])

In [14]:
a1D_modificado2 = np.delete(a1D_modificado, [0, 1, 3])
print(a1D_modificado)
print(a1D_modificado2)

[ -1 111  78  97  13 151 135 131  21   8  37 156 100 130]
[ 78  13 151 135 131  21   8  37 156 100 130]


### Comparação entre arrays

In [15]:
a1D = np.array([1, 2, 3, 4, 5])
b1D = np.array([3, 2, 1, 4, 5])
a1D == b1D # Comparação elemento a elemento

array([False,  True, False,  True,  True])

In [16]:
c1D = np.random.randint(1,10,20)
c1D

array([7, 6, 3, 5, 6, 1, 9, 1, 6, 6, 8, 9, 3, 3, 3, 1, 8, 8, 2, 6])

In [17]:
c1D == 5

array([False, False, False,  True, False, False, False, False, False,
       False, False, False, False, False, False, False, False, False,
       False, False])

In [18]:
c1D[c1D == 5]

array([5])

### Operações entre arrays e escalares

In [19]:
a1D = np.arange(1,11)
a1D

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [20]:
b1D = np.arange(1,20,2)
b1D

array([ 1,  3,  5,  7,  9, 11, 13, 15, 17, 19])

In [21]:
c1D = 2 * a1D # Cada elemento de a1D será multiplicado por 2
c1D

array([ 2,  4,  6,  8, 10, 12, 14, 16, 18, 20])

In [22]:
d1D = b1D + 5 # Soma 5 para cada elemento de b1D
d1D

array([ 6,  8, 10, 12, 14, 16, 18, 20, 22, 24])

In [23]:
e1D = b1D - 3
e1D

array([-2,  0,  2,  4,  6,  8, 10, 12, 14, 16])

In [24]:
f1D = a1D / 5
f1D

array([0.2, 0.4, 0.6, 0.8, 1. , 1.2, 1.4, 1.6, 1.8, 2. ])

In [25]:
celsius = np.arange(-20, 36) # Cria um array com o valores de -20 a 35, representando a temperatura em graus Celsius
fahrenheit = celsius * (9/5) + 32 # Cria um array convertendo cada valor em Celsius para fahrenheit

fahrenheit

array([-4. , -2.2, -0.4,  1.4,  3.2,  5. ,  6.8,  8.6, 10.4, 12.2, 14. ,
       15.8, 17.6, 19.4, 21.2, 23. , 24.8, 26.6, 28.4, 30.2, 32. , 33.8,
       35.6, 37.4, 39.2, 41. , 42.8, 44.6, 46.4, 48.2, 50. , 51.8, 53.6,
       55.4, 57.2, 59. , 60.8, 62.6, 64.4, 66.2, 68. , 69.8, 71.6, 73.4,
       75.2, 77. , 78.8, 80.6, 82.4, 84.2, 86. , 87.8, 89.6, 91.4, 93.2,
       95. ])

In [26]:
# Somando cada elemento de a1D a b1D
g1D = a1D + b1D
print(a1D)
print(b1D)
print("-"*31)
print(g1D)

[ 1  2  3  4  5  6  7  8  9 10]
[ 1  3  5  7  9 11 13 15 17 19]
-------------------------------
[ 2  5  8 11 14 17 20 23 26 29]


In [27]:
# Outra forma de somar cada elemento de a1D a b1D
h1D = np.add(a1D, b1D)
print(a1D)
print(b1D)
print("-"*31)
print(h1D)

[ 1  2  3  4  5  6  7  8  9 10]
[ 1  3  5  7  9 11 13 15 17 19]
-------------------------------
[ 2  5  8 11 14 17 20 23 26 29]


In [28]:
i1D = h1D - g1D
print(h1D)
print(g1D)
print("-"*31)
print(i1D)

[ 2  5  8 11 14 17 20 23 26 29]
[ 2  5  8 11 14 17 20 23 26 29]
-------------------------------
[0 0 0 0 0 0 0 0 0 0]


In [29]:
# Outra forma de somar cada elemento de a1D a b1D
j1D = np.subtract(h1D, g1D)
print(h1D)
print(g1D)
print("-"*31)
print(j1D)

[ 2  5  8 11 14 17 20 23 26 29]
[ 2  5  8 11 14 17 20 23 26 29]
-------------------------------
[0 0 0 0 0 0 0 0 0 0]


In [30]:
a1D = np.arange(1, 6)
a1D

array([1, 2, 3, 4, 5])

In [31]:
b1D = np.arange(6,11)
b1D

array([ 6,  7,  8,  9, 10])

In [32]:
c1D = a1D * b1D
c1D

array([ 6, 14, 24, 36, 50])

In [33]:
d1D = np.multiply(a1D, b1D)
d1D

array([ 6, 14, 24, 36, 50])

In [34]:
e1D = c1D / a1D
e1D

array([ 6.,  7.,  8.,  9., 10.])

In [35]:
f1D = np.divide(c1D, a1D)
f1D

array([ 6.,  7.,  8.,  9., 10.])

In [36]:
g1D = np.arange(1,10)
g1D

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [37]:
raiz1D = np.sqrt(g1D)
raiz1D

array([1.        , 1.41421356, 1.73205081, 2.        , 2.23606798,
       2.44948974, 2.64575131, 2.82842712, 3.        ])

### Algumas funções

In [38]:
d2D = np.random.randint(1, 101, (5,10)) # Array de 5 linhas x 10 colunas preenchidos com valores aleatórios entre 1 e 100
d2D

array([[84, 78, 31, 65, 46, 20, 12, 87, 27, 88],
       [29, 27, 95, 76, 72, 17, 46, 41, 88, 88],
       [61, 57, 12, 20, 35,  7, 49, 73, 96, 36],
       [23, 93, 36, 87, 57, 81, 80, 16, 37, 97],
       [86, 27, 68, 86, 43, 96, 54, 50, 41, 88]])

#### Obs: como os valores valores são gerados aleatoriamente, sua matriz provavelmente será diferente da gerada acima

In [39]:
# Soma de todos os elementos
d2D.sum()

2809

In [40]:
# Soma de todos os elementos de cada coluna (eixo 0)
d2D.sum(axis = 0)

array([283, 282, 242, 334, 253, 221, 241, 267, 289, 397])

In [41]:
# Soma de todos os elementos de cada linha (eixo 1)
d2D.sum(axis = 1)

array([538, 579, 446, 607, 639])

In [42]:
somacol = sum(d2D) # A função sum() do Python retornará a soma de todas as colunas
somacol

array([283, 282, 242, 334, 253, 221, 241, 267, 289, 397])

In [43]:
# Retorna o menor valor geral
d2D.min()

7

In [44]:
# Retorna o menor valor de cada coluna (eixo 0)
d2D.min(axis=0)

array([23, 27, 12, 20, 35,  7, 12, 16, 27, 36])

In [45]:
# Retorna o menor valor de cada linha (eixo 1)
d2D.min(axis=1)

array([12, 17,  7, 16, 27])

In [46]:
# Retorna o maior valor geral
d2D.max()

97

In [47]:
# Retorna o maior valor de cada coluna (eixo 0)
d2D.max(axis=0)

array([86, 93, 95, 87, 72, 96, 80, 87, 96, 97])

In [48]:
# Retorna o maior valor de cada linha (eixo 1)
d2D.max(axis=1)

array([88, 95, 96, 97, 96])

In [49]:
# Retorna a soma cumulativa
d2D.cumsum()

array([  84,  162,  193,  258,  304,  324,  336,  423,  450,  538,  567,
        594,  689,  765,  837,  854,  900,  941, 1029, 1117, 1178, 1235,
       1247, 1267, 1302, 1309, 1358, 1431, 1527, 1563, 1586, 1679, 1715,
       1802, 1859, 1940, 2020, 2036, 2073, 2170, 2256, 2283, 2351, 2437,
       2480, 2576, 2630, 2680, 2721, 2809], dtype=int32)

In [50]:
# Retorna a soma cumulativa para cada coluna (eixo = 0)
d2D.cumsum(axis = 0)

array([[ 84,  78,  31,  65,  46,  20,  12,  87,  27,  88],
       [113, 105, 126, 141, 118,  37,  58, 128, 115, 176],
       [174, 162, 138, 161, 153,  44, 107, 201, 211, 212],
       [197, 255, 174, 248, 210, 125, 187, 217, 248, 309],
       [283, 282, 242, 334, 253, 221, 241, 267, 289, 397]], dtype=int32)

In [51]:
d2D

array([[84, 78, 31, 65, 46, 20, 12, 87, 27, 88],
       [29, 27, 95, 76, 72, 17, 46, 41, 88, 88],
       [61, 57, 12, 20, 35,  7, 49, 73, 96, 36],
       [23, 93, 36, 87, 57, 81, 80, 16, 37, 97],
       [86, 27, 68, 86, 43, 96, 54, 50, 41, 88]])

In [52]:
# Retorna a soma cumulativa para cada linha (eixo = 1)
x = d2D.cumsum(axis = 1)
x

array([[ 84, 162, 193, 258, 304, 324, 336, 423, 450, 538],
       [ 29,  56, 151, 227, 299, 316, 362, 403, 491, 579],
       [ 61, 118, 130, 150, 185, 192, 241, 314, 410, 446],
       [ 23, 116, 152, 239, 296, 377, 457, 473, 510, 607],
       [ 86, 113, 181, 267, 310, 406, 460, 510, 551, 639]], dtype=int32)

In [53]:
# Retorna a média aritmética
d2D.mean()

56.18

In [54]:
# Retorna a média aritmética para cada coluna (eixo = 0)
d2D.mean(axis = 0)

array([56.6, 56.4, 48.4, 66.8, 50.6, 44.2, 48.2, 53.4, 57.8, 79.4])

In [55]:
# Retorna a média aritmética para cada linha (eixo = 1)
d2D.mean(axis = 1)

array([53.8, 57.9, 44.6, 60.7, 63.9])

In [56]:
# Retorna o desvio padrão
d2D.std()

27.82638316418431

In [57]:
# Retorna o desvio padrão para cada coluna (eixo = 0)
d2D.std(axis = 0)

array([26.55258933, 26.59022377, 29.45233437, 24.71760506, 12.81561547,
       36.73363581, 21.72924297, 24.80806321, 28.40704138, 21.97817099])

In [58]:
# Retorna o desvio padrão para cada linha (eixo = 1)
d2D.std(axis = 1)

array([28.43167248, 27.57698316, 26.71778434, 29.05529212, 22.84491191])

In [None]:
# Retorna a mediana (geral)
np.median(d2D)

In [None]:
# Retorna a mediana para cada coluna (eixo = 0)
np.median(d2D, axis = 0)

In [None]:
# Retorna a mediana para cada linha (eixo = 1)
np.median(d2D, axis = 1)

### Copiando e concatenando arrays

In [None]:
a2D = np.random.randint(1,50, (4,5))
a2D

In [None]:
b2D = np.random.randint(50,100, (4,5))
b2D

In [None]:
c2D = a2D
c2D

In [None]:
# Aparentemente ocorreu uma cópia dos arrays, mas veja o que acontece se alterarmos alguns elementos
c2D[c2D < 20] = -1
c2D

In [None]:
a2D 

Os elementos de a2D também foram alterados. :-(

In [None]:
# Redefinindo os elementos de a2D
a2D = np.random.randint(1,50, (4,5))
a2D

In [None]:
# Forma correta de copiar um array parece que com a forma de copiar uma lista
c2D = a2D.copy()
c2D

In [None]:
c2D[c2D < 20] = -1
c2D

In [None]:
a2D

Agora sim!!!

### Ordenando os elementos de um array

In [None]:
a1D = np.random.randint(1,100, 15)
a1D

In [None]:
a1D.sort()
a1D

In [None]:
a2D = np.random.randint(1,100, (6,10))
a2D

In [None]:
a2D.sort() # Por padrão ordena o maior eixo (nesse caso o eixo 1, linhas)
a2D

In [None]:
a2D.sort(axis=0) # Ordenando pelo eixo 0 (colunas)
a2D

In [None]:
a2D = np.random.randint(1,100, (6,10))
a2D

In [None]:
a2D.sort(axis=1) # Ordenando pelo eixo 1 (linhas)
a2D

### Transposição de arrays

In [None]:
a2D = np.array([[1,2,3,4],[5,6,7,8]])
a2D

In [None]:
a2DT = a2D.T # Retorna a transposta
a2DT

In [None]:
a2D # a2D original não foi transposto

In [None]:
a2D.transpose() # Retorna a transposta

In [None]:
a2D # a2D original não foi transposto

### Mudando o formato de um array - reshape()

In [None]:
a1D = np.arange(1,25)
a1D

In [None]:
print(a1D.shape)
a1D.shape = (2,12)
print(a1D.shape)
print(a1D)

In [None]:
a2D_4x6 = a1D.reshape(4,6)
a2D_4x6

In [None]:
a1D

In [None]:
a2D_3x8 = a1D.reshape(3,8)
a2D_3x8

### Linearização de um array

In [None]:
x = a2D_3x8.flatten()
x

In [None]:
y = a2D_3x8.ravel()
y

### Combinando/concatenando arrays

In [None]:
a2D = np.random.randint(1,101,(3,9))
a2D

In [None]:
b2D = np.random.randint(1,101,(5,9))
b2D

In [None]:
c2D = np.random.randint(1,101,(5,4))
c2D

In [None]:
# Concatenação de strings usa o operador "+"
str1 = "Python"
str2 = " & "
str3 = "Numpy"
str4 = str1 + str2 + str3
str4

In [None]:
# O operador "+" aplicado a ndarrays não faz a concatenação, mas tentar somar elemento a elemento
a2D + b2D

In [None]:
A = np.concatenate((a2D, b2D), axis = 0) # Concatenando pelo eixo das colunas (eixo 0) (empilhamento vertical) 
print("a2D")
print(a2D)
print("")
print("b2D")
print(b2D)
print("")
print("Concatenação")
print(A)

In [None]:
B = np.vstack((a2D, b2D)) # Concatenando pelo eixo das colunas (eixo 0) (empilhamento vertical) 
print("a2D")
print(a2D)
print("")
print("b2D")
print(b2D)
print("")
print("Concatenação")
print(B)

In [None]:
C = np.concatenate((b2D, c2D), axis = 1) # Concatenando pelo eixo das linhas (eixo 1) (empilhamento horizontal) 
print("b2D")
print(b2D)
print("")
print("c2D")
print(c2D)
print("")
print("Concatenação")
print(C)

In [None]:
D = np.hstack((b2D, c2D)) # Concatenando pelo eixo das linhas (eixo 1) (empilhamento horizontal) 
print("b2D")
print(b2D)
print("")
print("c2D")
print(c2D)
print("")
print("Concatenação")
print(D)

### Dividindo arrays

In [None]:
A_splitted = np.vsplit(A,2) # Divisáo vertical (corta no sentido das colunas)
print("Array original")
print(A)
print("")
print("1a parte")
print(A_splitted[0])
print("")
print("2a parte")
print(A_splitted[1])

In [None]:
A_splitted3 = np.hsplit(A,3) # Divisão horizontal (corta no sentido das linhas)
print("Array original")
print(A)
print("")
print("1a parte")
print(A_splitted3[0])
print("")
print("2a parte")
print(A_splitted3[1])
print("")
print("3a parte")
print(A_splitted3[2])