<div style="text-align: right"> <a href="https://github.com/vikaborel">Vika Borel</a> </div>

## Размер, размерность и форма массива NumPy

- [Откуда берется размерность?](#Откуда-берется-размерность?)
- [Как считается форма?](#Как-считается-форма?)
- [Как правильно считать размер массива (общее количество элементов в массиве)?](#P.S.-Как-правильно-считать-общее-количество-элементов-в-массиве)



### Откуда берется размерность?

`Shape` – форма массива. Возвращает кортеж (tuple) со значениями, соответствующими размеру (size) массива в каждом измерении. <br>
`Ndim` – размерность массива. Условно, размерность массива это количество значений в кортеже (tuple) из выдачи функции `shape`. То есть функция `ndim` считает длину (количество элементов) выдачи функции `shape`.


#### Пример:

In [60]:
import numpy as np

example = np.array([[ 1., 0., 0.],
                    [ 0., 1., 2.], 
                    [1., 3., 2.]])
print('Форма массива: ', example.shape)
print('Размерность массива: ', example.ndim)
print('Размерность массива: ', len(example.shape))

Форма массива:  (3, 3)
Размерность массива:  2
Размерность массива:  2


Данный массив представляет собой матрицу три на три. Три строки и три столбца. Длина кортежа `(3, 3)` равна двум, следовательно, размерность данного массива равна двум.

<details>
  <summary>Про скобки для ясности (нажать для раскрытия)</summary>
  <br>
  Заглянем в документацию. Чтобы создать массив, нам нужна функция <code>array</code>. <br><br>

<code>numpy.array(object, dtype=None, copy=True, order='K', subok=False, ndmin=0) </code><br><br>

Для данной темы нас интересует самый первый параметр – object. Именно в нем хранится массив. То есть первые квадратные скобки внутри круглых содержат объект. Вообще говоря, эти скобки, внутри которых находится объект, могут быть и круглыми (но только первые!).
</details>

#### Еще примеры про размерность

In [61]:
a = np.array([]) # пустой объект

print('Размерность массива: ', a.ndim)
print('Форма массива: ', a.shape)
print('Количество элементов в массиве: ', a.size)

Размерность массива:  1
Форма массива:  (0,)
Количество элементов в массиве:  0


In [62]:
a2 = np.array([[]]) 

print('Размерность массива: ', a2.ndim)
print('Форма массива: ', a2.shape)
print('Количество элементов в массиве: ', a2.size)

Размерность массива:  2
Форма массива:  (1, 0)
Количество элементов в массиве:  0


In [63]:
a3 = np.array([[[]]])

print('Размерность массива: ', a3.ndim)
print('Форма массива: ', a3.shape)
print('Количество элементов в массиве: ', a3.size)

Размерность массива:  3
Форма массива:  (1, 1, 0)
Количество элементов в массиве:  0


In [64]:
a4 = np.array([[[[]]]])

print('Размерность массива: ', a4.ndim)
print('Форма массива: ', a4.shape)
print('Количество элементов в массиве: ', a4.size)

Размерность массива:  4
Форма массива:  (1, 1, 1, 0)
Количество элементов в массиве:  0


### Как считается форма?

Массив имеет оси (axes), оси имеют длину. Когда мы говорим про форму массива, мы хотим узнать про количество осей в массиве, а также длины этих осей.

Оси мы считаем, когда имеем дело с массивом, размерностью больше единицы. Так, двумерный массив имеет две оси: нулевую ось (axis 0), которая расположена вертикально, и ось номер 1 (axis 1), которая расположена горизонтально.

Рассмотрим на примерах:

In [65]:
b = np.array([1, 2, 3])

print('Размерность массива: ', b.ndim)
print('Форма массива: ', b.shape)
print('Количество элементов в массиве: ', b.size)

Размерность массива:  1
Форма массива:  (3,)
Количество элементов в массиве:  3


Что там у нас? Массив `[1, 2, 3]`. То есть у данного массива есть только нулевая ось, которая содержит три элемента. Поэтому форма массива – `(3,)`, а размерность, соответственно, равна единице. 

Еще раз! Почему `shape` здесь выдает сразу количество элементов? Потому что у данного массива есть только нулевая ось, которую мы не считаем.

In [66]:
c = np.array([[1, 2, 3]])

print('Размерность массива: ', c.ndim)
print('Форма массива: ', c.shape)
print('Количество элементов в массиве: ', c.size)

Размерность массива:  2
Форма массива:  (1, 3)
Количество элементов в массиве:  3


Так.. Что тут у нас? <br>
Массив вида `[[1, 2, 3]]`. В отличие от предыдущего он имеет еще и ось номер 1. То есть всего две оси. <br><br>
&nbsp;&nbsp;&nbsp;Какова длина оси номер 1? <br>
– Правильно, единица. Потому что по горизонтали у нас только одна строка.<br>
&nbsp;&nbsp;&nbsp;Какова длина этой строки? <br>
– Длина равна трем, потому что строка имеет три элемента.<br><br>
Поэтому форма данного массива – `(1, 3)`. То есть массив содержит одну ненулевую ось, в которой расположено три элемента.<br>
Размерность массива, следовательно, равна двум, потому что у массива две оси – нулевая и номер один, а в кортеже `shape` две циферки.

In [67]:
d = np.array([
    [[1, 2, 3]]
               ])

print('Размерность массива: ', d.ndim)
print('Форма массива: ', d.shape)
print('Количество элементов в массиве: ', d.size)

Размерность массива:  3
Форма массива:  (1, 1, 3)
Количество элементов в массиве:  3


Массив содержит три оси. Нулевая ось, длины один. Почему такая длина? Потому что у этой оси только одна, условно, строка. Первая ось, тоже длины один. Почему такая длина? Потому что у этой оси опять только одна, условно, строка. И, наконец, вторая ось, содержащая три элемента. Поэтому форма массива – `(1, 1, 3)`.

In [68]:
e = np.array([
    [[1, 2, 3]],
    [[1, 2, 3]]
               ])

print('Размерность массива: ', e.ndim)
print('Форма массива: ', e.shape)
print('Количество элементов в массиве: ', e.size)

Размерность массива:  3
Форма массива:  (2, 1, 3)
Количество элементов в массиве:  6


Итак, нулевая ось имеет две строки – `[[1, 2, 3]]` и `[[1, 2, 3]]`. Каждая такая строка имеет еще одну ось (общую, так скажем). На этой оси расположено по три элемента в каждой строке. То есть у оси три столбца. Поэтому размерность массива равна `(2, 1, 3)`.

In [69]:
f = np.array([
    [[]],
    [[1, 2, 3]],
    [[1, 2, 3]]
               ])

print('Размерность массива: ', f.ndim)
print('Форма массива: ', f.shape)
print('Количество элементов в массиве: ', f.size)

Размерность массива:  2
Форма массива:  (3, 1)
Количество элементов в массиве:  3


Нулевая ось имеет три строки. Каждая такая строка имеет еще одну ось. Но количество столбцов не совпадает. Поэтому форма рассчитывается только до `(3, 1)`. <br>

В данном случае правильно задать массив можно следующим образом, просто указав в одной строке пустые элементы.

In [70]:
f2 = np.array([
    [['' , '', '']],
    [[1, 2, 3]],
    [[1, 2, 3]]
               ])

print('Размерность массива: ', f2.ndim)
print('Форма массива: ', f2.shape)
print('Количество элементов в массиве: ', f2.size)

Размерность массива:  3
Форма массива:  (3, 1, 3)
Количество элементов в массиве:  9


In [71]:
g = np.array([
    [[1, 2, 3]],
    [[1, 2, 3]]
               ])

print('Размерность массива: ', g.ndim)
print('Форма массива: ', g.shape)
print('Количество элементов в массиве: ', g.size)

Размерность массива:  3
Форма массива:  (2, 1, 3)
Количество элементов в массиве:  6


Две строки в нулевой оси. Ось номер один. Три столбца.

In [72]:
h = np.array([
    [[[1, 2, 3]]],
    [[[1, 2, 3]]]
])

print('Размерность массива: ', h.ndim)
print('Форма массива: ', h.shape)
print('Количество элементов в массиве: ', h.size)

Размерность массива:  4
Форма массива:  (2, 1, 1, 3)
Количество элементов в массиве:  6


Две строки в нулевой оси. Ось номер один. Ось номер два. Три столбца с элементами.

In [73]:
i = np.array([
    [[[1, 2, 3]]],
    [[[1, 2, 3]]],
    [[[1, 2, 3]]]
])

print('Размерность массива: ', i.ndim)
print('Форма массива: ', i.shape)
print('Количество элементов в массиве: ', i.size)

Размерность массива:  4
Форма массива:  (3, 1, 1, 3)
Количество элементов в массиве:  9


Три строки в нулевой оси. Ось номер один с одной строкой. Ось номер два с одной строкой. Три столбца с элементами.

#### P.S. Как правильно считать общее количество элементов в массиве

Во-первых, размер и размерность это **не** одно и то же! <br>Про размерность уже было сказано выше. Размер же массива это количество его элементов.

Общее количество элементов в массиве считается функцией `size`. 
Многие делали ошибку, считая количество элементов в массиве функцией `len()`. Ниже я покажу, почему это не правильно.

In [74]:
j = np.array([ 98, 100,  82, 100, 100,  95,  83, 100,  94,  90,  87,  89,  99,
        88,  94, 100,  81,  98,  88, 100,  86,  96, 100,  98,  87, 100,
        88,  89])
k = np.array([[1, 2, 3]])
l = np.array([
    [[[1, 2, 3]]],
    [[[1, 2, 3]]],
    [[[1, 2, 3]]]
])

print(len(j))
print(len(k))
print(len(l))

28
1
3


Хм.. Во втором массиве явно не один элемент, а в третьем явно не три. Но почему же для первого массива количество элементов посчитано "правильно"? <br>

Функция `len()` в данном случае считает длину нулевой оси. В первом массиве нулевая ось содержала 28 элементов, во втором массиве нулевая ось содержала одну строку, а в третьем – три строки. Именно поэтому получились такие значения.
<br><br>

Поэтому считаем количество элементов в массиве мы специально обученной функцией `size`!

In [75]:
print('Количество элементов в массиве j: ', j.size)
print('Количество элементов в массиве k: ', k.size)
print('Количество элементов в массиве l: ', l.size)

Количество элементов в массиве j:  28
Количество элементов в массиве k:  3
Количество элементов в массиве l:  9
