# Numpy arrays
Наиболее распространённая структура из numpy это `ndarray`. Для начала посмотрим, как их создавать
## Создание одномерных массиов из главных iterable типов

Для начала, `ndarray` может создаваться из встроенных `list` или `tuple` при помощи функции `np.array(collection)`.

In [None]:
import numpy as np  # np - community accepted abbrevation

some_list = [4, 8, 15, 16, 23, 42]
some_tuple = (4, 8, 12, 16, 23, 42)

from_list = np.array(some_list)
from_tuple = np.array(some_tuple)

print(f"from list: \n{some_list} -> {from_list}")
print(f"\nfrom tuple: \n{some_tuple} -> {from_tuple}")
print(f'\nlen(from_list) = {len(from_list)}')

Размер `ndarray` можно получить через `len(ndarray)`, `ndarray.shape` и `ndarray.size` (в чём разница - поймём когда дойдём до многомерных массивов):

In [None]:
some_list = [4, 8, 15, 16, 23, 42]
from_list = np.array(some_list)

print(from_list)
print(f'\nlen(from_list) = {len(from_list)}')
print(f'from_list.shape = {from_list.shape}')
print(f'from_list.size = {from_list.size}')

Пока ничего нового. Но давайте взглянем на кое-что другое:

In [None]:
some_list = [1, 2, 3]
some_list_with_pi = [1, 2, 3, np.pi]

from_list = np.array(some_list)
from_list_with_pi = np.array(some_list_with_pi)

print(f"from list: \n{some_list} -> {from_list}")
print(f"\nfrom list with pi: \n{some_list_with_pi} -> {from_list_with_pi}")

Обратите внимание на вывод во втором случае. Целые были преобразованны во float. Оно и логично, ведь `ndarray`, в отличии от питонячих коллекций, типизирован. Посмотреть тип можно через атрибут `ndarray.dtype`:

In [None]:
some_list = [1, 2, 3]
some_list_with_pi = [1, 2, 3, np.pi]
some_list_with_pi_and_str = [1, 2, 3, np.pi, 'pi']

from_list = np.array(some_list)
from_list_with_pi = np.array(some_list_with_pi)
from_list_with_pi_and_str = np.array(some_list_with_pi_and_str)

print(f'{from_list}.dtype = {from_list.dtype}')
print(f'{from_list_with_pi}.dtype = {from_list_with_pi.dtype}')
print(f'{from_list_with_pi_and_str}.dtype = {from_list_with_pi_and_str.dtype}')

Тип данных `<U32` означает "unicode строка длиной до 32".

Однако, не все коллекции подходят. Рассмотрим следующий пример и обратим внимание на shape:

In [None]:
some_set = set('an assassin sins')
some_string = 'The quick brown fox jumps over the lazy dog'

from_set = np.array(some_set)
from_string = np.array(some_string)

print(f"from set: \n{from_set}, shape: {from_set.shape}, dtype: {from_set.dtype}")
print(f"\nfrom string: \n{from_string}, shape: {from_string.shape}, dtype: {from_string.dtype}")

Но если вам ну очень хочется сделать `ndarray` из `set` или `string`, вы можете обернуть их в `list`

In [None]:
from_listed_set = np.array(list(some_set))
from_listed_string = np.array(list(some_string))

print(f"from list(set): \n{from_listed_set}, shape: {from_listed_set.shape}, dtype: {from_listed_set.dtype}")
print(f"\nfrom list(string): \n{from_listed_string}, shape: {from_listed_string.shape}, dtype: {from_listed_string.dtype}")

 Тип данных всегда изменяется **явно** и **приводит к созданию нового объекта**.
Посмотрите пример:

In [None]:
some_string = 'The quick brown fox jumps over the lazy dog'
words_list = some_string.lower().split(' ')
from_words_list = np.array(words_list)

print(f"from words list: \n{from_words_list}, shape: {from_words_list.shape}, dtype: {from_words_list.dtype}, id: {id(from_words_list)}")

print('\nЗаменим fox на elephant:')
from_words_list[3] = 'elephant'
print(f"from words list: \n{from_words_list}, shape: {from_words_list.shape}, dtype: {from_words_list.dtype}, id: {id(from_words_list)}")
print('Слон стал "элефом", но id не изменился')

print('\nСменим тип данных и заменим eleph на elephant:')
from_words_list = from_words_list.astype('<U10')
from_words_list[3] = 'elephant'
print(f"from words list: \n{from_words_list}, shape: {from_words_list.shape}, dtype: {from_words_list.dtype}, id: {id(from_words_list)}")

Очевидно, `ndarray` не очень для работы со строками. Однако с числами он бесподобен.

## Создание n-мерных массивов из основных iterable типов:
n-мерные массивы `np.ndarray` могут быть получены оборачиванием в np.array() `list`, содержащий внутри себя другие `list`. Попробуем создать двухмерный массив (словом, матрицу):

In [None]:
lists_in_list = [[1, 2, 3], [4, 5, 6]]
matrix = np.array(lists_in_list)
print(f"From lists in list: \n{matrix}, shape: {matrix.shape}, len: {len(matrix)}, size: {matrix.size}")

Внимательно посмотрите на вывод предыдущего примера. Будьте осторожны при использовании функции `len()` с типом данных `ndarray`. Она вернёт длину первого измерения, а не количество элементов. Для получения количества элементов используется атрибут `ndarray.size`

ndarray с б**о**льшим количеством измерений получается путём увеличения уровня вложенности: 

In [None]:
lists_in_lists_in_list = [[[1, 2, 3], [4, 5, 6], [7, 8, 9]], [[10, 11, 12], [13, 14, 15], [16, 17, 18]]]
three_d_array = np.array(lists_in_lists_in_list)
print(f"From lists in list: \n{three_d_array}, shape: {three_d_array.shape}, len: {len(three_d_array)}, size: {three_d_array.size}")

Разумеется, вложенные `list` должны быть согласованны в смысле числа элементов:

In [None]:
incompatible_lists_in_list = [[1, 2, 3], [4, 5], [6, 7, 8]]
from_incompatible_lists = np.array(incompatible_lists_in_list)
print(f"From incompatible lists: \n{from_incompatible_lists}, shape: {from_incompatible_lists.shape}, dtype: {from_incompatible_lists.dtype}")

## Процедуры создания новых массивов
### Инициализация raw-массива
Можно инициализировать массив без значений. При инициализации numpy-массива без значений создаётся указатель на свободную область в памяти. Если посмотреть содержимаое массива, то можно увидеть что оказалось в той области памяти, а оказаться там может всё, что угодно. Попробуйте поменять shape и посмотреть как меняется содержимое

In [None]:
shape = (4, 4)
new_array = np.ndarray(shape=shape)
print(f"new array: \n{new_array}, dtype: {new_array.dtype}")

### Заполненные массивы
Во многих случаях могут понадобиться массивы, которые состоят из один единиц или нулей. Такие массивы гененрируются функциями `np.zeros(shape=required_shape)` и `np.ones(shape=required_shape)` соответственно. `shape` может быть целым числом (для `1D-array`) или `tuple` целых чисел для `ndarray`.

In [None]:
zeros_1d = np.zeros(10)
print(f"zeros_1d: \n{zeros_1d}, shape: {zeros_1d.shape}, dtype: {zeros_1d.dtype}")
ones_2d = np.ones((3, 3))
print(f"ones_2d: \n{ones_2d}, shape: {ones_2d.shape}, dtype: {ones_2d.dtype}")

Тип данных для значений таких массивов может быть задан явно через параметр `dtype`:

In [None]:
uint_ones = np.ones(7, dtype=np.uint8)
print(f"uint zeros: \n{uint_ones}, shape: {uint_ones.shape}, dtype: {uint_ones.dtype}")

Давайте выполним несколько операций для того, чтобы убедиться, что у нас действительно `uint8`:

In [None]:
uint_ones = np.ones(7, dtype=np.uint8)
uint_ones[0] = uint_ones[0]  # Left first one alone
uint_ones[1] -= 0.2 
uint_ones[2] += 0.9  
uint_ones[3] += 1.1
uint_ones[4] += 300
uint_ones[5] -= 10
uint_ones[6] *= -1

А теперь объяснения
0. Остался без изменений
1. Следуем последовательности:  преобразуем 1 в float чтобы выполнить вычитание float -> выполняем вычитание 1. - 0.2 = 0.8 -> переводим в uint8 чтобы поместить в массив uint8(0.2) = 0 -> вставляем 0 
2. см 1.: uint8(1.9) = 1
3. см 1.: uint8(2.1) = 2
4. А здесь у нас пример переполнения. Диапазон uint8 от 0 до 255. Таким образом, 301 % 256 = 45
5. см 4.: -9 % 256 = 256 - 9 = 247
6. см 4.: -1 % 256 = 256 - 1 = 255

### Равномерно заполненные массивы
В качестве первого типа равнозаполненных массиов рассмотрим функцию `np.arange()`. Она работает по аналогии со стандартной `range()`, но возвращает `ndarray` и позволяет использовать не только целочисленные значения шага.

In [None]:
print('# Если передадим единственный аргумент N, arange вернёт целые числа из интервала [0, N). Как и обычный range()')
print(f'np.arange(10) \n{np.arange(10)}')

print('\n# Для двух аргументов M и N, arange вернёт целые из интервала [M, N). Снова по аналогии с range():')
print(f'np.arange(5, 10) \n{np.arange(5, 10)}')

print('\n# Третий аргумент указывает шаг внутри интервала [M, N):')
print(f'np.arange(5, 10, 0.5) \n{np.arange(5, 10, 0.5)}')
print(f'\nnp.arange(5, 10, 2) \n{np.arange(5, 10, 2)}')
print(f'\nnp.arange(5, 10, 10) \n{np.arange(5, 10, 10)}')

В иных ситуациях удобнее использовать не фиксированный шаг, а фиксированное количество равноудалённых точек из интервала. Для такой задачи используется функция `np.linspace()`.

In [None]:
print('# В отличии от arange, linspace ожидает минимум два аргумента: start и stop. А ещё linspace обычно включает в себя правую границу интервала:')
print(f'np.linspace(0, 10): \n{np.linspace(0, 10)}, shape: {np.linspace(0, 10).shape}')

print('\n# По умолчанию linspace разбиавает интервал на 50 точек. Однако количество точек можно задать третьим аргументом:')
print(f'np.linspace(0, 10, 21): \n{np.linspace(0, 10, 21)}, shape: {np.linspace(0, 10, 21).shape}')

print('\n#  Если же задача не требует включения правой границы интервала, передаётся аргумент endpoint=False')
print(f'np.linspace(0, 10, 20, endpoint=False): \n{np.linspace(0, 10, 20, endpoint=False)}, shape: {np.linspace(0, 10, 20, endpoint=False).shape}')

## Создание массивов случайных чисел
Рассмотрим три основные фукнции создания массивов, заполненных случайными числами. Начнём с функции `np.random.randn()`. Она генерирует число, распределённое по нормальному закону с математическим ожиданием = 0 и дисперсией = 1

In [None]:
print("# Без указания аргументов возвращает единственное число базового типа float")
print(f'np.random.randn(): {np.random.randn()}, type: {type(np.random.randn())}')

print("\n# Чтобы создать ndarray в качестве аргументов передаётся его shape")
print(f'np.random.randn(1, 2, 3, 4): \n{np.random.randn(1, 2, 3, 4)}, type: {type(np.random.randn(1, 2, 3, 4))}, shape: {np.random.randn(1, 2, 3, 4).shape}')

print("\n# То же самое, только через кортеж:")
shape = (4, 3, 2)
print(f'np.random.randn(*shape): \n{np.random.randn(*shape)}, type: {type(np.random.randn(*shape))}, shape: {np.random.randn(*shape).shape}')

### np.rand.rand()
Работает точно так же, как и `np.random.randn()`, только генерирует числа по равномерному закону распределения

In [None]:
print(f'np.random.rand(): {np.random.rand()}, type: {type(np.random.rand())}')


shape = (2, 3, 4)
print(f'\nnp.random.rand(*shape): \n{np.random.rand(*shape)}, type: {type(np.random.rand(*shape))}, shape: {np.random.rand(*shape).shape}')

### np.random.randint()

In [None]:
print("# Если randint вызывается с единственным аргументом N, функция вернёт единственный базовый int из области [0, N)")
print(f'np.random.randint(100): {np.random.randint(100)}, type: {type(np.random.randint(100))}')

print("\n# Если передать два аргумента M и N, функция вернёт единственный базовый int из области [M, N)")
print(f'np.random.randint(90, 100): {np.random.randint(100)}, type: {type(np.random.randint(100))}')


print('\n# А вот если третьим аргументом передать размер, то получим ndarray:')
print(f'np.random.randint(90, 100, 10): \n{np.random.randint(90, 100, 10)}, type: {type(np.random.randint(90, 100, 10))}')
print('\n# Однако, в отличии от предыдущих двух функций, здесь под размер отведён единственный аргумент. Поэтому, многомерный массив получаем передачай tuple:')
print(f'np.random.randint(0, 10, (3, 3)): \n{np.random.randint(0, 10, (3, 3))}')

print(f'\n# Необязательно передавать три значения чтобы задать размер. Аргумент size можно указать явно.')
print('# Такая запись эквивалентна np.random.randint(0, 100, 10)')
print(f'np.random.randint(100, size=10): \n{np.random.randint(100, size=10)}, type: {type(np.random.randint(100, size=10))}')
