# Numpy (Numeric Python) - библиотека для математических вычислений

Если коротко - это одна из самых базовых библиотек в современном анализе данных на Python, так как с помощью нее можно быстрее и проще обрабатывать данные.

Быстрее за счет того, что основная структура данных - быстрые массивы. Проще -  за счет того, что можно использовать матричные операции, что позволяет избежать циклов, а также многое другое.

Поехали!

### 1. Установка и культура использования

Numpy - это библиотека, а значит пакет, который можно импортировать. Сделать это можно **тремя** способами:

In [None]:
# 1 можно просто импортировать сам пакет и тогда перед каждым вызовом команды необходимо писать название пакета
import numpy

# пример
numpy.array([1,2,3])

array([1, 2, 3])

In [None]:
# 2 можно импортировать пакет в текущее окружение и тогда таскать 5 букв n u m p y не нужно!
# но лучше так не делать, потому что библиотека большая и это загрузит память
from numpy import *

# пример
array([1,2,3])

array([1, 2, 3])

In [None]:
# 3 но мы рекомендуем использовать следующий способ: импортировать пакет и таскать за собой всего две буквы np
# это повысит читаемость вашего кода - будет ясно, что вы используете встроенную функцию пакета numpy, а не какую-то самописную
# о поведении которой еще надо догадаться

import numpy as np

# пример
np.array([1,2,3])

array([1, 2, 3])

### 2. Почему Numpy? (подводка к массивам)

В чистом Python нет массивов, но это не мешает программистам внедрять их. Операции со списками в Python долгие и не гибкие для задач анализа данных.

Numpy взялся решить эту проблему. Основная структура данных в numpy - как раз массив (numpy.array - где-то вы эту команду уже видели, не так ли?)

В чем numpy.array красавчик:
* как и вся библиотека numpy он написан на С++, что выделяет операции с ним по скорости
* numpy.array позволяет представлять данные в матричном виде, что позволяет реализовать матричные операции (что быстрее циклов)

Давайте убедимся в этом!

In [None]:
%timeit range(10000)     # обычный range в python
%timeit np.arange(10000) # range из numpy-массива

The slowest run took 9.17 times longer than the fastest. This could mean that an intermediate result is being cached.
1000000 loops, best of 5: 234 ns per loop
The slowest run took 26.06 times longer than the fastest. This could mean that an intermediate result is being cached.
100000 loops, best of 5: 8.05 µs per loop


Ну а теперь идем изучать дальше)

### 3. Начинаем работать с Numpy-массивом! наконец-то)

3.1. Cоздать numpy-массив можно с заранее определенным типом данных

In [None]:
a = np.array([1, 4, 5, 8], dtype=float)
a

array([1., 4., 5., 8.])

In [None]:
a.dtype

dtype('float64')

In [None]:
b = np.array([1, 4, 5, 8], dtype=str)
b

array(['1', '4', '5', '8'], dtype='<U1')

In [None]:
b.dtype # да, вот так странно помечается string

dtype('<U1')

#### Вопрос 1

Узнай, почему string из последнего примера выше помечается как U1. Сначала попробуй догадаться сам, а потом погугли)

#### Задача 1

Вам дан массив, который содержит данные о площади в квадратных футах для домов на определенной улице.
На этой улице недавно был построен новый дом.
Измените программу, чтобы она принимала значения для нового дома в качестве входных данных, добавляла его в массив и выводила массив, отсортированный в возрастающем порядке.

In [None]:
data = np.array([1000, 2500, 1400, 1800, 900, 4200, 2200, 1900, 3500])

# put your code here

А теперь познакомимся с нашим массивом `а` поближе...

In [None]:
# какой длины ты?

len(a) # внимание, работает только с одномерными этот len

4

In [None]:
# что у тебя на втором месте в массиве?

a[1]

4.0

In [None]:
# че-то не нравится мне этот элемент, давай заменим его!

a[1] = 5
a

array([1., 5., 5., 8.])

In [None]:
# покажи все элементы до 3го (3 - это позиция, отсчет с 0)

a[:2]

array([1., 5.])

In [None]:
# а давай умножим каждый из твоих элементов на число?

a * 2 # пс, то же самое работает с другими арифметическими операциями

array([ 2., 10., 10., 16.])

3.2. Если мы хотим работать с матрицами, то можем создать многомерный массив!

In [None]:
# возьмем новый массив а, чтобы показать другой способ создания массива:
a = np.array(range(10), dtype=float)
a

array([0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])

In [None]:
# сделаем из него многомерный - 5 строк, 2 столбца
a = a.reshape((5, 2))
a

array([[0., 1.],
       [2., 3.],
       [4., 5.],
       [6., 7.],
       [8., 9.]])

In [None]:
# узнаем его размерность
a.shape

(5, 2)

In [None]:
# получим доступ к элементу (теперь мы должны указывать индекс и по строке и по столбцу)

# в левом верхнем углу у нас ....
a[0,0]

0.0

In [None]:
# два или больше массивов можно сконкатенировать при помощи метода concatenate:

a = np.array([1,2], float)
b = np.array([3,4,5,6], float)
c = np.array([7,8,9], float)
np.concatenate((a, b, c))

array([1., 2., 3., 4., 5., 6., 7., 8., 9.])

In [None]:
# можно указать ось для конкатенации

np.concatenate((a,b), axis=0)

array([1., 2., 3., 4., 5., 6.])

#### Вопрос 2

В аргументах метода reshape можно нередко встретить -1. Что это будет значить?

#### Задача 2

Вам дан массив, который отражает занятость мест в кинотеатре. Место, отмеченное 1, занято, а если место отмечено 0, оно является свободным.
Однако массив является плоским и одномерным. Преобразуйте его в двумерный массив, который отражает ряды  в зале.
Каждый ряд в кинотеатре имеет 5 мест, таким образом, всего 30 мест.  
Задайте массиву соответствующую форму и выведите ряд по заданному индексу, который принимается из пользовательского ввода.

In [None]:
data = np.array([1, 1, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 1, 1, 1, 1, 0, 0, 0, 1, 1, 1, 0])

row = int(input())

### 4. Великий Random

В numpy есть встроенный модуль random, позволяющий работать с генерацией случайных чисел. Вот парочка удобных комманд

In [None]:
# создать случайное вещественное число
np.random.randn()

-0.0796789098961443

In [None]:
# случайное целое число от 1 до 10
np.random.randint(1,10)

4

In [None]:
# а что если я хочу целых 4 случайных числа?
np.random.randn(4)

array([ 0.37829858,  0.36501818, -1.42706391,  0.18425252])

In [None]:
# ооооо а что если я хочу матрицу из случайных чисел?
np.random.randn(5,3)

array([[-2.16050946, -0.64261723, -0.14107535],
       [-0.11815319,  0.39372004, -2.28778278],
       [-0.71250717,  0.4113238 ,  2.44211526],
       [-0.96704295,  0.12375245, -2.83081161],
       [ 0.63383834, -0.61611172,  1.19322149]])

### Дополнительные материалы



*   Курс по математике в связке с Python, на 2 неделе подробно рассказывается о numpy:
https://stepik.org/course/3356/promo

*   Курс от МФТИ Python для искуственного интеллекта, в последнем 6 модуле рассказывается про numpy:
https://stepik.org/course/110361/promo

*  Часовой урок по Numpy на YouTube:
https://www.youtube.com/watch?v=IWezobwAC-U&ab_channel=%D0%90%D0%B2%D0%B5%D0%9A%D0%BE%D0%B4%D0%B5%D1%80

