# Модуль NumPy. Типы данных

## 1. Типы данных

- Cуществует формула, позволяющая узнать максимальное число последовательностей из n 0 и 1:

N = 2 ** n


где n — число выделенных битов, N — максимально возможное при данном n число последовательностей, ** — оператор возведения в степень.

- Чтобы узнать __максимальное целое положительное число__, которое можно уместить в  бит, необходимо воспользоваться следующей формулой:

2 ** n - 1 

- Чтобы узнать минимальное и максимальное целое число существует две формулы:

Nmin = - (2 ** n) / 2

Nmax = (2 ** n) / 2 - 1

## 2. Целочисленные типы данных в NumPy

> Это тип данных с общим корнем int. Int может быть со следующими окончаниями: int8, int16, int32 и int64. Окончание типа данных в NumPy показывает, сколько битов памяти должно быть выделено для хранения переменной.

In [50]:
import numpy as np
a = np.int8(25)
print(a, type(a))

25 <class 'numpy.int8'>


- Чтобы узнать границы int, можно воспользоваться функцией np.iinfo (__int info__):

In [51]:
np.iinfo(np.int8)

iinfo(min=-128, max=127, dtype=int8)

In [52]:
np.iinfo(a)

iinfo(min=-128, max=127, dtype=int8)

In [53]:
print(np.iinfo(np.int8))

Machine parameters for int8
---------------------------------------------------------------
min = -128
max = 127
---------------------------------------------------------------



In [54]:
np.iinfo(np.int16)

iinfo(min=-32768, max=32767, dtype=int16)

In [55]:
np.iinfo(np.int32)

iinfo(min=-2147483648, max=2147483647, dtype=int32)

In [56]:
np.iinfo(np.int64)

iinfo(min=-9223372036854775808, max=9223372036854775807, dtype=int64)

> В NumPy доступны и беззнаковые целочисленные типы данных. Они имеют корень uint (unsigned int — беззнаковое целое). uint доступны также с выделением памяти в 8, 16, 32 и 64 бита. При этом максимально возможное число оказывается в два раза больше, чем для соответствующего int, поскольку отрицательные числа исключены из типа данных uint.

In [57]:
b = np.uint8(124)
print(b, type(b))
np.iinfo(b)


124 <class 'numpy.uint8'>


iinfo(min=0, max=255, dtype=uint8)

### Несколько замечаний о приведении типов

1. Тип данных не сохранится, если просто присвоить переменной с заданным NumPy-типом данных новое значение: 

In [58]:
a = np.int32(1000)
print(a)
print(type(a))
a = 2056
print(a)
print(type(a))

1000
<class 'numpy.int32'>
2056
<class 'int'>


- Вместо этого следует снова указать нужный NumPy-тип данных:

In [59]:
a = np.int32(1000)
print(a)
print(type(a))
a = np.int32(2056)
print(a)
print(type(a))

1000
<class 'numpy.int32'>
2056
<class 'numpy.int32'>


- А вот арифметические операции сохраняют NumPy-тип данных:

In [60]:
a = np.int32(1000)
b = a + 25 # 25-тип данных int
print(b)
print(type(b))


1025
<class 'numpy.int32'>


> Примечание. В некоторых более старых версиях NumPy тип данных может измениться на int64 вместо ожидаемого int32. Это связано с тем, что число 25 может быть сначала преобразовано в NumPy-тип данных int (по умолчанию int64) перед сложением. Скорее всего, на практике вам не особо помешает такая особенность, однако о ней следует помнить, когда требуется хранить числа максимально оптимальным способом.

- Если операция проводится с двумя NumPy-типами с фиксированным объёмом памяти, в результате сохраняется наиболее «старший» тип:

In [61]:
a = np.int32(1000)
b = np.int8(25)
c = a + b
print(c)
print(type(c))

1025
<class 'numpy.int32'>


2. Следует понимать, что произойдёт, если выделенной памяти для хранения переменной окажется недостаточно.

In [62]:
d = np.int8(260)
print(d)

OverflowError: Python integer 260 out of bounds for int8

>Если же при арифметических операциях происходит переполнение максимально выделенной памяти для типа, возникает предупреждение.

In [None]:
a = np.int32(2147483610)
b = np.int32(2147483605)
print(a, b)
print(a + b)

2147483610 2147483605
-81


  print(a + b)


>Чтобы избежать этой ошибки, вначале следовало преобразовать переменные к большему типу:

In [None]:
a = np.int32(2147483610)
b = np.int32(2147483605)
print(a, b)
print(np.int64(a) + np.int64(b))

2147483610 2147483605
4294967215


## 3. Типы данных с плавающей точкой в NumPy

Помимо целых чисел, в NumPy, конечно, есть и дробные — float. Их названия строятся по тому же принципу: корень + объём памяти в битах. __Беззнаковых float нет__.

>Доступны следующие типы данных float: float16, float32, float64 (применяется по умолчанию, если объём памяти не задан дополнительно), float96, float128.

- Чтобы узнать границы float и его точность, можно воспользоваться функцией np.finfo(<float тип данных>) (от англ. float info):

In [49]:
np.finfo(np.float16)

finfo(resolution=0.001, min=-6.55040e+04, max=6.55040e+04, dtype=float16)

In [42]:
np.finfo(np.float32)

finfo(resolution=1e-06, min=-3.4028235e+38, max=3.4028235e+38, dtype=float32)

In [43]:
np.finfo(np.float64)

finfo(resolution=1e-15, min=-1.7976931348623157e+308, max=1.7976931348623157e+308, dtype=float64)

>Resolution (от англ. «разрешение») в выводе finfo означает точность, с которой сохраняется десятичная часть числа в стандартном виде.

In [63]:
print(np.float16(4.12))
print(np.float16(4.13))
print(np.float16(4.123))
print(np.float16(4.124))
print(np.float16(4.125))

4.12
4.13
4.12
4.125
4.125


## 4. Дополнительные типы данных в NumPy

In [None]:
# писок названий уникальных типов данных NumPy
print(*sorted(map(str, set(np.sctypeDict.values()))), sep='\n')

In [75]:
a = True
print(type(a))
a = np.bool(a)
print(type(a))
a = np.bool_(a)
print(type(a))
print(np.bool(True) == np.bool_(True))
print(type(np.bool(True)) == type(np.bool_(True)))

print(True == np.bool(True))
print(True == np.bool_(True))
print(type(True) == type(np.bool(True)))
print(type(True) == type(np.bool_(True)))

<class 'bool'>
<class 'numpy.bool'>
<class 'numpy.bool'>
True
True
True
True
False
False


In [77]:
a = "Hello world!"
print(type(a))
#a = np.str(a)
print(type(a))
a = np.str_(a)
print(type(a))

<class 'str'>
<class 'str'>
<class 'numpy.str_'>


In [None]:
print(np.uint8(-456))