# Типы данных
В этом лонгриде кратко рассмотрим простейшие встроенные в Python типы данных. 

(простейшие - по сравнению с составными данными (структурами), которые рассмотрим позднее)

**Простейшие типы данных Python**

| Тип     | Пример    | Описание                  |
|----------|------------|------------------------------|
| `int`      | x = 1      | целые числа                  |
| `float`    | x = 1.0    | числа с плавающей запятой    |
| `complex`  | x = 1 + 2j | комплексные числа            |
| `bool`     | x = True   | логические (булевы) значения |
| `str`      | x = 'abc'  | строки: символы или текст    |
| `NoneType` | x = None   | спец. "пустой" объект None   |

Эти типы, как и всё в Python (функции, крупные структуры данных и программы) - реализованы как объекты: сущности, к которым применимы методы и основные принципы объектно-ориентированного программирования (также обсудим позднее).

В Python все сущности являются экземплярами какого-то класса - объектами.

Типы и структуры данных - не исключение.

Узнать, какому классу принадлежит, например, объект **x**, можно с помощью функции **type**, как показано ниже

Начнём в с переменных типа **int**

# Integers

Целые числа - простейший тип. Любое число без точки - это Integer (**int**)

In [1]:
x = 1
type(x)

int

Переменные в Python не нуждаются в обязательном их объявлении для выделения им памяти, т.е. не нужно писать ``int x``

Кстати, удаление объектов из памяти происходит автоматически (не нужно постоянно писать `del x`, когда он вам больше не нужен), хотя в Python и есть возможность делать это и самостоятельно.

Объявление (присваивание, назначение и т.п.) переменной и выделение памяти для хранения её значения выполняется в тот момент, когда вы присваиваете значение этой переменной.

Для этого используется символ равенства (=)

**int** в Python обладают переменной длиной. Поэтому, в отличие, например, от языков, проде **С**, вы сможете сделать $2^{200}$:

In [2]:
2 ** 200

1606938044258990275541962092341162602522202993782792835301376

In [3]:
# присваивая переменной значение другой переменной, вы создаёте ссылку на объект
n = 300
m = n

![title](imgs/references.png)

**m** и **n** указывают на одну и ту же область памяти, в которой хранится значение "300".

Можно проверить это, напечатав идентификатор объекта в интерпретаторе Python с помощью функции `id()`

In [4]:
print(id(n))
print(id(m))

4389626288
4389626288


In [5]:
# проверить, ссылаются ли переменные на один и тот же объект в памяти, 
# можно с помощью функции is()
m is n

True

Совпадают.

Однако, т.к. **int** - неизменяемый тип данных, изменив одну из переменных, мы сделаем её указателем на другой объект в памяти.

После этого изменение одной из переменных не будут влиять на другую

In [6]:
m += 1
print(m)
print(n)

301
300


In [7]:
# теперь переменные указывают на разные объекты в памяти
print(id(n))
print(id(m))
print(m is n)

4389626288
4389630096
False


# Float
В отличие от Python2, в Python3 деление целых чисел может давать число с плавающей запятой (**float**)

In [8]:
5 / 2

2.5

float могут записываться как в десятичной, так и в "научной/экспоненциальной" нотации, что эквивалентно:

In [9]:
x = 100500
y = 1005e+2
x == y

True

т.к. по умолчанию Python использует именно тип **float** для дробных чисел (т.е. хранит приблизительные значения десятичных дробей), нужно аккуратно применять опеатор сравнения.

Например, выражение ниже неожиданно окажется ложным

In [10]:
0.1 + 0.2 == 0.3

False

потому что на деле, например, 0.1 хранится в памяти как:

In [11]:
print(f"0.1 = {0.1:.17f}")

0.1 = 0.10000000000000001


**print(f"...")** позволяет подставлять удобно подставлять переменные в строки для их красивой печати

# Comlex
Если вам понадобятся комплексные числа в базовой реализации Python.

Не забудьте, что мнимая единица в Pyhton - это **j**, а не **i**!

In [12]:
complex(3, 4)

(3+4j)

In [13]:
a = complex(3, 4)

In [14]:
a.real

3.0

In [15]:
a.imag

4.0

In [16]:
a.conjugate()

(3-4j)

In [17]:
abs(a)

5.0

# String

По-настоящему полезными для вас будут строки - последовательности символов.

Один символ в Python - это тоже строка.

Строки записываются в двойных или одинарных кавычках:

In [18]:
s1 = "Some text"
s2 = 'Some text'
s1==s2

True

К строкам применимо большинство функций, которые затем будут применяться к словарям. Например, длина строки:

In [19]:
len(s1)

9

## конкатенация (сложение) строк

Python позволяет применять многие функции для разных типов, причём наиболее логичным образом.

Например, "сложение" строк склеивает их

In [20]:
s1 + " " + s2

'Some text Some text'

## умножение

In [21]:
s1*3

'Some textSome textSome text'

## доступ по индексу

In [22]:
# индексирование всех коллекций в Python начинается с нуля!
# индекс первого элемента - это 0
s1[0]

'S'

## срезы (слайсы)

синтаксис, который применим ко всем упорядоченным коллекциям в Python:

`переменная[начало_среза:конец_среза:шаг_среза]`

In [23]:
s1[1:9]

'ome text'

In [24]:
s1[1:9:2]

'oetx'

In [25]:
# можно развернуть строку наоборот
s1[::-1]

'txet emoS'

## преобразование типов

In [26]:
# другие типы могут быть явно преобразованы в строку с помощью функции str
i = 4
type(i)

int

In [27]:
j = str(i)
j

'4'

In [28]:
type(j)

str

## вхождение строк

In [29]:
# удобно проверить вхождение одной строки в другую с помощью оператора in
"Alex" in "Alex Kalyuzhnyuk"

True

In [30]:
"Some other name" in "Alex Kalyuzhnyuk"

False

Длинные строки можно создавать разными способами

Отдадим дань уважения **стандарту написания кода PEP-8**, соблюдая рекомендованную длину строк.

In [31]:
long_story = ('Lorem ipsum dolor sit amet, consectetur adipiscing elit. ' 
              'Pellentesque eget tincidunt felis. Ut ac vestibulum est. ' 
              'In sed ipsum sit amet sapien scelerisque bibendum. Sed ' 
              'sagittis purus eu diam fermentum pellentesque.')
long_story

'Lorem ipsum dolor sit amet, consectetur adipiscing elit. Pellentesque eget tincidunt felis. Ut ac vestibulum est. In sed ipsum sit amet sapien scelerisque bibendum. Sed sagittis purus eu diam fermentum pellentesque.'

с помощью `'''` можно ввести строку вместе с переносами (обозначаются спецсимволом `\n`)

In [32]:
long_story = '''
Lorem ipsum dolor sit amet, consectetur adipiscing elit. 
Pellentesque eget tincidunt felis. Ut ac vestibulum est. 
In sed ipsum sit amet sapien scelerisque bibendum. Sed 
sagittis purus eu diam fermentum pellentesque.'''

long_story

'\nLorem ipsum dolor sit amet, consectetur adipiscing elit. \nPellentesque eget tincidunt felis. Ut ac vestibulum est. \nIn sed ipsum sit amet sapien scelerisque bibendum. Sed \nsagittis purus eu diam fermentum pellentesque.'

## `str.upper(), str.lower(), str.title()`

In [33]:
mixed_case = 'PyTHoN hackER'

In [34]:
mixed_case.upper()

'PYTHON HACKER'

In [35]:
mixed_case.lower()

'python hacker'

In [36]:
# каждое слово - с заглавной буквы
mixed_case.title()

'Python Hacker'

## `str.replace()`

In [37]:
long_story.replace('ipsum', '???')

'\nLorem ??? dolor sit amet, consectetur adipiscing elit. \nPellentesque eget tincidunt felis. Ut ac vestibulum est. \nIn sed ??? sit amet sapien scelerisque bibendum. Sed \nsagittis purus eu diam fermentum pellentesque.'

## `str.format()`

In [38]:
i = "Extra string"
j = "Another string"
"{0} and {1}".format(i, j)

'Extra string and Another string'

## `str.split()` разделение строк

In [39]:
# строки в Python очень удобно "разрезать" про символу или набору символов
# с помощью функции split

# например, разделим строку по пробелу
# в результате вы получите список. О списках поговорим в другом ноутбуке

"Alex Kalyuzhnyuk is your humble lecturer".split(" ")

['Alex', 'Kalyuzhnyuk', 'is', 'your', 'humble', 'lecturer']

In [40]:
# или по подстроке
# т.к. она длинная, для удобства "спрячу" её в переменную s
# чтобы конструкция со "split" не была громоздкой

# обратный "слэш" позволяет разбить 
# длинную строку в Python-коде на две

s = \
"Some text and the end of the phrase. More text and the end of the phrase. "

s.split(" and the end of the phrase. ")

['Some text', 'More text', '']

заметьте, что мы разделили строку на 3. 

Подстрока " and the end of the phrase. " разделила исходную строку на начало предложение и пустую строку '''' справа от неё

## `str.join()` слияние строк
Собрать много элементов в одну строку можно с помощью удобного метода `join()`.

На вход `join()` передаётся строка-разделитель (например, запятая или точка с запятой).
Затем все элементы объединяются в строку через этот разделитель.

join достаточно умно реализован, чтобы не ставить разделитель в начале или в конце строки

In [41]:
# например, выведем последовательность 1,2,3,4,5 через точку с запятой с пробелом
"; ".join(("1","2","3","4","5"))

'1; 2; 3; 4; 5'

In [42]:
# это а если передать join числа, а не много строк?
"; ".join((1,2,3,4,5))

TypeError: sequence item 0: expected str instance, int found

не выходит - нужна или последовательность из строк, или нужно числа в эти строки преобразовать в с помощью функции str

In [43]:
# map применяет фукцию (например, str) ко всем элементам последовательности
# подробнее мы изучим map позже
"; ".join(map(str, (1,2,3,4,5)))

'1; 2; 3; 4; 5'

In [44]:
# как объединить много маленьких строк в одну?
# с помощью join и пустого разделителя ""
"".join(("1", "2", "3", "4", "5"))

'12345'

In [45]:
# выглядит глуповато
# но это всё ещё один из самых эффективных способов
# над чем шутит и сам создатель языка

## применение нескольких операторов

Несколько методов могут быть последовательно применены к объекту через символ точки.

В примере ниже сначала обрежем лишние пробелы вокруг фразы, затем изменим регистр на нижний, а в конце поменяем подстроку `bad` на `good`

In [46]:
ugly_mixed_case = '   STRiNG LooKs BAd '
pretty = ugly_mixed_case.strip().lower().replace('bad', 'good')
print(pretty)

string looks good


# None

Иногда вам нужен тип, который будет обозначать дырку от бублика - ничего, пустоту.

Нарпимер, тип, который будет выдавать функция, в которой вы не укажете **return** (функции будут позже).

In [47]:
a = None

In [48]:
type(a)

NoneType

Важно: None - это не то же самое, что False

In [49]:
if a is None:
    print("a is None type")

a is None type


In [50]:
if False is None:
    print("False is a None type")
else:
    print("False is not a None type")
    
if None is False:
    print("None is a Boolean type")
else:
    print("None is not a Boolean type")

False is not a None type
None is not a Boolean type


хотя None неявно преобразовывается к False, если подставить его в конструкцию, которая будет ожидать тип Boolean 

In [51]:
if None:
    print("None is not converted to False (boolean type)")
else:
    print("None is converted to False (boolean type)")

None is converted to False (boolean type)


# Boolean
Логическое значение (правда **True** или неправда **False**)


In [52]:
# r - это результат приравнивания чисел 4 и 5
r = (4 == 5)

In [53]:
# поэтому r будет являться ложью
r

False

Большинство других типов может быть преобазовано в `bool` с помощью функции `bool`:

In [54]:
# например, любой int кроме 0 - это True:

In [55]:
bool(100500)

True

In [56]:
bool(1)

True

In [57]:
bool(0)

False

In [58]:
bool(-1)

True

Любая непустая строка - это True

In [59]:
bool("Some not empty string")

True

In [60]:
bool("")

False

In [61]:
# то же самое с непустым списком:
bool([1,2,3])

True

In [62]:
bool([])

False

In [63]:
bool(None)

False

Для удобства записи эти типы неявно (без указания функции `bool()`) преобразовываются к типу Boolean, попадая в конструкции, в которых ожидается именно **Boolean**. Например, если попадают в конструкцию **if-else**.

Однако, согласно соглашению [PEP-8](https://pep8.org/), это плохой стиль написания кода, т.к. реализация того, какой объект будет неявно преобразован к True, а какой к False может меняться в зависимости от версии языка

In [64]:
if "That's a string! Bot boolean. However...":
    print("That string was handled as Boolean = True")
else:
    print("That string was not handled as False")

That string was handled as Boolean = True


In [65]:
# то же самое получится, если преобразовать строку к Bool явно

if bool("That's a string! Bot boolean. However..."):
    print("That string was handled as Boolean = True")
else:
    print("That string was not handled as False")

That string was handled as Boolean = True


# P.S.: переменные в памяти

Все объекты, содержащиеся в памяти интерпретатора на данный момент, можно вывести на экран с помощью команды:

In [66]:
%whos

Variable          Type        Data/Info
---------------------------------------
a                 NoneType    None
i                 str         Extra string
j                 str         Another string
long_story        str         \nLorem ipsum dolor sit a<...>m fermentum pellentesque.
m                 int         301
mixed_case        str         PyTHoN hackER
n                 int         300
pretty            str         string looks good
r                 bool        False
s                 str         Some text and the end of <...>d the end of the phrase. 
s1                str         Some text
s2                str         Some text
ugly_mixed_case   str            STRiNG LooKs BAd 
x                 int         100500
y                 float       100500.0
