# Программирование для всех (основы Python)

*Алла Тамбовцева, НИУ ВШЭ*

*Первая часть конспекта частично основана на [лекции](http://python.math-hse.info:8080/github/ischurov/pythonhse/blob/master/Lecture%201.ipynb) Щурова И.В., [курс](http://math-info.hse.ru/s15/m) «Программирование на языке Python для сбора и анализа данных».*

## Переменные и типы данных в Python

* Переменные: определение и название
* Переменные: множественное присваивание
* Типы данных в Python и приведение типов
* Базовые операции с различными типами

### Переменные: определение и название

На переменную можно смотреть как на контейнер, в который можно «положить» любой объект, чтобы потом удобным образом обратиться к нему по короткому названию. Например, мы можем сохранить в переменные `x` и `y` числа 2 и 3, а затем, не переписывая сами числа, производить с ними любые манипуляции:

In [1]:
x = 2
y = 3

In [2]:
print(x ** y / (x + y))
print(x, 2 * x)
print("Сумма:", x + y)

1.6
2 4
Сумма: 5


Python, в отличие от многих низкоуровневых языков программирования (C, C++, Java) – язык с *динамической типизацией*, то есть он сам распознаёт, что мы сохраняем в переменную: число, целое число, текст, список чисел... Поэтому при создании переменной нам не нужно указывать её тип. В примерах выше Python автоматически понял, что в `x` и `y` сохранены целые числа. То же будет, например, с текстом:

In [3]:
word = "hello"
print(word)

hello


In [4]:
word * word # текст нельзя умножать на текст (текстовый тип - str)

TypeError: can't multiply sequence by non-int of type 'str'

Значения переменных мы можем обновлять – изменить значение и сохранить в переменную с тем же названием. 

In [5]:
x = x + 1
print(x)

y = y * 2
print(y)

3
6


>**Дополнительно.** в Python также можно использовать операторы для инкремента и декремента: `x += 1` вместо обычного `x = x + 1`, `x -= 1` вместо `x = x - 1`, или `y *= 2` вместо `y = y * 2`. 

Что важно, и в чём ещё заключаются последствия динамической типизации – Python может перезаписывать в переменную значение другого типа. То есть, если мы захотим в `x` сохранить текстовое значение вместо другого целого числа, проблемы не возникнет:

In [6]:
x = "two"
print(x)

two


Названия переменных в Python могут быть почти любыми. Три общих правила: название переменной не должно начинаться с цифры, в названии не должно быть пробелов, название не должно совпадать со служебными (зарезервированными) словами в Python. Список зарезервированных слов можно узнать так:

In [7]:
import keyword
print(keyword.kwlist)

['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']


Обычно рекомендуется давать переменным осмысленные названия: если речь идёт о доходе, называть переменную не `x`, а `income`, если речь идёт о данных по преступности, сохранять таблицу в переменную `crimes`, и так далее.

### Переменные: множественное присваивание

У Python есть интересная особенность – возможность присваивать значения нескольким переменным одновременно, множественное присваивание (*multiple assignment*). Давайте посмотрим, как это работает, на примере классической задачи.

Допустим, нужно поменять местами значения переменных `a` и `b`:

In [8]:
a = 5
b = 2

Стандартное решение этой задачи (если не запрещено создавать новые переменные): создать переменную `c`, «скопировать» в неё значение переменной `a`, в саму переменную `a` сохранить значение `b`, а в `b` перенести значение из `c`. 

In [9]:
c = a
a = b
b = c
print(a, b) # готово

2 5


Благодаря множественному присваиванию, в Python эту задачу можно решить гораздо проще и компактнее:

In [10]:
a = 2
b = 5
a, b = b, a
print(a, b) # готово

5 2


Это возможно потому, что если Python сталкивается с перечнем элементов через запятую, он объединяет их в структуру данных – кортеж (перечень значений в круглых скобках, будем обсуждать позже):

In [11]:
0, 1

(0, 1)

In [12]:
c, d = 0, 1
print(c)
print(d)

0
1


Поэтому при множественном присваивании Python понимает, что первый элемент кортежа нужно записать в `a`, в второй – в `b`. Кстати, отчасти из-за множественного присваивания в дробных числах не используется запятая – Python будет воспринимать такую запись как пару чисел, а не как одно число.

### Типы данных в Python

Типы данных:

* `integer` (`int`): целочисленный тип, целые числа;
* `float`: вещественный тип, числа с плавающей точкой, они же дробные;
* `string` (`str`): строковый или текстовый тип;
* `boolean` (`bool`): булев или логический тип, значения `True` и `False`.

С целочисленным типом и числами с плавающей точкой мы уже познакомились. Посмотрим, как определить тип переменной:

In [13]:
x = 2.34
y = 2
print(type(x))
print(type(y))

<class 'float'>
<class 'int'>


Чтобы создать переменную строкового типа, нужны кавычки, причём использовать можно как двойные, так и одинарные:

In [14]:
text = "hello"
text2 = 'hello'
print(text)
print(text2)
print(type(text), type(text2))

hello
hello
<class 'str'> <class 'str'>


А вот для логического типа кавычки, наоборот, не требуются:

In [15]:
yes = True
no = False
print(yes, type(yes))
print(no, type(yes))

True <class 'bool'>
False <class 'bool'>


В чистом виде логический тип используется редко, но он позволяет формулировать и комбинировать условия, а также проверять их выполнение на данных (например, если нужно отфильтровать строки в таблице, для которых верны оба условия одновременно).

### Приведение типов

Иногда требуется преобразовать тип переменной, например, из числа с плавающей точкой сделать целое число. Зачем это бывает нужно? Для удобства и для более корректной выдачи результатов. Например, у нас есть база данных по респондентам, в которой указан их год рождения, и мы хотим добавить столбец с возрастом респондентов (числом полных лет). Из-за того, что кто-то ввёл год в виде 1993.0, возраст при вычислениях тоже получится числом с плавающей точкой — 32.0. Так как мы знаем, что возраст всегда будет целым, чтобы дробная часть не смущала, можно привести все значения к целочисленному типу.  

Функции для изменения типа переменных называются так же, как сами типы или их сокращённые названия (если таковые предусмотрены). Рассмотрим приведение типов на примерах.

Превратим возраст с нулевой дробной частью в целое число:

In [16]:
age = 25.0
age2 = int(age)
print(age2)

25


Стоит помнить, что при превращении дробного числа с ненулевой дробной частью в целое арифметического округления не происходит, дробная часть просто отбрасывается:

In [17]:
int(34.7)

34

In [18]:
int(35.5)

35

Перевод целого числа в дробное выглядит логично – к числу добавляется дробная нулевая часть:

In [19]:
float(23)

23.0

Целое число или дробное число можно также превратить в строку:

In [20]:
str(2)

'2'

In [21]:
str(56.7)

'56.7'

И наоборот – строку сделать числом:

In [22]:
int("23")

23

In [23]:
float("23.9")

23.9

Если преобразование невозможно, Python выдаст ошибку (а точнее, исключение) `ValueError`, намекая, что мы применяем функцию к неверному значению:

In [24]:
float('23,56')

ValueError: could not convert string to float: '23,56'

Так как запятая в Python не воспринимается как десятичный разделитель (в качестве разделителя используется точка), превратить строку `'23,56'` в число не получится, нужно будет сначала заменить запятую на точку. Как работать со строками, мы обсудим позже, но если интересно, можно сделать следующее: создать любую строковую переменную, а потом после её названия поставить точку и нажать *Tab*. Так же, как и в случае с модулем `math`, выпадет список всех возможных методов, которые можно применять к строке. 

Довольно интересные истории происходят с логическим типом. Многие знают, что значению `True` обычно соответствует 1, а значению `False` – 0. В Python это соответствие выполняется:

In [25]:
print(int(True), int(False))
print(float(True), float(False))

1 0
1.0 0.0


Однако, если мы попытаемся проделать аналогичные операции по переводу текстовых значений в логические, получатся странные результаты:

In [26]:
print(bool("True"), bool("False")) # ок и не ок

True True


Это происходит из-за того, что в Python функция `bool()` возвращает значение `False` только при применении к пустой строке:

In [27]:
print(bool(""))

False


### Базовые операции с различными типами

В Python активно реализуется *перегрузка операторов*, которая выражается в том, что одни и те же операторы могут выполнять разные задачи в зависимости от типа данных, к которым они применяются. Если говорить совсем формально и залезать в терминологию объектно-ориентированного программирования, для Python характерен полиморфизм – разное поведение операций и методов на разных классах.

In [28]:
one = "python"
two = "no panic"
print(one + two)

pythonno panic


По идее, при исполнении кода выше мы должны были получить ошибку, нельзя применять сложение не к числам. Но нет: операция сложения в Python на строках тоже имеет смысл – она обеспечивает конкатенацию (склеивание) строк. А можно ли умножать строку на число? Давайте проверим:

In [29]:
print(one * 2)

pythonpython


Как выяснилось, можно. Здесь операция умножения работает как в математике: умножить число на число – то же самое что сложить это число необходимое количество раз. А складывать строки (то есть склеивать) Python умеет.
Но, конечно, аналогии не могут продолжаться бесконечно:

In [30]:
# возведение строки в степень – уже перебор
one ** 2

TypeError: unsupported operand type(s) for ** or pow(): 'str' and 'int'