# Программирование для всех (основы Python)

*Алла Тамбовцева, НИУ ВШЭ*

*Первая часть конспекта частично основана на [лекции](http://python.math-hse.info:8080/github/ischurov/pythonhse/blob/master/Lecture%201.ipynb) Щурова И.В., [курс](http://math-info.hse.ru/s15/m) «Программирование на языке Python для сбора и анализа данных».*

## Вычисления в Python. Переменные и типы данных

* Python как калькулятор: сложение, вычитание, деление, умножение
* Python как калькулятор: компьютерная форма числа
* Python как калькулятор: модуль `math`
* Python как калькулятор: округление и проблема представления
* Переменные: определение и название
* Переменные: множественное присваивание
* Типы данных в Python и приведение типов
* Базовые операции с различными типами

### Python как калькулятор: сложение, вычитание, деление, умножение

Привычные арифметические действия (сложение, вычитание, деление, умножение) в Python выглядят так же, как во многих других языках или калькуляторах:

In [1]:
6 + 5 * 4 - 9

17

In [2]:
7 / 2

3.5

При делении Python всегда будет выдавать результат в виде числа с плавающей точкой (тип *float*), даже тогда, когда ожидается целочисленный ответ.

In [3]:
8 / 2  # не 4

4.0

Получился дробный результат, где дробная часть равна 0. Если нужен ответ в виде целого числа, можно воспользоваться целочисленным делением, которое реализуется с помощью оператора `//`.

In [4]:
8 // 2  # теперь 4

4

Тут важно помнить, что при использовании оператора `//` дробная часть всегда будет просто отбрасываться – никакого округления происходить не будет:

In [5]:
7 // 2 # целая часть 3

3

Для округления существуют специальные функции, и мы их обсудим позже.

Если нам нужен остаток от деления, понадобится оператор `%`:

In [6]:
8 % 3

2

Для возведения числа в степень потребуется оператор `**`:  

In [7]:
5 ** 2 # квадрат числа

25

In [8]:
81 ** (1/2)  # дробная степень - квадратный корень

9.0

In [9]:
6 ** (1/3)  # дробная степень - корень 3 степени

1.8171205928321397

> **Дополнительно.** При расчётах на калькуляторе и в некоторых языках программирования для возведения числа в степень иногда используется оператор `^`. Попробуем! 

In [10]:
5 ^ 2

7

> Получилось что-то неожиданное. В Python оператор `^` используется для операции «исключающее или», которая при применении к двум целым числам соответствует побитному сложению по модулю два. Другими словами, Python переводит оба числа в двоичный формат, применяет к полученным последовательностям из 0 и 1 логическую операцию «исключающее или» (XOR) и полученный результат преобразует в число в десятичной системе счисления.



### Python как калькулятор: компьютерная форма числа

При работе с числами в Python можно столкнуться с такими вещами:

In [11]:
1 / 18 ** 25

4.1513310942010236e-32

Результат выше – компьютерная форма экспоненциальной записи числа. Здесь `e-32` – это $10^{-32}$, а вся запись означает $4.1513310942010236 \cdot 10^{-32}$, то есть примерно $4.15 \cdot 10^{-32}$. Теоретически, если число было очень большим, `e` стояло бы в положительной степени. Но в Python такое не случается, обычно он выводит огромные числа, просто переходя на новую строку, если места на одной не хватает:

In [12]:
23 ** 990

1289904795722524852300664653946433572197941130104134088478189930383101076502744219639659417064279093437500724657867718280363659016416181923552335933421079599787731352623013818688037376821636356298471193060683439063568388956706601750163828629545445022359292138002524361265592997289185467008900595878230131374891925740927099907644385574371712931640134380964875519021338743237009960351798990591785901330234187832132594157031508869823418944411036223721421784688413593595239909735242752185287762072502162693811343723284822605812833452885992267779219869756802170805925667519108800646706974810901481745137595259834979091153560765179649358449388942743557094050235977330162288125989098383992641123256017473945558974138807380552944666746150516911066016176584327355762384321949080570879109260247597464891633632925375455033171650232736541688999821214785702033094236827743042780438506654627194341368995082202093140059324504630375861097394388223559274979429315506000963668011991635894787947288278280887007622963549

Компьютерная форма записи числа отчасти помогает понять, почему дробные числа в программировании также называются *числами с плавающей точкой* (тип *float*). Возьмем число попроще, например, $12.34$. Его можно записать как $12.34$, как $1.234 \cdot 10$, как $123.4 \cdot 10^{-1}$, $1234 \cdot 10^{-2}$ и так далее. Точка, отделяющая дробную часть от целой, будет «плавать», однако само число при этом меняться не будет, будут меняться только множители – разные степени десятки.

### Python как калькулятор: модуль `math`

В обычных калькуляторах (и в Excel, например) есть специальная функция для извлечения квадратного корня. Эта функция часто представляет собой сокращение от *square root*. Давайте рассмотрим попробуем извлечь квадратный корень из числа с помощью функции `sqrt()`:

In [13]:
sqrt(9)  # не получается!

NameError: name 'sqrt' is not defined

Python пишет, что не знает, что такое `sqrt`, выдаёт ошибку `NameError`. В каких случаях Python может такое писать? Например, если мы опечатались в названии функции (Python не понимает, что мы от него хотим) или если мы пытаемся обратиться к функции, которая не входит в стандартную библиотеку (Python не знает, откуда её брать). В данном случае мы столкнулись со второй проблемой. Функция для вычисления квадратного корня из числа хранится в специальном модуле `math`. Этот модуль стандартный, дополнительно устанавливать его не нужно. Но для того чтобы воспользоваться этой функцией, нужно сначала импортировать модуль:

In [14]:
import math

Теперь из него можно вызвать функцию `sqrt()`. Название функции указывается через точку после названия модуля:

In [15]:
math.sqrt(9)

3.0

Если из `math` нам нужна только одна функция `sqrt()` , можно извлечь только её, и тогда прописывать название модуля перед функцией не понадобится: 

In [16]:
from math import sqrt
sqrt(16)

4.0

С помощью конструкции `from ... import` можно импортировать сразу несколько функций:

In [17]:
from math import sqrt, exp

In [18]:
exp(3)  # экспонента – число e в степени 3

20.085536923187668

Иногда, если неизвестно, сколько функций потребуется, но каждый раз прописывать полностью название модуля не хочется, можно импортировать его сразу с сокращённым названием. Сделать это можно с помощью конструкции `import ... as ...`.

In [19]:
import math as ma
ma.sqrt(9)

3.0

>**Примечание:** то же будет верно и для библиотек. Пока мы столкнулись с модулем `math`, в темах по обработке данных мы будем активно работать с разными библиотеками. Если совсем упростить, модуль – это набор функций, а библиотека – это набор модулей, то есть что-то более сложное по структуре и более насыщенное по функционалу.

Если мы знаем, что будем использовать практически все функции из модуля `math`, их можно извлечь все сразу, с помощью конструкции `from ... import *`, и тогда прописывать название библиотеки нам не понадобится нигде. 

In [20]:
from math import *

Однако в общем случае так делать *нежелательно*, потому что это нерационально и увеличивает время исполнения кода (Python загружает все функции, а мы пользуемся только некоторыми).

В `math` есть много полезных функций для вычислений. Чтобы посмотреть, какие функции там есть, после импортирования всего модуля через `import math` можно набрать `math.` и нажать на *Tab* (актуально при работе в интерактивных средах). Посмотрим на некоторые из них:

In [21]:
math.ceil(8.7)  # ceil - потолок, округление в большую сторону

9

In [22]:
math.floor(8.7)  # floor - пол, округление в меньшую сторону

8

In [23]:
math.log(2)  # натуральный логарифм

0.6931471805599453

In [24]:
math.log10(100)  # логарифм по основанию 10

2.0

In [25]:
math.sin(0)  # синус

0.0

А ещё из `math` можно импортировать константы $\pi$ и $e$:

In [26]:
from math import pi, e

In [27]:
pi

3.141592653589793

In [28]:
e

2.718281828459045

### Python как калькулятор: округление и проблема представления

Для обычного арифметического округления в Python используется функция `round()`. По умолчанию округление производится до целого:

In [29]:
round(12.6)

13

In [30]:
round(9.48)

9

Но округлять можно и до определённого числа знаков после запятой (точки):

In [31]:
round(12.53, 1)  # до первого знака после запятой

12.5

In [32]:
round(12.948, 2)  # до второго знака после запятой

12.95

Однако иногда могут возникать странности:

In [33]:
round(2.50)  # не 3

2

In [34]:
round(3.525, 2)  # не 3.53

3.52

Эти странности связаны с тем, что число, которое мы видим, не совпадает с тем, которое хранится в компьютере (так называемая «проблема представления», возникающая из-за конфликта Python и архитектуры системы при преобразовании чисел из десятичной системы в двоичную и обратно). Чтобы понять, как Python видит число 3.525 при обработке, обратимся к модулю `decimal`:

In [35]:
from decimal import Decimal
Decimal(3.525)

Decimal('3.524999999999999911182158029987476766109466552734375')

Такое число будет законно округляться до 3.52 по правилам арифметического округления. 

С одной стороны, полезно помнить, что числа с плавающей точкой (тип *float*) не рекомендуется использовать в финансовых вычислениях и вообще в вычислениях, требующих высокой точности, поскольку они «накапливают ошибку», то есть могут давать неточные результаты. С другой стороны, важно понимать, что эта проблема решаема. Вместо того чтобы использовать дробные числа в виде чисел с плаващей точкой «как есть», можно вопользоваться тем же модулем `decimal` или модулем `fractions`, если речь идёт об обычных дробях.

### Переменные: определение и название

На переменную можно смотреть как на контейнер, в который можно «положить» любой объект, чтобы потом удобным образом обратиться к нему по короткому названию. Например, мы можем сохранить в переменные `x` и `y` числа 2 и 3, а затем, не переписывая сами числа, производить с ними любые манипуляции:

In [36]:
x = 2
y = 3

In [38]:
print(x ** y / (x + y))
print(x, 2 * x)
print("Сумма:", x + y)

1.6
2 4
Сумма: 5


Python, в отличие от многих низкоуровневых языков программирования (C, C++, Java) – язык с *динамической типизацией*, то есть он сам распознаёт, что мы сохраняем в переменную: число, целое число, текст, список чисел... Поэтому при создании переменной нам не нужно указывать её тип. В примерах выше Python автоматически понял, что в `x` и `y` сохранены целые числа. То же будет, например, с текстом:

In [39]:
word = "hello"
print(word)

hello


In [40]:
word * word # текст нельзя умножать на текст (текстовый тип - str)

TypeError: can't multiply sequence by non-int of type 'str'

Значения переменных мы можем обновлять – изменить значение и сохранить в переменную с тем же названием. 

In [41]:
x = x + 1
print(x)

y = y * 2
print(y)

3
6


>**Дополнительно.** в Python также можно использовать операторы для инкремента и декремента: `x += 1` вместо обычного `x = x + 1`, `x -= 1` вместо `x = x - 1`, или `y *= 2` вместо `y = y * 2`. 

Что важно, и в чём ещё заключаются последствия динамической типизации – Python может перезаписывать в переменную значение другого типа. То есть, если мы захотим в `x` сохранить текстовое значение вместо другого целого числа, проблемы не возникнет:

In [42]:
x = "two"
print(x)

two


Названия переменных в Python могут быть почти любыми. Три общих правила: название переменной не должно начинаться с цифры, в названии не должно быть пробелов, название не должно совпадать со служебными (зарезервированными) словами в Python. Список зарезервированных слов можно узнать так:

In [43]:
import keyword
print(keyword.kwlist)

['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']


Обычно рекомендуется давать переменным осмысленные названия: если речь идёт о доходе, называть переменную не `x`, а `income`, если речь идёт о данных по преступности, сохранять таблицу в переменную `crimes`, и так далее.

### Переменные: множественное присваивание

У Python есть интересная особенность – возможность присваивать значения нескольким переменным одновременно, множественное присваивание (*multiple assignment*). Давайте посмотрим, как это работает, на примере классической задачи.

Допустим, нужно поменять местами значения переменных `a` и `b`:

In [44]:
a = 2
b = 5

Стандартное решение этой задачи (если не запрещено создавать новые переменные): создать переменную `c`, «скопировать» в неё значение переменной `a`, в саму переменную `a` сохранить значение `b`, а в `b` перенести значение из `c`. 

In [45]:
c = a
a = b
b = c
print(a, b) # готово

5 2


Благодаря множественному присваиванию, в Python эту задачу можно решить гораздо проще и компактнее:

In [46]:
a = 2
b = 5
a, b = b, a
print(a, b) # готово

5 2


Это возможно потому, что если Python сталкивается с перечнем элементов через запятую, он объединяет их в структуру данных – кортеж (перечень значений в круглых скобках, будем обсуждать позже):

In [47]:
0, 1

(0, 1)

In [48]:
c, d = 0, 1
print(c, d)

0 1


Поэтому при множественном присваивании Python понимает, что первый элемент кортежа нужно записать в `a`, в второй – в `b`.

### Типы данных в Python

Типы данных:

* `integer` (`int`): целочисленный тип, целые числа;
* `float`: вещественный тип, числа с плавающей точкой, они же дробные;
* `string` (`str`): строковый или текстовый тип;
* `boolean` (`bool`): булев или логический тип, значения `True` и `False`.

С целочисленным типом и числами с плавающей точкой мы уже познакомились. Посмотрим, как определить тип переменной:

In [50]:
x = 2.34
y = 2
print(type(x), type(y))

<class 'float'> <class 'int'>


Чтобы создать переменную строкового типа, нужны кавычки, причём использовать можно как двойные, так и одинарные:

In [51]:
text = "hello"
text2 = 'hello'
print(type(text))

<class 'str'>


А вот для логического типа кавычки, наоборот, не требуются:

In [52]:
yes = True
no = False
print(yes, no)

True False


В чистом виде логический тип используется редко, но он позволяет формулировать и комбинировать условия, а также проверять их выполнение на данных (например, если нужно отфильтровать строки в таблице, для которых верны оба условия одновременно).

### Приведение типов

Иногда требуется преобразовать тип переменной, например, из числа с плавающей точкой сделать целое число. Зачем это бывает нужно? Для удобства и для более корректной выдачи результатов. Например, у нас есть база данных по респондентам, в которой указан их год рождения, и мы хотим добавить столбец с возрастом респондентов (числом полных лет). Из-за того, что кто-то ввёл год в виде 1993.0, возраст при вычислениях тоже получится числом с плавающей точкой — 25.0. Так как мы знаем, что возраст всегда будет целым, чтобы дробная часть не смущала, можно привести все значения к целочисленному типу.  

Функции для изменения типа переменных называются так же, как сами типы или их сокращённые названия (если таковые предусмотрены). Рассмотрим приведение типов на примерах.

Превратим возраст с нулевой дробной частью в целое число:

In [53]:
age = 25.0
age2 = int(age)
print(age2)

25


Стоит помнить, что при превращении дробного числа с ненулевой дробной частью в целое арифметического округления не происходит, дробная часть просто отбрасывается:

In [54]:
int(34.7)

34

In [55]:
int(35.5)

35

Перевод целого числа в дробное выглядит логично – к числу добавляется дробная нулевая часть:

In [56]:
float(23)

23.0

Целое число или дробное число можно также превратить в строку:

In [57]:
str(2)

'2'

In [58]:
str(56.7)

'56.7'

И наоборот – строку сделать числом:

In [59]:
int("23")

23

In [60]:
float("23.9")

23.9

Если преобразование невозможно, Python выдаст ошибку (а точнее, исключение) `ValueError`, намекая, что мы применяем функцию к неверному значению:

In [61]:
float('23,56')

ValueError: could not convert string to float: '23,56'

Так как запятая в Python не воспринимается как десятичный разделитель (в качестве разделителя используется точка), превратить строку '23,56' в число не получится, нужно будет сначала заменить запятую на точку. Как работать со строками, мы обсудим позже, но если интересно, можно сделать следующее: создать любую строковую переменную, а потом после её названия поставить точку и нажать *Tab*. Так же, как и в случае с модулем `math`, выпадет список всех возможных методов, которые можно применять к строке. 

Довольно интересные истории происходят с логическим типом. Многие знают, что значению `True` обычно соответствует 1, а значению `False` – 0. В Python это соответствие выполняется:

In [62]:
print(int(True), int(False))
print(float(True), float(False))

1 0
1.0 0.0


Однако, если мы попытаемся проделать аналогичные операции по переводу текстовых значений в логические, получатся странные результаты:

In [63]:
print(bool("True"), bool("False")) # ок и не ок

True True


Это происходит из-за того, что в Python функция `bool()` возвращает значение `False` только при применении к пустой строке:

In [64]:
print(bool(""))

False


### Базовые операции с различными типами

В Python активно реализуется *перегрузка операторов*, которая выражается в том, что одни и те же операторы могут выполнять разные задачи в зависимости от типа данных, к которым они применяются. Если говорить совсем формально и залезать в терминологию объектно-ориентированного программирования, для Python характерен полиморфизм – разное поведение операций и методов на разных классах. О классах мы будем говорить позже, а пока посмотрим на примеры такого поведения.

In [65]:
one = "abc"
two = "def"
print(one + two)

abcdef


По идее, при исполнении кода выше мы должны были получить ошибку, нельзя применять сложение не к числам. Но нет: операция сложения в Python на строках тоже имеет смысл – она обеспечивает конкатенацию (склеивание) строк. А можно ли умножать строку на число? Давайте проверим:

In [66]:
print(one * 2)

abcabc


Как выяснилось, можно. Здесь операция умножения работает как в математике: умножить число на число – то же самое что сложить это число необходимое количество раз. А складывать строки (то есть склеивать) Python умеет.
Но, конечно, аналогии не могут продолжаться бесконечно:

In [67]:
# возведение строки в степень – уже перебор
one ** 2

TypeError: unsupported operand type(s) for ** or pow(): 'str' and 'int'