# Лекция 2: базовые элементы языка Python

В рамках лекции рассмотрим базовые понятия, встроенные типы данных, простой ввод-вывод, операторы и функции.

## Примечание про версии 2.x и 3.x

* Используем в лекциях 3.5+
* 2.7 может быть актуальна, поэтому будет информация с отсылками к ней
* Рядом с тем, что изменялось между 2.x и 3.x будет пометка видка [3.x].
* Позднее на одной из следующих лекций рассмотрим отдельно различия.

## Отступы

* Блоки кода определяются отступами (индентацией).  
* Для отступов используются пробельные символы (допустимы пробел и табуляция).  
* Уровни вложенности - по количеству отступов (группа пробелов или символ табуляции).  

In [14]:
a = 2
if a % 2 == 0:
    print("Четное")
    if a == 2:
        print("Двойка")

Четное
Двойка


Пример:

In [2]:
a = 1

if a == 1:
    print("A is one")
if a - 1 == 0:
    print("A minus one is zero")
        a = a + 1
        if a == 2:
            print("A equals to two")

A is one
A minus one is zero
A equals to two


Как лучше оформлять код:  

* Возможно использовать пробелы или табуляцию.  
* Но никогда не смешивать - будут проблемы.  
* Общепринято использовать отступ в 4 пробела на уровень и мы будем придерживаться такого соглашения.  
* Больше про оформление кода <https://www.python.org/dev/peps/pep-0008/> - изучить и придерживаться на лабораторных.

## Ссылочная семантика языка (reference symantics)

* В Python переменная - просто имя для некоторого значения, которое является носителем типа.  
* По сути, имена переменных задают ссылки.  
* Аргументы в функцию тажке передаются "по-ссылке" - нужно это учитывать при работе (делать явно копию, если нужно и т.д.).  
* В случае с числами ссылочная семантика также работает, но т.к. они представляют собой "неизменяемые" значения, то при изменении просто вернётся другое значение, а базовое не поменяется.

In [44]:
a = 1
a = []
b = a
c = 2

In [45]:
def g(arr):
    arr.append(3)

def f(value):
    print('!!!!')
    value += 3


print(c)
f(c)

print(c)

print(b)
g(b)
print(b)

other_func = f

2
!!!!
2
[]
[3]


## Объектная система

Всё является объектом (everyting is an object):  

* функции  
* классы  
* метаклассы (классы для классов :) )  
* типы  
* модули  
* значения встроенные типов  
  
Это даёт широкие возможности для использовани различных парадигм и подходов, а также позволяет широко использовать интроспекцию.

Есть перегрузка операторов (в классе надо сделать методы вида \_\_add\_\_).  

Python поддерживает множественное наследование и механизм примесей (mixin).  

### Полезные встроенные функции интроспекции

* help(obj) - получить справку по любому объекту.
* dir(obj) - получить список полей объекта.
* type(obj) - узнать тип объекта.
* str(obj) - преобразовать объект в строку.

## Базовые типы

### Целые числа
* Целые числа - обычные знаковые целые int() [3.x]
* При переполнении int автоматически расширяется и использует длинную арифметику. [3.x]

In [5]:
# int
print(42)
print(int())
print(int("42"))
print(int("0x2A", 16))
print(int("0b101010", 2))
print(type(3 / 2), 3 / 2)
print(type(3 // 2), 3 // 2)

42
0
42
42
42
<class 'float'> 1.5
<class 'int'> 1


In [5]:
# still int  [3.x]
print(type(11))
print(type(19829237482379273847293478921374987234), 19829237482379273847293478921374987234)
print(type(10 ** 100), 10 ** 100)
print(type(2 ** 62), 2 ** 62)
print(type(2 ** 62 + 2 ** 62), 2 ** 62 + 2 ** 62)

<class 'int'>
<class 'int'> 19829237482379273847293478921374987234
<class 'int'> 10000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
<class 'int'> 4611686018427387904
<class 'int'> 9223372036854775808


### Действительные числа
* float() - аналог 8-байтного double из C\C++.

In [6]:
# float
print(.0)
print(float())
print(1e-10)
print(1 * 1.0)
print(type(3.0 / 2), 3.0 / 2)

0.0
0.0
1e-10
1.0
<class 'float'> 1.5


### Комплексные числа
* complex()

In [7]:
# complex
print(complex())
print(type(1 + 0j), 1 + 0j)
print(type(1 + 0j + 3), 1 + 0j + 3)
print((2 + 3j) * (4 + 1j))
print((1 + 10j) * (1 - 10j))

0j
<class 'complex'> (1+0j)
<class 'complex'> (4+0j)
(5+14j)
(101+0j)


### Логический тип

In [8]:
# bool
print(bool())
print(type(True), True)
print(type(False), False)

False
<class 'bool'> True
<class 'bool'> False


### Тип для пустоты
* None
* Аналог типа null из других областей.
* Сравнивать на равенство None надо с помощью оператора is.
* Через == возможно, но считается плохим стилем.
* Про это есть в https://www.python.org/dev/peps/pep-0008/ в части Programming Recommendations про сравнение синглтонов.

In [9]:
# None
print(type(None), None)
a = None
print(a is None) # comparison of singletons

<class 'NoneType'> None
True


## Коллекции

* Коллекция - объект, основным предназначением которого является хранение объектов и предоставление к ним доступа.
* Основные виды коллекций: *последовательности (sequences)* и *отображения (mappings)*.

### Последовательности

Примеры встроенных типов:  

* list()  
* tuple()  
* range() [3.x]  
* str()  
* bytes()  [3.x]  
* bytearray() [3.x]  

Свойства:  

* Имеют последовательную индексацию в промежутке [0, length - 1].  
* Могут содержать одновременно объекты различных типов.  
* Строки, байты и массивы байт - исключение, в них только символы (строки длины 1).  
* tuple(), range(), str() и bytes() неизменяемые - immutable.  [3.x]  
* range() - особый итерируемый тип. [3.x]  
* Можно создавать пользовательские коллекции-последовательности.  
* Многие коллекции поддерживают умножение на число. 
* Встроенная функция zip(..) для объединения перечисляемых последовательностей.

Далее рассмотрим примеры использования последовательностей.

### range - итерируемый помежуток значений [3.x]
* Особый тип, представляет собой промежуток значений.
* Часто используется для итерации в цикле for.
* Также при необходимости можно просто преобразовать в другие типы.

### Список (list) - динамический массив

* Не смотря на название, представляет собой именно динамический массив.
* Литерал для списка - []. 
* Индексация через [].
* Механизм срезов [:] и [::].

In [10]:
# literal
print([])
print([1])
print([1, 2, 3, "four", [5, 6]])

[]
[1]
[1, 2, 3, 'four', [5, 6]]


In [11]:
# range type and corresponding list
print(range(10), "->", list(range(10)))
print(range(5, 10), "->", list(range(5, 10)))
print(range(1, 10, 2), "->", list(range(1, 10, 2)))
print(range(10, 1, -1), "->", list(range(10, 1, -1)))

range(0, 10) -> [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
range(5, 10) -> [5, 6, 7, 8, 9]
range(1, 10, 2) -> [1, 3, 5, 7, 9]
range(10, 1, -1) -> [10, 9, 8, 7, 6, 5, 4, 3, 2]


In [12]:
# length
arr = list(range(10))
print(arr)
print(len(arr))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
10


In [13]:
# indexing
arr = list(range(10))
print(arr)
print(arr[0])
print(arr[3])
print(arr[-1])
print(arr[-3])

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
0
3
9
7


In [14]:
# slicing part one
arr = list(range(10))
print(arr)
print(arr[:5])
print(arr[5:])
print(arr[5:8])

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 1, 2, 3, 4]
[5, 6, 7, 8, 9]
[5, 6, 7]


In [63]:
# slicing part two
arr = list(range(10))
print(arr)
arr[5:8] = ["ha", "ha", "ha"]
print(arr)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 1, 2, 3, 4, 'ha', 'ha', 'ha', 8, 9]


In [16]:
# slicing part three
arr = list(range(10))
print(arr)
print(arr[3:9])
print(arr[3:9:2])
print(arr[::-1])
arr[3:7] = arr[6:2:-1]
print(arr)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[3, 4, 5, 6, 7, 8]
[3, 5, 7]
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
[0, 1, 2, 6, 5, 4, 3, 7, 8, 9]


In [74]:
# iteration
for elem in [1, 2, "three", []]:
    print(elem)

1
2
three
[]


In [18]:
# search
arr = list(range(10))
print(arr)
print(5 in arr)
print(arr.index(5))
print(arr.count(5))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
True
5
1


In [75]:
# adding elements
arr = list(range(10))
print(arr)

arr.append("ten")
print(arr)

arr.extend([11, 12])
print(arr)

arr.insert(10, "before ten")
print(arr)

print(arr + list(range(100, 105)))

arr += [13, 14]
print(arr)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'ten']
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'ten', 11, 12]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'before ten', 'ten', 11, 12]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'before ten', 'ten', 11, 12, 100, 101, 102, 103, 104]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'before ten', 'ten', 11, 12, 13, 14]


In [77]:
# removing
arr = list(range(10))
print(arr)

print(arr.pop())
print(arr)
print('________________')
print(arr.remove(5), '!!!')

print(arr)

del arr[0]
print(arr)

del arr[3:]
print(arr)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
9
[0, 1, 2, 3, 4, 5, 6, 7, 8]
________________
None !!!
[0, 1, 2, 3, 4, 6, 7, 8]
[1, 2, 3, 4, 6, 7, 8]
[1, 2, 3]


In [21]:
# multiplication
print([1, 2, 3] * 3)

[1, 2, 3, 1, 2, 3, 1, 2, 3]


In [22]:
# reversing
arr = list(range(10))
print(arr)

arr.reverse()
print(arr)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]


In [23]:
# builtin reversed() generator
for elem in reversed(["a", "b", "c"]):
    print(elem)

c
b
a


In [24]:
# WTF per minute comix

In [25]:
# sorting
arr = [5, 7, 1, 10, -1]
print(arr)
arr.sort()
print(arr)
arr.sort(reverse=True)
print(arr)

[5, 7, 1, 10, -1]
[-1, 1, 5, 7, 10]
[10, 7, 5, 1, -1]


In [26]:
# more sorting
arr = ["abc", "defg", "h", "ij"]
print(arr)
arr.sort(key=lambda elem: len(elem), reverse=True)
print(arr)

['abc', 'defg', 'h', 'ij']
['defg', 'abc', 'ij', 'h']


In [27]:
# builtin sorted generator
arr = ["abc", "defg", "h", "ij"]
print(arr)

for elem in sorted(arr, key=lambda elem: len(elem), reverse=True):
    print(elem)

['abc', 'defg', 'h', 'ij']
defg
abc
ij
h


In [78]:
# zip
first_sequence = range(10, 100, 10)
second_sequence = range(1, 10, 1)

print(zip(first_sequence, second_sequence), list(zip(first_sequence, second_sequence)))

range(10, 100, 10)
range(1, 10)
<zip object at 0x7f2e11e888c0> [(10, 1), (20, 2), (30, 3), (40, 4), (50, 5), (60, 6), (70, 7), (80, 8), (90, 9)]


In [29]:
print(zip([1, 2, 3]), list(zip([1, 2, 3])))

<zip object at 0x7f0fa90d32c8> [(1,), (2,), (3,)]


In [30]:
# max, min
print(max(1, 2, 3))
print(max(range(10)))
print(min(range(10)))
print(max(range(5, 10), key=lambda val: 2 ** -val))

3
9
0
5


In [79]:
def powfun(val):
    return 2 ** (-val)

In [80]:
print(2 ** -5)

0.03125


In [33]:
print(10 ** 100500)

1000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000

In [34]:
# sum
print(sum(range(10)))
print(sum(range(10), -45))

45
0


### Кортеж (tuple) - неизменяемый массив

* Как list(), только нельзя изменять.
* Используется там, где нужно свойство неизменяемости.
* Также можно использовать, чтобы явно указывать на то, что определённый набор данных задумывался неизменяемым.
* С помощью этого типа неявно выполняется операция параллельного присваивания.

In [35]:
print( (1, 2) )
print(tuple([1, 2, 3]))
a, b = 4, 5
print( a, b )

# def f(): ... return value, objects
# val, elements = f()
# val, _ = f()

(1, 2)
(1, 2, 3)
4 5


### Строки и байты

* Три типа: utf-8 основные строки str(), неизменяемые bytes() и изменяемые bytearray() байтовые строки [3.x]  
* На самом деле сложнее:
  - str() как текстовая последовательность
  - bytes(), bytearray() как последовательность байт (рассматриваем здесь т.к. всего в контексте строк используется)
* Два варианта кавычек: "..." или '...' - разницы нет, будут str().
* b"..." - литерал для bytes(). [3.x]  
* r"..." - raw string, символ '\' не интерпретируется в таких литералах. (\n и т.п.)
* В Python строки неизменяемые (immutable) - при изменении значения (например, одной буквы) создаётся новый объект.  
* Надо учитывать при большом количестве изменяющих операций над строками в программах и оптимизировать при необходимости.  
* Два способова форматирования:  
    + старый и не рекомендуется, через %  
    + современный через .format  

In [36]:
# string literals
print(type("abc"), "abc")
print(type(b"abc"), b"abc")

print("Funny, isn't it?")
print('Funny, isn\'t it?')

print('Quote: "Ahaha"')

<class 'str'> abc
<class 'bytes'> b'abc'
Funny, isn't it?
Funny, isn't it?
Quote: "Ahaha"


In [37]:
# multiline literals
print("""This is the multiline
string literal""")

This is the multiline
string literal


In [38]:
# raw strings
print(r"\test")
print("\test")

\test
	est


In [39]:
# auto concat adjacent strings and multiple lines
print("first part"\
      " and second part")

first part and second part


In [40]:
# split
print("abcd efg".split(" "))
print("abcd efg hij".split(" ", 1))
print("abcd efg hij".rsplit(" ", 1))

['abcd', 'efg']
['abcd', 'efg hij']
['abcd efg', 'hij']


In [41]:
# join
print(" ahaha ".join(["Your", "words", "are", "funny"]))

Your ahaha words ahaha are ahaha funny


In [42]:
# check parts of the string
line = "abacaba"
print(line.startswith("aba"))
print(line.endswith("aba"))
print(line.replace("aca", "AHAHA"))
print(line.find("aca"))

True
True
abAHAHAba
2


In [43]:
# simple formatting examples
print("first argument is {}, second argument is {}".format(1, 2))
print("first argument is {1}, second argument is {0}".format(1, 2))
# error -> print "first argument is {1}, second argument is {}".format(1, 2)
print("My name is {name}".format(name="unknown"))

key = "counter"
value = "1"
print("{}={}".format(key, value))

first argument is 1, second argument is 2
first argument is 2, second argument is 1
My name is unknown
counter=1


In [44]:
# fstring как способ форматирования в последних версиях

Описание синтаксиса и более сложных примеров форматирования: https://docs.python.org/3.5/library/string.html#format-string-syntax  

#### Пример простого ввода и вывода

* Встроенная функция input() - вернёт строку (до \\n) из стандартного ввода. [3.x]
* Встроенная функция print используется для вывода текста на стандартный ввывод. [3.x]

In [82]:
# input
line = input("Print line:")

# ouptut
print(line, type(line))

Print line: 123123123


123123123 <class 'str'>


### Отображения (mappings)

* Словари отображающие множество неизменяемых ключей на соответствующие значения.
* Встроенный тип: dict()

Свойства:  

* Ключи должны быть неизменяемые (внутри используется hash).  
* Ключи могут быть различных типов.  
* Упорядоченность элементов dict() не гарантируется (порядок может быть произвольным).
* Значения могут быть различных типов.  
* Широко используются внутри языка: имя переменной и её значение, поля объекта и их значения.  

In [46]:
# dict literal
counters = { "a": 1, "b": 2}
print(counters)

# dict()
print({})
print(dict())

# from pairs
key_values = [("a", 1), ("b", 2)]
print(dict(key_values))


{'a': 1, 'b': 2}
{}
{}
{'a': 1, 'b': 2}


In [47]:
# lookup element
counters = {"a": 1, "b": 2}
print(counters["a"])
print("a" in counters)
print(counters.get("a", 0))

1
True
1


In [48]:
# lookup error
counters = {"a": 1, "b": 2}
counters["c"]

KeyError: 'c'

In [49]:
counters = {"a": 1, "b": 2}
print(counters.get("c", None) is None)

True


In [50]:
# add element
counters = {"a": 1, "b": 2}
counters["c"] = 3
print(counters)

{'a': 1, 'c': 3, 'b': 2}


In [51]:
new_counters = {"f": 1, "b": 2}
counters.update(new_counters)
print(counters)

{'a': 1, 'c': 3, 'f': 1, 'b': 2}


In [52]:
# remove element
counters = {"a": 1, "b": 2}
print(counters)
del counters["b"]
print(counters)
print(counters.pop("a"))
print(counters)

{'a': 1, 'b': 2}
{'a': 1}
1
{}


In [83]:
counters = {"a": 1, "b": 2}

for key in counters:
    print(key, counters[key])

# keys, values and items as iterables [3.x]
print(counters.keys())
print(counters.values())
print(counters.items())

for key in counters.keys():
    print(key)

for value in counters.values():
    print(value)

for key, value in counters.items():
    print(key, value)

a 1
b 2
dict_keys(['a', 'b'])
dict_values([1, 2])
dict_items([('a', 1), ('b', 2)])
a
b
1
2
a 1
b 2


In [54]:
print(counters.keys())
print(list(counters.keys()))

dict_keys(['a', 'b'])
['a', 'b']


### Множество

* Тип данных соответствующий математическому объекту множества.
* Встроенные типы: set(), fronzenset()

Свойства:

* Содержит набор уникальных объектов.
* Элементы должны быть неизменяемыми.
* frozenset() - неизменяемая версия set()
* Поддерживает операции над множествами: объединение, пересечение и т.п.

In [55]:
# making set
print(set())
print(set([1, 2, 3]))
print(set([1, 2, 1, 3, 4, 2, 2, 2]))

set()
{1, 2, 3}
{1, 2, 3, 4}


In [56]:
# adding element
elems = set()
print(elems)
elems.add(1)
print(elems)

set()
{1}


In [57]:
# element lookup
elems = set([1, 2, 3])
print(elems)
print(1 in elems)

{1, 2, 3}
True


In [58]:
# removing
elems = set([1, 2, 3, 4, 5])
print(elems)
elems.remove(3) # will throw if not a member
print(elems)
elems.discard(2) # won't throw an error if not a member
print(elems)

print(elems.pop()) # arbitrary element
print(elems)

elems.clear()
print(elems)

{1, 2, 3, 4, 5}
{1, 2, 4, 5}
{1, 4, 5}
1
{4, 5}
set()


In [59]:
# set operations
elems = set(range(1, 10))
print(elems)
other_elems = set(range(5, 15))
print(other_elems)

print(elems.intersection(other_elems))
print(elems.difference(other_elems))
print(elems.symmetric_difference(other_elems))
print(elems.issubset(other_elems))

{1, 2, 3, 4, 5, 6, 7, 8, 9}
{5, 6, 7, 8, 9, 10, 11, 12, 13, 14}
{8, 9, 5, 6, 7}
{1, 2, 3, 4}
{1, 2, 3, 4, 10, 11, 12, 13, 14}
False


In [60]:
# iteration
elems = set(range(10))
for elem in elems:
    print(elem)

0
1
2
3
4
5
6
7
8
9


### Что делать самостоятельно дальше
* Изучаем лекцию.
* Читаем книги и статьи (см. первую лекцию).
* Экспериментируем с элементами языка.
* Делаем будущие задания.
* Пишем свои произвольные программы и получаем удовольствие.