<center>
<img src="../img/python_theme.png">
# MLClass. "Прикладной анализ данных"
# Модуль "Инструментарий Data Science"
<img src="../img/mlclass_logo.jpg" height="240" width="240">

## Автор материала: Юрий Кашницкий, ФКН НИУ ВШЭ
### Отредактировал: Антон Киселев, для семинара AI Community
</center>
Материал распространяется на условиях лицензии <a href="https://opensource.org/licenses/MS-RL">Ms-RL</a>. Можно использовать в любых целях, кроме коммерческих, но с обязательным упоминанием автора материала.

## Урок 2. Основы языка Python

### Часть 1. Встроенные типы данных

Зачем нужны встроенные типы данных (объекты)?
- Встроенные объекты упрощают создание программ. Так как избавляют от необходимости
реализации структур данных.
- Встроенные объекты – это компоненты расширений. Для решения сложных задач вы можете
создавать собственные объекты, используя для этого встроенные классы языка Python
- Встроенные объекты часто более эффективны, чем созданные вручную структуры данных.
Встроенные типы языка Python используют уже оптимизированные структуры данных,
реализованные на языке C для достижения высокой производительности
- Встроенные объекты – это стандартная часть языка. В определенной степени Python многое
заимствует как из языков, полагающихся на использование встроенных инструментальных
средств (таких как LISP), так и полагающихся на мастерство программиста, который должен
выполнить собственную реализацию инструментов и структур данных (таких как C++). В языке
Python можно создавать собственные типы объектов, но в самом начале делать это не
рекомендуется. Более того, из-за того, что встроенные компоненты являются стандартными
составляющими языка Python, они всегда остаются неизменными, тогда как собственные
структуры имеют свойство изменяться от случая к случаю.

Мы рассмотрим следующие встроенные типы данных:
 - Числа: `(7382, 3.14, 3+4j, Decimal, Fraction)`
 - Строки: `('net', "your's", u'радость')`
 - Списки: `([1, [2, 'three'], 4])`
 - Словари: `({'Alex': 2, 'Brian': 4})`
 - Кортежи: `('Leo', 21.7, 'single')`
 - Множества: `(set(1,2,3), {'a', 'b', 'c'})`
 - Файлы: `(open('myfile', 'r'))`
 
**Динамическая типизация**

Типы данных в языке Python определяются автоматически во время выполнения, а не в результате
объявлений в программном коде. Переменные создаются при выполнении операции присваивания,
могут ссылаться на объекты любых типов и им должны быть присвоены некоторые значения, прежде
чем к ним можно будет обратиться.

<img src="../img/link.png" height="240" width="860">

 - Переменные – это записи в системной таблице, где предусмотрено место для хранения ссылок на
объекты.
 - Объекты – это области памяти с объемом, достаточным для представления значений этих объектов.
Каждый объект имеет два стандартных поля: описатель типа, используемый для хранения
информации о типе объекта, и счетчик ссылок, используемый для определения момента, когда
память, занимаемая объектом, может быть освобождена.
 - Ссылки – это указатели на объекты.

### Часть 2. Числа

Числа в Python бывают разные:
 - Целые числа (`int`): `122`, `-4`, `99999999999`, `0o177`, `0x9ff`, `0b101010`
 - Вещественные (действительные) числа (`float`): `1.0`, `3.14`, `.5`, `4E21`, `4.0e21` 
 - Комплексные числа (`complex`): `3 + 4j`, `3.0 + 4.0j`,  
 - Числа фиксированной точности: `decimal.Decimal('0.1')`
 - Рациональные числа: `fractions.Fraction(3, 4)`
 
### Операции с целыми и вещественными числами

<img src="../img/operations.png" height="1201" width="681">

In [1]:
# Python 2 and 3 compatibility
from __future__ import (absolute_import, division,
                        print_function, unicode_literals)

### Целые числа

In [102]:
print('Сумма:', 3 + 2)
print('Разность:', 3 - 2)
print('Произведение:', 3 * 2)
print('Деление:', 3 / 2)
print('Возведение в степень', 3 ** 2)

Сумма: 5
Разность: 1
Произведение: 6
Деление: 1.5
Возведение в степень 9


In [103]:
# Можно использовать скобки для управления порядком операций
standard_order = 2 + 3*4
print('Без скобок:', standard_order)
my_order = (2 + 3) * 4
print('Со скобками:', my_order)

Без скобок: 14
Со скобками: 20


### Вещественные числа

In [4]:
print(.1 + .1)

0.2


In [104]:
# В Python 2 результат деления двух челых чисел - тоже целое, а в Python 3 - float.
print(3 / 2)

1.5


### Рациональные числа

In [105]:
from fractions import Fraction

print(Fraction(7, 71) * 71 == 7) # 7/71 * 71 == 7

True


### Приоритет арифметических операций в Python

<img src="../img/operations_priority.png" height="1217" width="532">

#### Полезные ссылки
* http://docs.python.org/3 — документация по Python 3

## Часть 3. Строки

In [106]:
# Строки можно объявить двойными или одинарными кавычками
my_string = "This is a double-quoted string."
my_string = 'This is a single-quoted string.'

In [107]:
# Внутри двойных разрешается использовать одинарные, и наоборот
quote = "Linus Torvalds once said, 'Any program is only as good as it is useful.'"

In [108]:
first_name = 'eric'

print(first_name)
print(first_name.title())

eric
Eric


`upper()`, `lower()` и `title()` - это методы. 

Синтаксис:
```python
variable_name.action()
```

`action` - это название метода, который можно применить к переменной `variable_name`. В скобках можно указывать другие переменные (аргументы) метода. 

In [121]:
help(''.find) # help — вызов помощи

Help on built-in function find:

find(...)
    S.find(sub [,start [,end]]) -> int
    
    Return the lowest index in S where substring sub is found,
    such that sub is contained within S[start:end].  Optional
    arguments start and end are interpreted as in slice notation.
    
    Return -1 on failure.



In [142]:
# В Jupyter можно также вызывать помощь иначе:
from random import seed
seed??

#### Конкатенация ("склеивание") строк

In [143]:
first_name = 'ada'
last_name = 'lovelace'

full_name = first_name + ' ' + last_name
# 'a' + 'b' != 'b' + 'a' — конкатенация некоммутативна

print(full_name.title())

Ada Lovelace


#### Перенос строки

In [144]:
print()
print('string')


string


In [145]:
print('\n') # print неявно приписывает '\n' к концу строки
print('string')



string


In [146]:
print('\n', end='')
print('string')


string


In [147]:
name = ' eric '
name.strip()

u'eric'

In [148]:
"we bought a new house".replace("house", "building")

u'we bought a new building'

In [149]:
' '.join(['We', 'welcome', 'our', 'new', 'AI', 'overlords'])

u'We welcome our new AI overlords'

In [150]:
'there was a fish in a percolator'.split(' ')

[u'there', u'was', u'a', u'fish', u'in', u'a', u'percolator']

In [151]:
'there is no {}'.format('spoon')

u'there is no spoon'

In [152]:
'where there is {1}, there is {0}'.format('fire', 'smoke')

u'where there is smoke, there is fire'

## Часть 4. Переменные типа Bool. Условный оператор

In [153]:
True != False

True

In [154]:
a, b = 5, 6
a_greater_b = a > b

print(type(a_greater_b), a_greater_b)

<type 'bool'> False


In [155]:
# В Python есть приведение типов, числа приводятся к True если не равны нулю
bool(-42), bool(0)

(True, False)

In [156]:
items = ['lock', 'stock', 'two smoking barrels']

if 'lock' in items:
    print('almost there')
elif not bool('nevertheless'): # bool(a) == False <=> a == ''
    print('memes 2017')
else:
    print('sad face :(')

almost there


In [51]:
'''
Индентация в Python (отступы) обязательна. Ниже эквивалентный код на Python и C++.

# Python:
if a > b:
    print(c)
    
// C++
if (a > b) {
    printf(c);
}
'''
_==_

True

In [52]:
# Тернарный оператор
from random import randint

print('zero' if randint(0, 1) % 2 == 0 else 'one')

one


## Часть 5. Циклы

<img src="../img/while_cycle.png" height="240" width="860">

In [53]:
from random import randint

iterations = 0
while randint(0, 100) != 42:
    iterations += 1
    
print('{} iterations before 42 is randomly chosen'.format(iterations))

213 iterations before 42 is randomly chosen


<img src="../img/for_cycle.png" height="240" width="860">

In [54]:
for i in range(1, 10, 3): # Целые числа из [1, 10) с шагом 3
    print(i)

1
4
7


In [55]:
for x in ['spam', 'eggs', 'ham']:
    if x == 'ham':
        print('yummy')
    else:
        print('not today')

not today
not today
yummy


In [88]:
# Строка — тот же список из символов
for i, c in enumerate('a very frequently encountered string'):
    if c == 'o':
        print(i)

21


### Мгновения грядущего: структуры данных

In [65]:
[1, 2, 3, 'питон'] # Список

[1, 2, 3, u'\u043f\u0438\u0442\u043e\u043d']

In [69]:
set([4, 5, 6, 6, 5, 4]) # Множество

{4, 5, 6}

In [72]:
(7, 8) # Кортеж

(7, 8)

In [98]:
big_numbers = dict([(9, 'девять'), (10, 'много')]) # Словарь
print(big_numbers)
big_numbers[10]

{9: u'\u0434\u0435\u0432\u044f\u0442\u044c', 10: u'\u043c\u043d\u043e\u0433\u043e'}


u'\u043c\u043d\u043e\u0433\u043e'

In [100]:
', '.join([hex(number) for number in range(16, 32) if number % 2 == 0]) # Списочные выражения (list comprehensions)

u'0x10, 0x12, 0x14, 0x16, 0x18, 0x1a, 0x1c, 0x1e'

In [99]:
octal_numbers = {i: oct(i) for i in range(10)} # Словарные выражения (dict comprehensions)
print(octal_numbers)
print(5, '->', octal_numbers[5])

{0: '0', 1: '01', 2: '02', 3: '03', 4: '04', 5: '05', 6: '06', 7: '07', 8: '010', 9: '011'}
5 -> 05
