# Лабораторная работа №0. Обзор языка Python 3.x.x

## 0. Введение

Литература, которую вы можете использовать в работе:
* Билл Любанович "Простой Python. Современный стиль программирования" (одна из лучших книг для начала)
* Лучано Рамальо "Python. К вершинам мастерства" (очень хорошая книга для желающих освоить язык в совершенстве, детально разобраны все основные механизмы языка, следует читать второй после вводного курса - Любановича или Лутца)
* Марк Лутц "Изучаем Python" 4-е издание (страшный и толстенный том на 1280 страниц с кучей примеров)
* Марк Лутц "Python. Карманный справочник" (короткий - 320 c., нужно уже немного представлять принципы работы языка, чтобы им пользоваться)
* Уэс Маккинли "Python и анализ данных"
* Хенрик Бринк, Джозеф Ричардс, Марк Феверолф "Машинное обучение" (оригинал называется "Real-World Machine Learning" и это лучше отражает суть книги, дан разбор нескольких практически важных кейсов)

Доступные онлайн книги и документация:
* [Документация Python 3.x.x](https://docs.python.org/3/)
* [Стиль оформления кода на Python PEP8](https://pythonworld.ru/osnovy/pep-8-rukovodstvo-po-napisaniyu-koda-na-python.html) (советую ознакомится, важен при промышленном программировании на языке)
* [Travis E. Oliphant "Guide to NumPy"](http://web.mit.edu/dvp/Public/numpybook.pdf) (исчерпывающий текст про библиотеку NumPy, без которой нам будет никуда не деться в этом курсе)
* ["Sci-Kit Learn"](http://scikit-learn.org/stable/user_guide.html) (прекрасный ресурс по всем существующим на нынешний момент реализованным методам машинного обучения в экосистеме языка питон, очень много примеров работающего кода)

## 1. Язык Python

Это высокоуровневый интерпретируемый (хотя есть и проекты компиляторов) язык программирования, предназначенный для решения очень широкого круга задач. В наши цели не будет входить изучение всех его возможностей, хотя вы можете делать множество интересных вещей:
+ писать сложные проекты с классами, объектами, наследованием
+ создавать веб-приложения (при помощи [Django](https://www.djangoproject.com/) или [Flask](http://flask.pocoo.org/))
+ разрабатывать приложения с GUI (например на [PyQT](https://wiki.python.org/moin/PyQt))

Нам для решения задач машинного обучения пока понадобится довольно маленькое подмножество языка и несколько библиотек, предназначенных для ввода/вывода данных, их математической обработки и визуализации результатов.

Начнем сразу с примера, чтобы понять, что все не так уж и страшно:)

In [1]:
# Быстрая сортировка
def quicksort(arr):
    """Функция быстрой сортировки"""
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2] # двойное / означает целочисленное деление
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quicksort(left) + middle + quicksort(right)

print(quicksort.__doc__)
print(quicksort([34,16,8,610,1,2,101]))

Функция быстрой сортировки
[1, 2, 8, 16, 34, 101, 610]


## 2. Типы данных и динамическая типизация

### Динамическая типизация

Стандартные типы данных языка Python похожи на типы в других языках программирования. Однако переменные в нем не имеют фиксированного типа. Дело в том, что фактически каждая переменная - это ссылка на значение, а не само значение.

In [2]:
x = 16
print("Value of x: {}. Type of x: {}".format(x, type(x)))

x = 'a'
print("Value of x: {}. Type of x: {}".format(x, type(x)))

Value of x: 16. Type of x: <class 'int'>
Value of x: a. Type of x: <class 'str'>


### Сравнение объектов на равенство. Id объектов

Все в языке Python - это объекты. Сравнивать объекты между собой можно двумя способами:
+ на равенство (оператор ==)
+ на идентичность (operator *is*)

In [3]:
n = ['abc', 'def'] # Список элементов
n2 = n
n3 = ['abc', 'def'] # Другой список элементов с тем же содержимым

print("Equality:\nn == n2 = {}\nn == n3 = {}".format(n == n2, n == n3))
print("Identity:\nn is n2 = {}\nn is n3 = {}".format(n is n2, n is n3))

Equality:
n == n2 = True
n == n3 = True
Identity:
n is n2 = True
n is n3 = False


In [4]:
print(id(n))
print(id(n2))
print(id(n3)) # id другой. значит и объект другой

2076724085384
2076724085384
2076724085896


Хотя для чисел (и не только;) все не совсем так

In [5]:
n = 100 # Число
n2 = n
n3 = 100 # Другое такое же число

print("Equality:\nn == n2 = {}\nn == n3 = {}".format(n == n2, n == n3))
print("Identity:\nn is n2 = {}\nn is n3 = {}".format(n is n2, n is n3))

Equality:
n == n2 = True
n == n3 = True
Identity:
n is n2 = True
n is n3 = True


In [6]:
print(id(n))
print(id(n2))
print(id(n3)) # id такой же. новый объект не создан

1998875936
1998875936
1998875936


### Встроенные типы данных. Числа

In [7]:
x = 10
print("Value of x: {}. Type of x: {}".format(x, type(x)))
print(x + 1)
print(x - 1)
print(x * 2)
print(x // 3)
print(x ** 5)
x += 1
print(x)
x *= 2
print(x)
y = 2.5
print("Res = " + str(y)) # чтобы сложить со строчкой нужно y привести к строчке

Value of x: 10. Type of x: <class 'int'>
11
9
20
3
100000
11
22
Res = 2.5


### Встроенные типы данных. Булев тип

In [8]:
t = True
f = False
print("Value of t: {}.\nType of t: {}".format(t, type(t)))
print (t and f)
print (t or f)
print (not t)
print (t != f)

Value of t: True.
Type of t: <class 'bool'>
False
True
False
True


### Встроенные типы данных. Строки

In [9]:
hello = 'hello'
world = 'wor"l"d' # тоже можно и ничем не отличается:) 
print('Строка %s длины %d' % (hello, len(hello)))
hw = hello + ' ' + world
print(hw)

print('{}, {}'.format(hello, world))
print('{0}, {1}'.format(hello, world))
print('{1}, {0}'.format(hello, world))

Строка hello длины 5
hello wor"l"d
hello, wor"l"d
hello, wor"l"d
wor"l"d, hello


In [10]:
s = "hello"
print(s.capitalize())
print(s.upper())
print(s.rjust(7))
print(s.center(7))
print(s.replace('l', 'ell'))
print('GJHG GJG  world '.strip())

Hello
HELLO
  hello
 hello 
heellello
GJHG GJG  world


### Контейнерные типы. Списки

In [11]:
empty_list = []
print('Empty list: {}'.format(empty_list))
xs = [3, 1, 92, "abc", [1, 2, 3]] # Создать список
print(len(xs))
print(xs, xs[2])      # Индексы - с 0
print(xs[-1], xs[-3]) # Отрицательные работают с концом списка - по сути xs[-1] === xs[len(s) - 1]
xs[2] = 'foo'    # можно разные типы
print(xs)
xs.append('bar')
print(xs)
x = xs.pop()
print(x, xs)

Empty list: []
5
[3, 1, 92, 'abc', [1, 2, 3]] 92
[1, 2, 3] 92
[3, 1, 'foo', 'abc', [1, 2, 3]]
[3, 1, 'foo', 'abc', [1, 2, 3], 'bar']
bar [3, 1, 'foo', 'abc', [1, 2, 3]]


In [12]:
# Работа с нарезками (slicing)
# range - встроенная функция, создает генератор элементов
# list - конструктор типа list. берет в качестве аргумента любой тип, который может отдавать последовательность элементов
nums = list(range(0,15,2))  
print(nums)
print(nums[2:4])
print(nums[2:])
print(nums[:2])
print(nums[:])
print(nums[:-1])
nums[2:4] = [8, 9, 10, 34]
print(nums)

[0, 2, 4, 6, 8, 10, 12, 14]
[4, 6]
[4, 6, 8, 10, 12, 14]
[0, 2]
[0, 2, 4, 6, 8, 10, 12, 14]
[0, 2, 4, 6, 8, 10, 12]
[0, 2, 8, 9, 10, 34, 8, 10, 12, 14]


In [13]:
# Цикл по элементам в (in) списке
animals = ['cat', 'dog', 'monkey', 'vasya']
for animal in animals:
    print(animal)

# Можно так, с индексами элементов
print('\nList of animals')
for idx, animal in enumerate(animals):
    print('#%d: %s' % (idx + 1, animal))

cat
dog
monkey
vasya

List of animals
#1: cat
#2: dog
#3: monkey
#4: vasya


In [14]:
# Два способа сделать одно и то же:

# Первый - с помощью цикла
nums = range(1,16)
squares = []
for x in nums:
    squares.append(x ** 2)
print (squares)

# Второй - с помощью генератор списков - list comprehensions
squares2 = [x ** 2 for x in nums]
print (squares2)

# Можно добавить условие
even_squares = [x ** 2 for x in nums if x % 2 == 0]
print (even_squares)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225]
[4, 16, 36, 64, 100, 144, 196]


### Контейерные типы. Словари

In [15]:
d = {'dog': 'furry', 'cat': 'cute'}
print(d)
print(d['cat'])
print('cat' in d)
d['fish'] = 'wet'
print(d)
print(d.get('monkey', 'N/A'))
print(d.get('fish', 'N/A'))
del d['fish']
print(d.get('fish', 'N/A'))

{'dog': 'furry', 'cat': 'cute'}
cute
True
{'dog': 'furry', 'cat': 'cute', 'fish': 'wet'}
N/A
wet
N/A


In [16]:
d = {'person': 2, 'cat': 4, 'spider': 8}
for animal in d:
    legs = d[animal]
    print('A %s has %d legs' % (animal, legs))
    
# Или так
print('\nAnother list:')
d = {'person': 2, 'cat': 4, 'spider': 8}
for animal, legs in d.items():
    print('A %s has %d legs' % (animal, legs))

A person has 2 legs
A cat has 4 legs
A spider has 8 legs

Another list:
A person has 2 legs
A cat has 4 legs
A spider has 8 legs


In [17]:
nums = [0, 1, 2, 3, 4]
even_num_to_square = {x: x ** 2 for x in nums if x % 2 == 0}
print(even_num_to_square)

{0: 0, 2: 4, 4: 16}


### Контейерные типы. Множества

In [18]:
animals = {'cat', 'dog', 'mouse'}
print(animals)
print(type(animals))
print ('cat' in animals)
print ('fish' in animals)
animals.add('fish')
print ('fish' in animals)
print(animals)
print (len(animals))
animals.add('cat')
print(animals)
print (len(animals))
animals.remove('cat')
print(animals)
print (len(animals))

{'cat', 'dog', 'mouse'}
<class 'set'>
True
False
True
{'cat', 'dog', 'fish', 'mouse'}
4
{'cat', 'dog', 'fish', 'mouse'}
4
{'dog', 'fish', 'mouse'}
3


In [19]:
animals = {'cat', 'dog', 'fish'}
for animal in animals:
    print('#%s' % (animal))

#cat
#dog
#fish


In [20]:
from math import sqrt # Нам понадобилась функция sqrt из библиотеки math

nums = {int(sqrt(x)) for x in range(30)}
print(nums)  # Prints "set([0, 1, 2, 3, 4, 5])"

print(sqrt.__doc__)

{0, 1, 2, 3, 4, 5}
sqrt(x)

Return the square root of x.


### Контейерные типы. Кортежи

Кортежи - это неизменяемые упорядоченные списки разнотипных значений. Их можно использовать как ключи в словарях и как элементы множеств. А вот обычные с обычными списками так делать нельзя.

Связано это с тем, что кортежи - не изменяемый тип данных

In [21]:
d = {(x, x + 1): x for x in range(5)}
t = (5, 6)
print(type(t))
print(d)
print(d[(1, 2)])

<class 'tuple'>
{(0, 1): 0, (1, 2): 1, (2, 3): 2, (3, 4): 3, (4, 5): 4}
1


### Функции

In [22]:
# Пустая функция
def foo():
    pass

print(foo())

None


In [23]:
def hello(name, loud=False):
    """Comment for function"""
    if loud:
        print ('HELLO, %s!!!' % name.upper())
    else:
        print ('Hello, %s!' % name)

hello('Billy')
hello(loud = True, name = 'Bob')
hello('Fred', loud=True)

Hello, Billy!
HELLO, BOB!!!
HELLO, FRED!!!


In [24]:
# аргументов может быть сколько угодно

def print_arguments(x, *args, **named_args):
    print('x = {}'.format(x))
    print('Tuple of arguments without names: {}'. format(args))
    print('Map of named arguments: {}'.format(named_args))
    
print_arguments(10, 'a', 13, [1,2,3], alpha=1.0, beta=1e6)

x = 10
Tuple of arguments without names: ('a', 13, [1, 2, 3])
Map of named arguments: {'alpha': 1.0, 'beta': 1000000.0}


### Базовый ввод-вывод. Работа с файлами

In [25]:
x = "ABCDEFGHIJKLMNOPQRSTUVWXYZ"
y = "0123456789"

# Можно как в Си

f = open('data.txt', 'w')
print(type(f))
f.writelines(x)
f.writelines(y)
f.close()

f = open('data.txt', 'r')
z = f.readlines()
f.close()

print('z =', z)

<class '_io.TextIOWrapper'>
z = ['ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789']


In [26]:
# но лучше безопасно c менеджером контекста (не надо следить за закрытием)

with open('data1.txt', 'w') as f:
    f.writelines(x)
    f.writelines(y)

with open('data.txt', 'r') as f:
    z = f.readlines()

print('z =', z)

z = ['ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789']


### Классы

In [27]:
class Greeter(object):

    # Конструктор
    def __init__(self, name):
        self.name = name  # Создание переменной объекта

    # Метод класса
    def greet(self, loud=False):
        if loud:
            print ('HELLO, %s!' % self.name.upper())
        else:
            print ('Hello, %s' % self.name)

g = Greeter('Fred')  # Создать объект класса
g.greet()            # Вызвать метод класса
g.greet(loud=True)
print(type(g))

Hello, Fred
HELLO, FRED!
<class '__main__.Greeter'>
