# Установка зависимостей

<code>conda env create -f environment.yml</code>

<code>conda activate classical-ml</code>


# Синтаксис Python

## Переменные

Переменная - именованная область памяти, хранящяя какое-то значение

In [1]:
a = 1

Если в последней строке ячейки записать название переменной, то ее значение выведется

In [2]:
a

1

Также, можно выводить значение через print

In [3]:
print(a)

1


Значения могут быть разных типов. В Python необязательно указывать тип, но для наглядности укажем в примере ниже.

In [4]:
float_variable: float = 1.3
string_variable: str = "abcd"
bool_variable: bool = True

Числа можно складывать

In [5]:
a + float_variable

2.3

Число можно перевести в строку и обратно

In [6]:
float2string = str(float_variable)
print(float2string, type(float2string))

string2float = float(float2string)
print(string2float, type(string2float))

1.3 <class 'str'>
1.3 <class 'float'>


## Условный оператор if

Какое значение нужно задать у `float_variable`, чтобы вывело:
- higher than 9;
- lower than 5?

In [7]:
if float_variable < 10:
    print("lower than 10")
elif float_variable < 5:
    print("lower than 5")
else:
    print("higher than 9")

lower than 10


## Цикл for

При помощи цикла for мы можем компактно записать повторяющиеся строки кода

In [8]:
for i in range(10):
    print(i, end=" ")

0 1 2 3 4 5 6 7 8 9 

In [9]:
for i in range(5, 15, 2):
    print(i, end=" ")

5 7 9 11 13 

## Базовые коллекции

### Список

Используем, когда нужно хранить много однообразных объектов

In [10]:
list_example = [1, 0, 2, 3, 10, 4, 18, 5]
print(list_example, type(list_example))

list_example.append(15)
print(list_example)

sorted_list = sorted(list_example)
print(sorted_list)

[1, 0, 2, 3, 10, 4, 18, 5] <class 'list'>
[1, 0, 2, 3, 10, 4, 18, 5, 15]
[0, 1, 2, 3, 4, 5, 10, 15, 18]


In [11]:
print(sorted_list[1])  # Вернет число
print(sorted_list[1:3])  # Вернет список
print(sorted_list[::-1])  # Развернем список

1
[1, 2]
[18, 15, 10, 5, 4, 3, 2, 1, 0]


In [12]:
len(sorted_list)

9

Если нам нужно что-то добавить к списку, то используем функцию `append`

In [13]:
sorted_list.append(126)

Список мутабелен, то есть может меняться с течением времени. Можно получать странные результаты.

Список `sorted_list`, судя по названию, должен быть отсортирован. Но мы можем его изменить.

In [14]:
sorted_list[0] = 125
print(sorted_list)

[125, 1, 2, 3, 4, 5, 10, 15, 18, 126]


Можно легко итерироваться по списку

In [15]:
for i in sorted_list:
    print(i + 1, end=" ")

126 2 3 4 5 6 11 16 19 127 

Если нужно не только значение, но и индекс элемента, то можно использовать `enumerate`

In [16]:
for i, val in enumerate(sorted_list):
    print(i, val)

0 125
1 1
2 2
3 3
4 4
5 5
6 10
7 15
8 18
9 126


## List comprehension

Если нужно создать список по какому-то правилу, то есть list comprehension

In [17]:
new_list = [value ** 2 for value in range(10)]
print(new_list)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Если есть возможность, лучше использовать list comprehension вместо обычного цикла

In [18]:
%%timeit

[i for i in range(10000)]

169 µs ± 1.27 µs per loop (mean ± std. dev. of 7 runs, 10,000 loops each)


In [19]:
%%timeit

new_list = []
for i in range(10000):
    new_list.append(i)

345 µs ± 536 ns per loop (mean ± std. dev. of 7 runs, 1,000 loops each)


## Задача

Вывести все четные числа среди квадратов чисел от 1 до 100.

In [20]:
# Ваш код здесь


### Кортеж

Нужно использовать, когда важен порядок элементов

In [21]:
tuple_example = (-10, 123, 0, 84)
print(tuple_example, type(tuple_example))
print(tuple_example[0])

(-10, 123, 0, 84) <class 'tuple'>
-10


Кортеж иммутабелен. Мы можем только создать новый кортеж.

In [22]:
tuple_example[0] = 123

TypeError: 'tuple' object does not support item assignment

Обычно используем tuple как строку какой-то таблицы

In [23]:
person_table = [
    ("Alex", 25, 175),
    ("Maria", 45, 165),
]

name, age, height = person_table[0]
print(name, age, height)

Alex 25 175


## Словарь

Используем, когда нужно отображать одни объекты в другие.

Словарь не упорядочен, нужно использовать когда порядок значений не важен.

In [24]:
dict_example = {"name": "Alex", "id": 1}

print(dict_example, type(dict_example))
print(dict_example["id"])

dict_example["age"] = 25
print(dict_example)

{'name': 'Alex', 'id': 1} <class 'dict'>
1
{'name': 'Alex', 'id': 1, 'age': 25}


In [25]:
name2age = {"Alex": 25, "Maria": 45}

In [26]:
dict_example.keys()

dict_keys(['name', 'id', 'age'])

In [27]:
dict_example.items()

dict_items([('name', 'Alex'), ('id', 1), ('age', 25)])

Словарь нельзя отсортировать, так как элементы неупорядочены

Есть dict comprehension

In [28]:
keys = ["id", "value"]
values = [1, 125]
new_dict = {keys[i]: values[i] for i in range(len(keys))}
print(new_dict)

{'id': 1, 'value': 125}


## Задача

Дан словарь, который сопоставляет номер месяца с его названием. Сделать обратный словарь, который будет сопоставлять названию месяца его номер.

Нельзя вручную задавать новый словарь.

In [29]:
month_dict = {
    1: 'Январь',
    2: 'Февраль',
    3: 'Март',
    4: 'Апрель',
    5: 'Май',
    6: 'Июнь',
    7: 'Июль',
    8: 'Август',
    9: 'Сентябрь',
    10: 'Октябрь',
    11: 'Ноябрь',
    12: 'Декабрь'
}

# Ваш код здесь


# Функции

Функция принимает на вход какие-то значения и что-то выдает. Функции нужны, чтобы убирать дублирования в коде.

Создадим свою функцию:

In [30]:
def add_one(x): # Сигнатура функции
    # Тело функции (в нашем случае пустое)
    return x + 1 # Возвращаемое значение (если не указать, то вернется None)

Функция `add_one` принимает на вход параметр `x` и прибавляет к нему единицу

Вызовем эту функцию:

In [31]:
add_one(5)

6

## Задача

Написать функцию, которая вернет список четных чисел от a до b

Напишем еще одну функцию. Что можно улучшить?

In [32]:
def square_list(input_list):
    new_list = []
    for x in input_list:
        new_list.append(x * x)
    return new_list

In [33]:
test_list = [i for i in range(10)]
result_list = square_list(test_list)
print(result_list)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Еще используем для "распаковки" значений функции

In [34]:
def some_function():
    return 1, 2, 3

a, b, c = some_function()

In [35]:
def get_two_first_args(*args):
    a, b, c = args
    return a, b

get_two_first_args(1, 2, 3)

(1, 2)

Если мы не хотим реализовывать функцию прямо сейчас, но хотим ее объявить, то можно использовать ключевое слово `pass`

In [36]:
# Эта функция ничего не делает
def empty_function():
    pass

Если не задать `pass`, то питон выдаст ошибку

In [37]:
def empty_function():
    # не пишем pass и получаем ошибку

IndentationError: expected an indented block (1281291744.py, line 2)

## Задача

Напишем функцию, которая принимает на вход любое количество аргумент и возвращает их среднее значение

Пример:

```python
average(1, 2, 3)
# 2

average(1, 2, 3, 4, 5)
# 3
```

In [38]:
# Ваш код здесь

## Map, filter, reduce

### Map
Если нужно преобразовать каждый элемент коллекции, то используем map

In [39]:
def square_element(x):
    return x * x

test_list = [i for i in range(10)]
list(map(square_element, test_list))

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [40]:
test_list = [i for i in range(100000)]


`map` ленивый и ничего не сделает, если не обращаться к каждому элементу

In [41]:
%%timeit

map(square_element, test_list)

82.1 ns ± 0.422 ns per loop (mean ± std. dev. of 7 runs, 10,000,000 loops each)


а еще он медленнее чем list comprehension

In [42]:
%%timeit

[i * i for i in test_list]

3.08 ms ± 14.2 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [43]:
%%timeit

list(map(square_element, test_list))

4.41 ms ± 10.7 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


Несколько фишек для укорачивания кода

In [44]:
test_list = list(range(10)) # Так можно создавать лист
for x in map(lambda x: x * x, test_list): # Так объявляются короткие функции
    print(x, end=" ") # Так можно использовать объект map

0 1 4 9 16 25 36 49 64 81 

### Filter

Если нужно отобрать какие-то значения, то можно использовать filter

In [45]:
test_list = [-5, 10, 123, -123]

list(filter(lambda x: x > 0, test_list))

[10, 123]

Если использовать filter и map вместе, то можно очень быстро делать очень сложные вещи

In [46]:
# Создадим тестовый список
test_list = [i for i in range(10000)]
# Четные элементы списка возьмем со знаком минус
test_list[::2] = map(lambda x: -x, test_list[::2])
print(test_list[:10])

[0, 1, -2, 3, -4, 5, -6, 7, -8, 9]


In [47]:
%%timeit

new_list = []
for x in test_list:
    if x > 0:
        new_list.append(x * x)

361 µs ± 2.42 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)


In [48]:
%%timeit

filtered = filter(lambda x: x > 0, test_list)
list(map(lambda x: x * x, filtered))

563 µs ± 4.3 µs per loop (mean ± std. dev. of 7 runs, 1,000 loops each)


Немного медленнее, но у нас нет необходимости хранить в памяти сразу весь список

### Reduce

In [49]:
from functools import reduce

Как работает reduce


![](../images/reduce.png)

Reduce стоит использовать, когда обрабатываете большое количество данных на кластере. В питоне это почти бесполезно.

In [50]:
test_list = [47, 11, 42, 13]

reduce(lambda x, y: x + y, test_list)

113

In [51]:
import operator

reduce(operator.add, test_list)

113

# Решаем квадратное уравнение

Нужно написать код функции, которая на вход принимает коэфициенты a, b и c квадратного уравнения и считает ответ.

Если корня два, то нужно вернуть кортеж вида $(x1, x2)$, где $x1 < x2$

Если корень один, то просто возвращаем число

Если корней нет, то возвращаем `None`

In [52]:
from math import sqrt

def solve_quadratic(a, b, c):
    # Ваш код здесь
    pass

Ячейки ниже просто запускаем, чтобы проверить, что мы правильно написали функцию. Если не ругается, значит все ок.

In [53]:
def calculate_quadratic(a, b, c, x):
    return a * x ** 2 + b * x + c

def test_quadratic(a, b, c):
    result = solve_quadratic(a, b, c)
    if b * b - 4 * a * c < 0:
        assert result is None
        return
    from typing import Iterable
    if isinstance(result, Iterable):
        x1, x2 = result
        assert abs(calculate_quadratic(a, b, c, x1)) < 0.00001
        assert abs(calculate_quadratic(a, b, c, x2)) < 0.00001
    else:
        x = result
        assert abs(calculate_quadratic(a, b, c, x)) < 0.00001

In [None]:
test_quadratic(1, -2, -3) # два корня
test_quadratic(1, 12, 36) # один корень
test_quadratic(1, 0, 0)
test_quadratic(0, 1, 0)
test_quadratic(2, 4, -7) # два корня
test_quadratic(1, 6, 9) # один корень
test_quadratic(2, 4, 7) # нет корней

## Работа с файлами

Разберемся с форматом json. Про остальные форматы позже.

In [54]:
# Сохраним строку
with open('test.txt', 'w') as f:
    f.write('hello world')
    
# Прочитаем файл
with open('test.txt', 'r') as f:
    print(f.read())

hello world


Удалим файл

In [55]:
import os

os.remove('test.txt')

### Сгенерируем данные

In [56]:
import json
import random

In [57]:
def generate_item(item_id, price):
    return {'item_id': item_id, 'price': price}

items = [generate_item(item_id, round(random.random() * 1000, 1)) for item_id in range(100)]
items[:3]

[{'item_id': 0, 'price': 312.0},
 {'item_id': 1, 'price': 643.7},
 {'item_id': 2, 'price': 116.1}]

### Сохраним и прочитаем как json

In [58]:
# Сконвертируем python-объект в формат json
json_content = json.dumps(items)

# А вот так сконвертить обратно
json_items = json.loads(json_content)

# Первые 100 символов
print(json_content[:100])

# Первые 3 элемента
print(json_items[:3])

[{"item_id": 0, "price": 312.0}, {"item_id": 1, "price": 643.7}, {"item_id": 2, "price": 116.1}, {"i
[{'item_id': 0, 'price': 312.0}, {'item_id': 1, 'price': 643.7}, {'item_id': 2, 'price': 116.1}]


In [59]:
# Сохраним в файл
with open('test.json', 'w') as f:
    f.write(json_content)

# Прочитаем
with open('test.json', 'r') as f:
    content = json.loads(f.read())
print(content[:3])

[{'item_id': 0, 'price': 312.0}, {'item_id': 1, 'price': 643.7}, {'item_id': 2, 'price': 116.1}]


In [60]:
os.remove('test.json')

### Сохраним много файлов

In [61]:
# Создадим папку, если ее нет
dir_name = 'data'
if not os.path.exists(dir_name):
    os.makedirs(dir_name)

for i, item in enumerate(items):
    path = os.path.join(dir_name, f'{i}.json')
    json.dump(item, open(path, 'w'))


### Прочитаем файлики

In [62]:
new_items = []

for filename in os.listdir(dir_name):
    path = os.path.join(dir_name, filename)
    if os.path.isfile(path):
        item = json.load(open(path, 'r'))
        new_items.append(item)

len(new_items), new_items[:3]

(100,
 [{'item_id': 20, 'price': 698.4},
  {'item_id': 98, 'price': 677.2},
  {'item_id': 77, 'price': 293.3}])

### Удалим файлики

In [64]:
import shutil
shutil.rmtree(dir_name)

# Git

`git init` - инициализировать репозиторий

`git add .` - добавить все файлы к отслеживанию

`git commit -m "commit message"` - сделать коммит с названием commit message

`git push origin master` - сделать пуш в удаленный репозиторий origin в ветку master

`git pull` - подтянуть изменения

`git branch new-feature` - сделать ветку new-feature

`git checkout new-feature` - перейти на ветку new-feature

`git log` - посмотреть историю коммитов

`git log --all --decorate --oneline --graph` - посмотреть красивую историю коммитов

`git checkout 978be83` - перейти к коммиту 978be83

При создании репозитория на github, будут написаны команды как запушить код в первый раз

## Задача

Последовательно сделать следующее:

1. Создать новую папку test_git

2. Инициализировать репозиторий

3. Сделать текстовый файл 1.txt, заполнить его по своему усмотрению

4. Сделать коммит

5. Сделать новую ветку second-file, перейти в нее

6. Закоммитить новый файл 2.txt с произвольным содержимым

7. Перейти к master-ветке, проверить, что файл 2.txt остался в другой ветке

8. Замержить ветку second-file в master

# Anaconda

`conda create -n my-environment python=3.11` - создать окружение my-environment с питоном 3.11

`conda activate my-environment` - активировать окружение

`conda deactivate` - деактивировать окружение

`conda install numpy` - установка библиотеки

`conda env export --name my-environment > env.yml` - экспорт всех библиотек в yml файл

`conda env create --file env.yml` - создать окружение из файла env.yml

# Полезные ссылки

- [Git](https://git-scm.com/downloads)

- [Anaconda](https://www.anaconda.com/products/individual#Downloads)

- [Miniconda](https://docs.conda.io/projects/miniconda/en/latest/) - лучше вот это скачивать

- [VS Code](https://code.visualstudio.com/download)

- [Шпаргалка по анаконде](https://docs.conda.io/projects/conda/en/4.6.0/_downloads/52a95608c49671267e40c689e0bc00ca/conda-cheatsheet.pdf)

- [Шпаргалка по гиту](https://education.github.com/git-cheat-sheet-education.pdf)

- [Установка jupyterlab (вариант с conda install, не забываем активировать окружение)](https://jupyterlab.readthedocs.io/en/stable/getting_started/installation.html)

# Домашнее задание (за него баллов нет, увы)

- Вступить в чатик
- Прочитать ПУД
- Установить Anaconda и Git
- Создать репозиторий на GitHub, отправить ссылку на почту
