# Виды строк

* привычные строки 

In [1]:
my_string = "Hello, people"

my_string

'Hello, people'

* raw-строки 
    * отключено экранирование символов 
    * используется для путей и для регулярных выражений 

In [2]:
raw_str = r'C:\file.txt'
raw_str

'C:\\file.txt'

* строковые литералы (docstring)

In [3]:
str_literal = ''' <div> < a href = .../> /> '''
str_literal

' <div> < a href = .../> /> '

# Лямбда выражения (анонимные функции)

* укорачивает кода
* не надо хранить статическую функцию в памяти

In [4]:
my_list = [1, 2, 3, 4]

list(map(lambda x: x%2 == 0, my_list))

[False, True, False, True]

In [5]:
list(map(lambda x: x if x%2 == 0 else None, my_list))

[None, 2, None, 4]

In [6]:
my_func = lambda x: x + 1 

my_func(3)

4

In [7]:
import pandas as pd 

df = pd.DataFrame([1, 2, 3, 4], columns=["numbers"])
df.head()

Unnamed: 0,numbers
0,1
1,2
2,3
3,4


In [8]:
df.apply(lambda x: x / 2)

Unnamed: 0,numbers
0,0.5
1,1.0
2,1.5
3,2.0


# Итератор

* Всё, где используется `for … in … ` - это итератор (итерируемый объект)

* можно итерироваться по объекту, даже если не знаешь его размер

In [9]:
n_list = [1, 2, 3]
for i in n_list:
	print(i)       # 1 2 3 


1
2
3


* под капотом используется функция `iter()`

In [10]:
itr = iter(n_list) 

itr

<list_iterator at 0x7fb511670970>

In [11]:
itr = iter(n_list) 

print(next(itr))	# 1
print(next(itr))	# 2
print(next(itr))	# 3
print(next(itr))	# StopIteration 

1
2
3


StopIteration: 

Штука, по которой нельзя итерироваться:

In [12]:
class MyClass:
    def __init__(self, names: list):
        self.names = names 

In [13]:
my_class = MyClass(['Lena', 'Akram', 'Ivan'])

for name in my_class:
    print(name)

TypeError: 'MyClass' object is not iterable

А если добавить парочку функций, то можно:

In [14]:
class MyClass:
    def __init__(self, names: list):
        self.names = names 
        self.ind = 0
    
    def __iter__(self):
        return self 
    
    def __next__(self):
        ind = self.ind 
        if ind == len(self.names):
            raise StopIteration
        
        self.ind += 1 
        return self.names[ind]

In [15]:
my_class = MyClass(['Lena', 'Akram', 'Ivan'])

for name in my_class:
    print(name)

Lena
Akram
Ivan


# Генератор

* функция, которая запоминает свой контекст, можно его вернуть с помощью слова yield
* фунция, которая будучи вызвана в next() возвращает следующий объект. 
* return ⇢ yield 
* ! При вызове yield функция не прекращает свою работу, а “замораживается” до очередной итерации, запускаемой next() 
* в генераторе хранится FrameObject 
* в CodeObject есть специальный флаг, который говорит питону, что это генератор 


In [16]:
nums = range(10)

nums, type(nums)

(range(0, 10), range)

In [18]:
# generator expression
# отличается от list comprehensions только скобочками 
#   и ОП, уже не список, а генератор 
gen_exp = (n**2 for n in nums if n%2 == 0)

gen_exp

<generator object <genexpr> at 0x7fb5110226d0>

In [19]:
# generator function
def square_all(numbers):
    for num in numbers:
        yield num ** 2

gen_func = square_all(nums)

In [20]:
next(gen_func), next(gen_func), next(gen_func)

(0, 1, 4)

In [21]:
next(gen_exp), next(gen_exp), next(gen_exp)

(0, 4, 16)

* Сокращает использование памяти! (т.к. обрабатывает не сразу весь список, а по одному значению за раз, т.е. не хранит в памяти ВСЁ)


Например, давайте представим, что у нас есть очень длинный текст, в памяти он занимаем 32 Гб, а оперативы у вас всего 8 Гб. Но обработать его очень нужно, иначе трындец утятам. 

Прочитать этот текст и сохранить его в виде списка предложений - не получится, банально, не лезет в память. 
Но вот тут то генератор забирает себе все авации и выходит на сцену. Благодаря генератору, мы можем загружать в память по одному предложению и совершать ту магию, которую нам нужно. Конечно, мы теряем способность обращаться к любому предложению по индексу (как в списке), но это нам тут и не нужно. Нам нужно пройти по всему тексту, по всем предложениями и обработать их. А это нам по плечу!