<center>
<img src="https://upload.wikimedia.org/wikipedia/commons/a/a8/%D0%9B%D0%9E%D0%93%D0%9E_%D0%A8%D0%90%D0%94.png" width=300px/>
<br />
<h1>Функции, строки, байтовые строки,</h1>
<h1>потоки ввода-вывод</h1>
<br />
<h4>2021</h4> </center>

# Функции

## Что такое функция?

Именованный кусок кода, который можно переиспользовать

## Зачем нужны функции?

- Упрощение поддержки за счет переиспользования кода
- Логическая струкуризация программы, тк проще работать с небольшими кусочками кода, которые призваны сделать что-то простое и понятное
- Самодокументирование кода при использовании говорящих названий функций и параметров

### Объявление функции

In [1]:
def function():
    pass

<div class="alert alert-info">
<b>Hint:</b> Ключевое слово "pass" бывает полезно, если нужно явно указать, что в блоке кода ничего делать не нужно
</div>

### Вызов функции и её значение

In [2]:
result = function()

In [3]:
print(result)

None


<div class="alert alert-info">
<b>Info:</b> В питоне функция всегда возвращает значение. Если в теле функции отсутствует "return", она возвращает "None"
</div>

In [4]:
def meaning_of_life():
    return 42

### Пример осмысленной функции

<center>
<img src=https://wikimedia.org/api/rest_v1/media/math/render/svg/6b915be29a0f9a5267018f90014a74c6a04551f1  width=800/>
</center>

### Аргументы функции

In [6]:

def relative_difference(x, y):
    delta = x - y
    mean = (x + y) / 2
    return abs(delta / mean)

In [7]:
relative_difference(3, 5)

0.5

In [8]:
relative_difference(y=5, x=3)

0.5

<div class="alert alert-info">
<b>Hint:</b> Аргументы в функцию можно передавать по имени, при этом порядок аргументов не важен
</div>

<div class="alert alert-warning">
<b>PEP 8:</b> При указании аргументов по имени пробелы вокруг знака равенства не ставятся!
</div>

In [9]:
relative_difference(3, y=5)

0.5

In [10]:
relative_difference(5, -5)

ZeroDivisionError: float division by zero

In [11]:
def safe_relative_difference_long(x, y):
    delta = x - y
    mean = (x + y) / 2
    if mean == 0.0:
        res = None
    else:
        res = abs(delta / mean)
    return res

<div class="alert alert-info">
<b>Hint:</b> Как и во многих языках, в питоне функция может содержать более одного "return"
</div>

In [12]:
def safe_relative_difference(x, y):
    delta = x - y
    mean = (x + y) / 2
    if mean == 0.0:
        return None  # If condition is met function execution ends here
    return abs(delta / mean)

In [13]:
print(safe_relative_difference(5, -5))

None


### Документирование и аннотирование функций

In [14]:
import typing as tp

def relative_difference(x: float, y: float) -> tp.Optional[float]:
    """
    Compares two quantities taking into account their absolute values
    And another line just to make an example of multiline docstrings
    """
    delta = x - y
    mean = (x + y) / 2
    if mean == 0.0:
        return None
    return abs(delta / mean)

In [15]:
help(relative_difference)

Help on function relative_difference in module __main__:

relative_difference(x: float, y: float) -> Union[float, NoneType]
    Compares two quantities taking into account their absolute values



<div class="alert alert-info">
<b>Hint:</b> help выводит документацию по использованию объекта. Особенно полезна в интеративном режиме.
</div>

In [16]:
help(pow)

Help on built-in function pow in module builtins:

pow(base, exp, mod=None)
    Equivalent to base**exp with 2 arguments or base**exp % mod with 3 arguments
    
    Some types, such as ints, are able to use a more efficient algorithm when
    invoked using the three argument form.



### Значение аргументов по умолчанию

In [17]:
def relative_difference(x: float, y: float, verbose: bool = False) -> tp.Optional[float]:
    delta = x - y
    if verbose:
        print(f'Delta: {delta}')
    mean = (x + y) / 2
    if verbose:
        print(f'Mean: {mean}')
    if mean == 0.0:
        if verbose:
            print('Mean is equal to zero!')
        return None
    return abs(delta / mean)

<div class="alert alert-warning">
<b>PEP 8:</b> Для аргументов с типом при указании дефолтного значения принято ставить пробелы вокруг знака равенства
</div>

In [18]:
relative_difference(-10, 3)

3.7142857142857144

In [19]:
relative_difference(-10, y=3, verbose=True)

Delta: -13
Mean: -3.5


3.7142857142857144

In [20]:
relative_difference(y=3, x=-10, verbose=True)

Delta: -13
Mean: -3.5


3.7142857142857144

In [21]:
relative_difference(x=-10, y=3, True)

SyntaxError: positional argument follows keyword argument (<ipython-input-21-9f1fd1fc8290>, line 1)

### Опциональные аргументы

In [22]:
def relative_difference(
        x: float, y: float,
        normalize_by: tp.Callable[[float, float], float] = None
    ) -> tp.Optional[float]:

    delta = x - y
    
    if normalize_by is not None:
        norm = normalize_by(x, y)
    else:
        norm = 1

    if norm == 0.0:
        return None
    return abs(delta / norm)

<div class="alert alert-warning">
<b>PEP 8:</b> Cравнивать что-либо с "None" нужно с помощью "is", "is not", т.к. это синглтон.
</div>

<div class="alert alert-warning">
<b>PEP 8:</b> Использовать "... is not ..." всегда предпочтительнее, чем "not ... is ...", ибо "Readability counts." (с) Zen of Python
</div>

In [23]:
relative_difference(-5, 8, normalize_by=max)

1.625

In [24]:
def mean(x: float, y: float) -> float:
    return (x + y) / 2

In [25]:
relative_difference(-5, 8, normalize_by=mean)

8.666666666666666

In [26]:
relative_difference(-5, 8)

13.0

In [27]:
relative_difference(-5, 8, mean)

8.666666666666666

### Исключительно именованные аргументы

In [28]:
def relative_difference(
        x: float, y: float,
        *,
        normalize_by: tp.Callable[[float, float], float] = None
    ) -> tp.Optional[float]:

    delta = x - y
    
    if normalize_by is not None:
        norm = normalize_by(x, y)
    else:
        norm = 1.0

    if norm == 0.0:
        return None
    return abs(delta / norm)

In [29]:
relative_difference(-5, 8, mean)

TypeError: relative_difference() takes 2 positional arguments but 3 were given

In [30]:
relative_difference(-5, 8, normalize_by=mean)

8.666666666666666

### Исключительно позиционные аргументы

In [31]:
def relative_difference(
        x: float, y: float,
        /,
        *,
        normalize_by: tp.Callable[[float, float], float] = None
    ) -> tp.Optional[float]:

    delta = x - y
    
    if normalize_by is not None:
        norm = normalize_by(x, y)
    else:
        norm = 1.0

    if norm == 0.0:
        return None
    return abs(delta / norm)

In [32]:
relative_difference(-5, y=8, normalize_by=mean)

TypeError: relative_difference() got some positional-only arguments passed as keyword arguments: 'y'

### Инициализация дефолтных аргументов

In [1]:
def function(list_argument=[]):
    list_argument.append("Hi!")  
    return list_argument

In [2]:
function()

['Hi!']

In [3]:
function()

['Hi!', 'Hi!']

In [4]:
function()

['Hi!', 'Hi!', 'Hi!']

<div class="alert alert-danger">
<b>Ошибка:</b> Использовать мутабельные объекты в качестве дефолтного значения аргумента функции
</div>

In [37]:
def function(list_argument: tp.Optional[tp.List[str]] = None) -> tp.List[str]:
    if list_argument is None:
        list_argument = []
    list_argument.append("Hi!")  
    return list_argument

In [38]:
function()

['Hi!']

In [39]:
function()

['Hi!']

In [40]:
function()

['Hi!']

<div class="alert alert-success">
<b>Рекомендация:</b> По возможности, используйте "None" в качестве дефолтного значения аргумента функции 
</div>

### А если None нужен для другого?

In [41]:
class _Sentinel:
    pass

sentinel = _Sentinel()

def function(list_argument: tp.Union[tp.List[str], None, _Sentinel] = sentinel) -> tp.Optional[tp.List[str]]:
    if list_argument is None:
        return None

    the_list: tp.List[str] = []
    if not isinstance(list_argument, _Sentinel):
        the_list = list_argument
    the_list.append("Hi!")
    return the_list

In [42]:
function()

['Hi!']

In [43]:
print(function(None))

None


<div class="alert alert-info">
<b>Hint:</b> Если вам нужно отличать случай, когда вам передали "None", от дефолтного значения аргумента,
    создайте специальный sentinel-объект для дефолтного значения
</div>

### Функция от произвольного числа аргументов

<center>
<img src=https://wikimedia.org/api/rest_v1/media/math/render/svg/fc621ce0b9b2d52e3ce835a9211f042f272c341e width="300"/>
</center>

In [44]:
def root_mean_square(args: tp.List[float]) -> float:
    if not args:
        return 0.0

    squares_sum = sum(x ** 2 for x in args)

    mean = squares_sum / len(args)
    return mean ** 0.5

In [45]:
root_mean_square([4, 8, 15, 16, 23, 42])

21.80978373727412

## *args

In [7]:
def root_mean_square(*args: float) -> float:
    if not args:
        return 0.0
    
    squares_sum = sum(x ** 2 for x in args)

    mean = squares_sum / len(args)
    return mean ** 0.5

<div class="alert alert-warning">
<b>PEP 8:</b> Для *args указывается тип одного элемента списка!
</div>

In [8]:
root_mean_square(4, 8, 15, 16, 23, 42)

21.80978373727412

## **kwargs

In [48]:
def root_mean_square(*args: float, **kwargs: tp.Any) -> float:
    verbose = kwargs.get('verbose', False)
    
    if not len(args):
        if verbose:
            print('Empty arguments list!')
        return 0.0

    squares_sum = sum(x ** 2 for x in args)
    if verbose:
        print(f'Sum of squares: {squares_sum}')

    mean = squares_sum / len(args)
    if verbose:
        print(f'Mean square: {mean}')

    return mean ** 0.5

In [49]:
root_mean_square(4, 8, 15, 16, 23, 42, verbose=True)

Sum of squares: 2854
Mean square: 475.6666666666667


21.80978373727412

In [50]:
root_mean_square(verbose=True)

Empty arguments list!


0.0

### Распаковка аргументов функции

In [56]:
def function(x, y, /, *, option1=None, option2=None):
    print(x, y, option1, option2)

In [57]:
positional = [4, 8]
key_value = {'option1': 15, 'option2': 16}

In [58]:
function(*positional, **key_value)

4 8 15 16


In [59]:
function(4, 8, option1=3, **key_value)

TypeError: function() got multiple values for keyword argument 'option1'

### Когда нужны \*args, **kwargs

In [60]:
def logged(func: tp.Callable[..., tp.Any]) -> tp.Any:
    def wrapper(*args, **kwargs):
        print(f'{func.__name__} is called with arguments: {args} {kwargs}')
        return func(*args, **kwargs)

    return wrapper

In [61]:
logged_relative_difference = logged(relative_difference)

In [62]:
logged_relative_difference(23, 42, normalize_by=mean)        

relative_difference is called with arguments: (23, 42) {'normalize_by': <function mean at 0x7f5b3c5f5430>}


0.5846153846153846

## Лямбды

In [9]:
sorted(['привет', 'как', 'дела'], key=lambda string: len(string))

['как', 'дела', 'привет']

In [10]:
string_length = lambda string: len(string)

<div class="alert alert-danger">
<b>Антипаттерн:</b> Сохранять лямбду в переменную
</div>

# Строки

In [64]:
a = 'The word you are looking for is "Hello".'

In [65]:
b = "I'll wait you there"

In [66]:
c = '''Тройные кавычки
для строк с переносами.
Русский язык поддерживается из коробки.
Как и любой другой'''

In [67]:
"And also" " you can " \
"split them in pieces"

'And also you can split them in pieces'

In [68]:
("And also" " you can "
"split them in pieces")

'And also you can split them in pieces'

## О поддержке русского языка

In [69]:
def покажи(а):
    print(а)

делимое = 6
делитель = 3

частное = делимое / делитель

покажи(частное)

2.0


## Как хранятся строки

**Кодировка** (encoding) — таблица, задающая отображение конечного множества символов алфавита в байты

Наиболее известные семейства кодировок:
  - совместимые с ASCII,
  - совместимые с EBCDIC,
  - основанные на Юникоде

![ASCII](https://upload.wikimedia.org/wikipedia/commons/thumb/4/4f/ASCII_Code_Chart.svg/1920px-ASCII_Code_Chart.svg.png)

(ASCII - American Standard Code for Information Interchange)

### windows-1252, старшая часть таблицы
![windows-1252](https://avatars.mds.yandex.net/get-pdb/2711552/0172cebb-9c7e-495c-b099-1b0df5ad42f5/s1200)

### windows-1251, старшая часть таблицы
![wind-1251](http://gimnnik.narod.ru/open-office/TextProcessor/images/cp1251.gif)


### KOI-8R, старшая часть таблицы
![koi8-r](http://gimnnik.narod.ru/open-office/TextProcessor/images/koi8-r.gif)


## Unicode


**Unicode** — cтандарт в котором перечислены все возможные символы, включает практически все современные 

письменности, в частности письменности Востока, Азии и Африки. Unicode - это только список, а не кодировка.

### Первая Unicode плоскость
![unicode](https://upload.wikimedia.org/wikipedia/commons/thumb/0/05/Roadmap_to_Unicode_BMP_multilingual.svg/langru-1920px-Roadmap_to_Unicode_BMP_multilingual.svg.png)

Всего плоскостей 17, каждая по 2^16 символов, то есть всего 1114112 сиволов

Строки в python 3 — последовательность символов unicode.

![py3unicode](https://avatars.mds.yandex.net/get-pdb/2974349/4e925664-387a-45ef-8afd-f49b8cd13c7e/s1200)

Unicode имеет несколько форм представления, кодировок (Unicode transformation format, UTF):
- UTF-8
- UTF-16
- UTF-32

UTF-8 — представление Юникода, обеспечивающее наибольшую компактность и обратную совместимость с ASCII

## Байты и байтовые строки

Байты (`bytes`) — некоторые бинарные данные (не обязательно текстовые)

bytearray - mutable

In [74]:
bytes([84, 104, 101, 115, 101, 32, 98, 121, 116, 101, 115])

b'These bytes'

In [75]:
bytes([200, 220, 240, 3])

b'\xc8\xdc\xf0\x03'

In [76]:
bytes([1,2, 1000])

ValueError: bytes must be in range(0, 256)

In [77]:
b'hello мир'

SyntaxError: bytes can only contain ASCII literal characters. (<ipython-input-77-150f9a3d76cd>, line 1)

In [78]:
list(b'just like ints')

[106, 117, 115, 116, 32, 108, 105, 107, 101, 32, 105, 110, 116, 115]

In [79]:
len(b'bytes')

5

### Строки <-> байты

In [80]:
'Туда'.encode('utf-8')

b'\xd0\xa2\xd1\x83\xd0\xb4\xd0\xb0'

In [81]:
b'\xd0\xb8 \xd0\xbe\xd0\xb1\xd1\x80\xd0\xb0\xd1\x82\xd0\xbd\xd0\xbe'.decode(encoding='utf-8')

'и обратно'

### Кодировка по-умолчанию

In [82]:
import sys
sys.getdefaultencoding() # речь идет про кодировку исходников!

'utf-8'

In [213]:
# а если написать в начале файла с сорцами
# -*- coding: latin-1 -*-
text = 'то текст больше не будет юникодом. (хотя в этой жупитер тетрадке все еще юникод)'

# а также внутри в питоне тоже будет юникод

### Трудности перевода

In [43]:
'Это сообщение в utf-8'.encode('utf-8').decode('cp1251')

'Р\xadС‚Рѕ СЃРѕРѕР±С‰РµРЅРёРµ РІ utf-8'

Кодировка может вообще не содержать некоторых символов

In [45]:
'Привет'.encode('utf-8').decode('ascii')

UnicodeDecodeError: 'ascii' codec can't decode byte 0xd0 in position 0: ordinal not in range(128)

### Байты != строки

In [186]:
'test' == b'test'

False

Потому что байты - это любые бинарные данные, не обязательно текстовые.

И даже если данные текстовые, то без знания кодировки правильно отобразить их может быть сложно.

In [55]:
b'sample text in latin'.decode('utf-16')

'慳灭敬琠硥⁴湩氠瑡湩'

<div align="center">
<img alt="meme" src="https://cs10.pikabu.ru/images/big_size_comm/2018-01_5/1516896816147643489.jpg" width="550px"/>
</div>



<div align="center">
<img alt="lol" src="https://avatars.mds.yandex.net/get-pdb/2434617/db2f341b-deac-406a-b690-631311f37ee5/s1200" width="1400px"/>
</div>

## Получение символа по коду и наоборот

In [98]:
ord('G'), ord('ы')  # это номер в юникоде. Всегда номер в юникоде

(71, 1099)

In [99]:
chr(71)

'G'

In [101]:
chr(ord('B') - 1), chr(ord('A') + 256)

('A', 'Ł')

In [17]:
chr(65536 * 17)

ValueError: chr() arg not in range(0x110000)

In [19]:
int('0x110000', base=16), int('0x110000', base=16) / 65536

(1114112, 17.0)

## Управляющие символы и их escape-последовательности

In [343]:
print('name\tsurname\n---------------\nHarold\tFinch')

name	surname
---------------
Harold	Finch


In [21]:
sample_string = 'Whoops\b.\0'
print(sample_string)

Whoops. 


In [23]:
print(sample_string)
print(len(sample_string))

Whoops. 
9


## Raw-strings

In [21]:
print('Hey\tFrank!\nHow are you?')

Hey	Frank!
How are you?


In [23]:
print(r'Hey\tFrank!\nHow are you?')

Hey\tFrank!\nHow are you?


In [24]:
r'Hey\tFrank!\nHow are you?'

'Hey\\tFrank!\\nHow are you?'

In [25]:
'Hey\tFrank!\nHow are you?'

'Hey\tFrank!\nHow are you?'

## Escape-последовательности unicode

`\u[0-F]{4}` или  `\U[0-F]{8}` или `\N{NameGoesHere}`

In [102]:
print('\u0056\u0069\u006f\u006c\u0065\u006e\u0074\u0020'
      '\u0063\u0072\u0069\u006d\u0065\u0073\u0020'
      '\u0069\u006e\u0076\u006f\u006c\u0076\u0069\u006e\u0067\u0020'
      '\u006f\u0072\u0064\u0069\u006e\u0061\u0072\u0079\u0020'
      '\u0070\u0065\u006f\u0070\u006c\u0065\u002e')

Violent crimes involving ordinary people.


In [103]:
print('\U0001f4b0')

💰


In [106]:
print('\N{SMILING FACE WITH SUNGLASSES}')

😎


### Различные escape-последовательности можно миксовать

In [123]:
print("a\xac\u1234\u20ac\U00008000\N{GREEK CAPITAL LETTER DELTA}")

a¬€耀Δ


## Немного про UTF-8

In [99]:

def letter_summary(letter: str) -> tp.Tuple[str, int, str, bytes]:
    dec_code = ord(letter)
    hex_code = hex(dec_code)
    bytes_written = letter.encode('utf-8')
    return letter, dec_code, hex_code, bytes_written

In [100]:
letter_summary('g')

('g', 103, '0x67', b'g')

In [101]:
letter_summary('ы')

('ы', 1099, '0x44b', b'\xd1\x8b')

<img src="https://avatars.mds.yandex.net/get-pdb/2905812/e41de13f-3a16-4734-855f-6f3dd113ac32/s1200"/>

In [102]:
chr(170000).encode('utf-8'), hex(170000)

(b'\xf0\xa9\xa0\x90', '0x29810')

### Тест на понимание utf-8

In [24]:
('I designed the machine to detect acts of terror '
 'but it sees everything.').encode('utf-8').decode('ascii')

'I designed the machine to detect acts of terror but it sees everything.'

In [25]:
len('Hello'.encode('utf-8'))

5

In [26]:
len('Hello Мир'.encode('utf-8'))

12

# Совсем немного про память

In [30]:
import sys
print(sys.getsizeof(''))
print(sys.getsizeof('Hell'))

49
53


In [28]:
print(sys.getsizeof('Hello'))

53
54


In [31]:
print(sys.getsizeof('мир'))

80


In [32]:
print(sys.getsizeof('Hello мир'))

92


In [34]:
print(sys.getsizeof('Hello мирa'))

94


## Базовые методы строк

In [107]:
first = 'The Government'

In [108]:
print(list(first))

['T', 'h', 'e', ' ', 'G', 'o', 'v', 'e', 'r', 'n', 'm', 'e', 'n', 't']


In [109]:
print(type(first))
print(type(first[0]))

<class 'str'>
<class 'str'>


In [110]:
second = '...considers these people "irrelevant".'

In [111]:
bool(second)

True

In [112]:
bool('')

False

In [113]:
'irrelevant' in second

True

### Сравнения

In [114]:
'a' < 'b'

True

In [115]:
'test' < 'Hi'

False

In [116]:
'ёжик' < 'медвежонок'

False

In [117]:
ord('ё') < ord('м')  # 1105 vs 1084

False

In [121]:
import icu

collator = icu.Collator.createInstance(icu.Locale('ru_RU.UTF-8'))

sorted(['ёжик', 'медвежонок'], key=collator.getSortKey)

['ёжик', 'медвежонок']

### Регистр

In [164]:
test = 'We don\'t.'

In [165]:
test.upper()

"WE DON'T."

In [166]:
test.lower()

"we don't."

In [167]:
test.title()

"We Don'T."

In [168]:
test.swapcase()

"wE DON'T."

### Поиск в строке

In [244]:
secret = 'Hunted by the authorities, we work in secret.'
print(secret.count('e')) 

6


In [245]:
print(secret.index('authorities'))  ## or .find .rfind .rindex

14


In [246]:
secret.index('god')

ValueError: substring not found

In [247]:
secret.find('god')

-1

### Предикаты

In [172]:
"You'll never find us".endswith("find us")  # also: .startswith

True

In [195]:
"16E45".isalnum(), "16".isdigit(), "q".isalpha()

(True, True, True)

In [196]:
"test".islower(), "Test Me".istitle()

(True, True)

### Split & join

In [170]:
header = 'ID\tNAME\tSURNAME\tCITY\tREGION\tAGE\tWEALTH\tREGISTERED'

In [171]:
print(header.split())

['ID', 'NAME', 'SURNAME', 'CITY', 'REGION', 'AGE', 'WEALTH', 'REGISTERED']


In [172]:
print('\n'.join(s.lower() for s in header.split()))

id
name
surname
city
region
age
wealth
registered


### replace & translate

In [122]:
text = 'Вот так работает замена'

In [123]:
text.replace('от', 'УПС')

'ВУПС так рабУПСает замена'

In [124]:
text.translate({ord('а'): ord('d'), ord('б'): 'y'})

'Вот тdк рdyотdет зdменd'

### Выравнивание

In [197]:
print('but victim or perpetrator'.ljust(40, '.'))

but victim or perpetrator...............


In [199]:
print('if your number\'s up...'.rjust(40, '.'))

..................if your number's up...


In [201]:
print('we\'ll find *you*'.center(40, '.'))

............we'll find *you*............


### Форматирование

https://docs.python.org/3/library/string.html#format-specification-mini-language

In [38]:
from datetime import datetime

"[{}]: Starting new process '{}'".format(
    datetime.now().strftime('%Y-%m-%d %H:%M:%S'),
    'watcher'
)

"[2019-10-01 02:47:43]: Starting new process 'watcher'"

In [173]:
"{1}! My name is {0}!".format("John", "Hi")

'Hi! My name is John!'

In [337]:
name='John'
surname='Reese'

f'{name} {surname}'

'John Reese'

In [175]:
for value in [0.6, 1.0001, 22.7]:
    print(f'value is {value:07.4f}')

value is 00.6000
value is 01.0001
value is 22.7000


In [241]:
comment = 'Added yet another homework solution'
commit_hash = '7a721ddd315602f94a7d4123ea36450bd2af3e89'
f'{commit_hash=}, {comment=}'
# self-documenting string

"commit_hash='7a721ddd315602f94a7d4123ea36450bd2af3e89', comment='Added yet another homework solution'"

In [339]:
some_random_url = 'https://yandex.ru/images/'
some_random_url.strip('/')  # rstrip, lstrip

'https://yandex.ru/images'

### Модуль string

In [10]:
import string

string.ascii_letters

'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

In [11]:
string.ascii_lowercase

'abcdefghijklmnopqrstuvwxyz'

In [12]:
string.punctuation

'!"#$%&\'()*+,-./:;<=>?@[\\]^_`{|}~'

# Потоки ввода-вывода

## Откуда берутся потоки

<div align="center">
<img alt="streams" src="http://maxvoloshin.com/images/shell-streams.png" width="600px" />
</div>

In [54]:
import sys

sys.stdout.write('Hello again!\n')

Hello again!


In [56]:
sys.stderr.write('Danger!\n')

Danger!

### Каждый байт сообщения печатается сразу?

спойлер: нет

In [None]:
# в ноутбуке выполнять бесполезно
import sys
from time import sleep


print('test', end='')
# uncomment to fix!
# sys.stdout.flush()
# ur use print('test', end='', flush=True)
print('err', file=sys.stderr)

sleep(1)


Нет, потому что вывод буферизирован, и обычно ожидает конец строки `\n`, либо явной

команды на опустошение буфера.

## Откуда ещё берутся потоки?

## Файлы

In [248]:
f = open('tail_access.log')
f

<_io.TextIOWrapper name='tail_access.log' mode='r' encoding='UTF-8'>

In [249]:
content = f.read()

In [250]:
len(content)

1036156

In [251]:
f.close()  # implicit f.flush()

Читать весь файл в память может быть очень дорого

In [255]:
f = open('tail_access.log')

In [256]:
f.readline()

'[22/Sep/2019:19:08:27 +0000] py.manytask.org 46.39.53.190 "GET / HTTP/1.1" 200 0.243 5987 "0.240"\n'

А если там не строки? Или нужно прочитать сразу пачку строк?

In [257]:
chunk_size = 512
f.read(chunk_size)

'[22/Sep/2019:19:08:28 +0000] py.manytask.org 46.39.53.190 "GET /static/favicon.png HTTP/1.1" 200 0.004 1825 "0.004"\n[22/Sep/2019:19:10:14 +0000] py.manytask.org 89.178.228.153 "GET / HTTP/1.1" 200 0.196 6016 "0.196"\n[22/Sep/2019:19:10:14 +0000] py.manytask.org 89.178.228.153 "GET /static/style.css HTTP/1.1" 304 0.004 599 "0.004"\n[22/Sep/2019:19:10:16 +0000] py.manytask.org 89.178.228.153 "GET / HTTP/1.1" 200 0.133 6016 "0.132"\n[22/Sep/2019:19:10:16 +0000] py.manytask.org 89.178.228.153 "GET /static/style.cs'

In [258]:
f.close()

Окей, хотим прочитать чанками до конца...

In [259]:
f = open('tail_access.log')

In [260]:
lines = 0
while True:
    chunk = f.read(chunk_size)
    if not chunk:
        break
    lines += chunk.count('\n')
lines

9656

In [261]:
f.read()

''

In [262]:
f.close()

In [269]:
f = open('unicode_file.txt', encoding='windows-1251')
f.read(5)

'РџСЂР'

In [270]:
f.close()

In [271]:
f = open('unicode_file.txt', encoding='utf-8')
f.read(5)

'Приве'

In [272]:
f.close()

А если нужно вернуться в начало прочитанного файла? Обязательно открывать заново?

In [274]:
f = open('tail_access.log')
content = f.read()

In [275]:
f.read()

''

In [276]:
import io
f.seek(0, io.SEEK_SET)

0

In [277]:
f.readline()

'[22/Sep/2019:19:08:27 +0000] py.manytask.org 46.39.53.190 "GET / HTTP/1.1" 200 0.243 5987 "0.240"\n'

In [278]:
f.tell()

98

Хочу читать с конца файла!

In [279]:
f.seek(-100, io.SEEK_END)  # упс...

UnsupportedOperation: can't do nonzero end-relative seeks

In [280]:
f.close()

### Modes

In [281]:
f = open('tail_access.log', 'r')
f.readline()  # в текстовом режиме читаются строки (strings)

'[22/Sep/2019:19:08:27 +0000] py.manytask.org 46.39.53.190 "GET / HTTP/1.1" 200 0.243 5987 "0.240"\n'

In [282]:
f.close()

In [283]:
f = open('tail_access.log', 'rb')
f.readline()  # в байтовом (бинарном) режиме читаются байты

b'[22/Sep/2019:19:08:27 +0000] py.manytask.org 46.39.53.190 "GET / HTTP/1.1" 200 0.243 5987 "0.240"\n'

In [284]:
f.close()

<div align="center">
<img alt="random-access" src="https://im0-tub-ru.yandex.net/i?id=81194f1ca168f04af2ce3a77b0f131e3&n=13" width="600px" />
</div>

In [286]:
f = open('tail_access.log', 'rb')
f.seek(-99, io.SEEK_END)  # только для байтовых строк

1036057

In [287]:
f.read()

b'[28/Sep/2019:15:57:03 +0000] py.manytask.org 91.228.178.70 "GET / HTTP/1.1" 200 0.130 8337 "0.128"\n'

### Write

In [288]:
f = open('/tmp/junk.txt', 'w')

In [289]:
f.write('test\n')

5

In [291]:
f.close()

In [292]:
f = open('/tmp/junk.txt', 'a')
f.write('another one\n')
f.close()

In [293]:
f = open('/tmp/junk.txt')
f.read()

'test\nanother one\n'

In [294]:
f.close()

In [295]:
f = open('/tmp/junk.bin', 'wb')

In [296]:
f.write(b'\x20\x12')

2

In [297]:
f.close()

### Read + write

In [299]:
f = open('/tmp/junk.txt', 'r+')

In [300]:
f.write('test\n')

5

In [301]:
f.seek(0, io.SEEK_SET)
f.read()

'test\nanother one\n'

In [302]:
f.close()

### Context manager

In [303]:
with open('/tmp/junk.txt') as f:
    print(f.read())

test
another one



## In-memory streams

### StringIO

In [304]:
import io

In [305]:
output = io.StringIO()
output.write('This goes into the stream. ')
print('And so does this.', file=output)

In [306]:
print(output.getvalue())

This goes into the stream. And so does this.



In [307]:
output.close()  # отбрасываем содержимое стрима

In [308]:
input_ = io.StringIO('Inital value for read stream')

In [309]:
print(input_.read())

Inital value for read stream


### BytesIO

In [2]:
import io
output = io.BytesIO()
output.write('This goes into the stream. '.encode('utf-8'))
# output.write('ÁÇÊ'.encode('utf-8'))

27

In [311]:
print(output.getvalue())

b'This goes into the stream. \xc3\x81\xc3\x87\xc3\x8a'


In [312]:
input_ = io.BytesIO(b'Inital value for read stream')

In [313]:
print(input_.read())

b'Inital value for read stream'


### Напоследок

<div align="center">
<img alt="random-access" src="https://www.bestprog.net/wp-content/uploads/2020/04/11_01_02_03_02_01_01_.jpg" width="600px" />
</div>

# Всем спасибо!