# Чтение и запись файлов

Ещё примеры есть в [семинаре номер три!](https://github.com/hse-econ-data-science/dap_2021_spring/blob/main/sem03_functions/sem03_functions.ipynb)

In [4]:
f = open('text.txt', 'r')
a = f.readlines()
a

['привет!']

In [5]:
f.close() 

In [6]:
f.readlines() # файл закрыт, нельзя читать!

ValueError: I/O operation on closed file.

In [24]:
x = 'lkwfjfwejfwel'
f = open('text.txt', 'a')  
f.writelines(x)

In [None]:
# w - режим записи в файл с затиранием того, что там было 
# a - режим дозаписи в файл новой информации

In [25]:
f.close()

In [26]:
!cat text.txt

lkwfjfwejfwel

In [27]:
with open("text.txt", "r") as f:
    a = f.readlines()
a

['lkwfjfwejfwel']

# Json

- [Что такое json?](https://ru.wikipedia.org/wiki/JSON)
- [Как работать с json в python](https://python-scripts.com/json)

In [30]:
import json

with open("markup.json", "r") as f:
    x = json.load(f)

In [31]:
x[0]

{'inputValues': {'id': 1, 'version': 1},
 'workerId': 465,
 'taskId': 0,
 'outputValues': {'result': 'ok'}}

In [34]:
y = [{'a' : i} for i in range(3)]
y

[{'a': 0}, {'a': 1}, {'a': 2}]

In [35]:
with open("test.json", "w") as f:
    json.dump(y, f)

In [36]:
!cat test.json

[{"a": 0}, {"a": 1}, {"a": 2}]

# Модуль collections 

`collections` - сборник полезных структур данных

 - [документация](https://docs.python.org/3.9/library/collections.html?highlight=collections#module-collections)
 - [примеры использования](https://python-scripts.com/import-collections)

In [37]:
from collections import Counter

a = ['red', 'blue', 'red', 'green', 'blue', 'blue']
cnt = Counter(a)
cnt

Counter({'red': 2, 'blue': 3, 'green': 1})

In [38]:
cnt['red']

2

In [39]:
cnt.most_common()

[('blue', 3), ('red', 2), ('green', 1)]

# Модуль iterools

`itertools` - сборник полезных итераторов 

Внутри набор быстрых и эффективных по памяти иснтументов. Вместе формируют "алгебру итераторов", которая позволяет лаконично и эффективно создвать на python разные штуки. Многие очень специфичные, но рано или поздно могут пригодиться. Рекомендую почитать что есть внутри.

* [документация](https://docs.python.org/3.9/library/itertools.html?highlight=itertools)
* [обзорная статья на хабре с примерами кода](https://habr.com/ru/company/otus/blog/529356/)


In [47]:
from itertools import groupby

student = [
        ('john', 'A', 15),
        ('jane', 'B', 12),
        ('daavee', 'B', 10),
    ]

По ключу `key` можно указать функцию, которая вычисляется при работе функции.

In [48]:
def f(w):
    return w[-1]
    
max(student, key=f)

('john', 'A', 15)

In [49]:
max(student, key=lambda w: w[-1])

('john', 'A', 15)

In [51]:
max(student, key=lambda w: len(w[0]))

('daavee', 'B', 10)

In [52]:
sorted(student, key=lambda w: w[-1])

[('daavee', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]

In [53]:
groupby(student, key=lambda w: w[1])

<itertools.groupby at 0x104ae7d60>

In [54]:
list( groupby(student, key=lambda w: w[1]))

[('A', <itertools._grouper at 0x104e81f70>),
 ('B', <itertools._grouper at 0x104e81bb0>)]

__Важно:__ этот `groupby` глуповат и умеет группировать только отсротированные данные. 

In [56]:
[(i, list(v)) for i,v in groupby(student, key=lambda w: w[1]) ]

[('A', [('john', 'A', 15)]), ('B', [('jane', 'B', 12), ('daavee', 'B', 10)])]

In [62]:
student = [
        ('jane', 'B', 12),
        ('john', 'A', 15),
        ('daavee', 'B', 10),
    ]

[(i, list(v)) for i,v in groupby(student, key=lambda w: w[1]) ]

[('B', [('jane', 'B', 12)]),
 ('A', [('john', 'A', 15)]),
 ('B', [('daavee', 'B', 10)])]

In [63]:
[(i, list(v)) for i,v in groupby(sorted(student, key=lambda w: w[1]), key=lambda w: w[1]) ]

[('A', [('john', 'A', 15)]), ('B', [('jane', 'B', 12), ('daavee', 'B', 10)])]

# Модуль operator

Внутри разные стандартные штуки вроде сложения, умножения и тп, но реализованные эффективно по памяти. Этот модуль очень удобно совмещать с itertools, код работает быстрее. 

Одна из самых необычных штук - концепция геттеров. Это функция, которая извлекает по указанному пути нужные части структуры. Они полезны при работе с итераторами или генераторами последовательностей, так как вычисляются эффективнее, чем лямбда-функции, записанные в `key`.

- [Документация :3](https://docs.python.org/3.9/library/operator.html)
- [Примеры использования, но сложноватые,](https://pymotw.com/2/operator/) в реальности всё проще!

In [70]:
from operator import itemgetter

student = [
        ('john', 'A', 15),
        ('jane', 'B', 12),
        ('daavee', 'B', 10),
    ]

# указал 2 координату
sorted(student, key=itemgetter(2))

[('daavee', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]

In [59]:
# указал 1 координату
sorted(student, key=itemgetter(1))

[('john', 'A', 15), ('jane', 'B', 12), ('daavee', 'B', 10)]

In [60]:
# сортируем сначала по оценке, а потом и по возрасту
sorted(student, key=itemgetter(1,2))

[('john', 'A', 15), ('daavee', 'B', 10), ('jane', 'B', 12)]

In [61]:
# распаковка groupby
[(i, list(v)) for i,v in groupby(student, key=itemgetter(1)) ]

[('A', [('john', 'A', 15)]), ('B', [('jane', 'B', 12), ('daavee', 'B', 10)])]

Можно заставлять его вытаскивать конкретные ключи, а не координаты!

In [69]:
adict = [{'a': 1}, {'a': 1}, {'a': 5}]

[(i, list(v)) for i,v in groupby(adict, itemgetter('a'))]

[(1, [{'a': 1}, {'a': 1}]), (5, [{'a': 5}])]