### Работа с текстовыми файлами 

В Python работа с текстовыми файлами осуществляется с помощью встроенных функций и методов. Вот основные шаги для работы с текстовыми файлами в Python:

Открытие файла: Для открытия файла используется функция open(). Она принимает два аргумента - имя файла и режим открытия. 

Режим открытия может быть 'r' (чтение), 'w' (запись), 'a' (добавление/дозапись), 'x' (создание и запись), и другие. 

In [None]:
f = open('path/to/file', 'filemode', encoding='utf8')

In [1]:
f = open('test.txt', 'w') 

# Запишем в файл строку
f.write("This is a test string")

# обязательно нужно закрыть файл иначе он будет заблокирован ОС
f.close()

In [2]:
f = open('test.txt') 

data = f.read()

# обязательно закрываем файл
f.close()

In [3]:
data

'This is a test string'

In [4]:
f = open('test.txt', 'w') 

# Запишем в файл строку
f.write("This is a ANOTHER string")

# обязательно нужно закрыть файл иначе он будет заблокирован ОС
f.close()

In [5]:
f = open('test.txt') 

data = f.read()

# обязательно закрываем файл
f.close()

In [6]:
data

'This is a ANOTHER string'

In [7]:
f = open('test.txt', 'a') 

# Запишем в файл строку
f.write("This is a test string")

# обязательно нужно закрыть файл иначе он будет заблокирован ОС
f.close()

In [8]:
f = open('test.txt') 

data = f.read()

# обязательно закрываем файл
f.close()

In [9]:
data

'This is a ANOTHER stringThis is a test string'

In [10]:
f = open('test.txt', 'w', encoding="utf-8")
f.write("Hello, Русский текст\n")
f.close()

f = open('test.txt')
print(f.read())

Hello, Русский текст



### Чтение и запись построчно

In [11]:
f = open('test_1.txt', 'a', encoding='utf8')  # открываем файл на дозапись

sequence = ["Первая строка\n", "Вторая строка\n", "Третья строка\n"]

f.writelines(sequence) # берет строки из sequence и записывает в файл (без переносов)

f.close()

In [16]:
f = open('test_1.txt', 'r', encoding='utf8')

In [13]:
data = f.read()
data

'Первая строка\nВторая строка\nТретья строка\nПервая строка\nВторая строка\nТретья строка\n'

In [14]:
print(data)

Первая строка
Вторая строка
Третья строка
Первая строка
Вторая строка
Третья строка



In [17]:
data = f.readlines()
data

['Первая строка\n',
 'Вторая строка\n',
 'Третья строка\n',
 'Первая строка\n',
 'Вторая строка\n',
 'Третья строка\n']

In [18]:
f.close()

In [27]:
f = open('numbers.txt', 'r')

data = f.readlines()
print(data)

f.close()

['1\n', '2\n', '3\n', '4\n', '5\n', '6\n', '7\n', '8\n', '9']


In [27]:
data = [int(i) for i in data]
data

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [25]:
f = open('numbers.txt', 'r')

data = list(map(int,f.readlines()))
print(data)

f.close()

[1, 2, 3, 4, 5, 6, 7, 8, 9]


In [28]:
sum(data)

45

In [19]:
f = open('numbers.txt') # можно перечислять строки в файле

for line in f:
    print(line.rstrip())
    
f.close()

1
2
3
4
5
6
7
8
9


## Менеджер контекста with

In [None]:
try:
    somefile = open("hello.txt", "w")
    
    try:
        somefile.write("hello world")
        
    except Exception as e: # вдруг возникнет какая-то ошибка
        print(e)
        
    finally:
        somefile.close()  # файл закроется в любом случае 
        
except Exception as ex:
    print(ex)

Менеджер контекста неявно вызывает закрытие файла после работы.
Что освобождает вас от забот о том, закрыли ли вы файл или нет.
Закрытие файла происходит при любом стечении обстоятельств,
даже если внутри with будет ошибка.

In [4]:
f = open('numbers.txt') # можно перечислять строки в файле

for line in f:
    print(line.rstrip())
    
f.close()

1
2
3
4
5
6
7
8
9


In [32]:
with open('numbers.txt') as f:
    for line in f:
        print(line.rstrip())

1
2
3
4
5
6
7
8
9


In [34]:
# копирование содержимого файла 
with open('test_1.txt', 'r') as ONE:
    with open("test_new.txt", "w") as SECOND:
        for line in ONE:
            SECOND.write(line)

### Работа с файловой системой
Основной модуль os в Python предоставляет функциональность для взаимодействия с операционной системой. Он позволяет выполнять различные операции с файлами, директориями, путями и другими системными ресурсами. Вот туториал по основным возможностям модуля os:

In [21]:
import os

# Получение текущей рабочей директории
cwd = os.getcwd()
print("Текущая рабочая директория:", cwd)

Текущая рабочая директория: /Users/elenamorozova/Desktop/My_course_materials/Python_auto_5-2.12/Day1_work_ with_files


In [34]:
# Получение списка файлов и директорий в указанной директории
dir_contents = os.listdir(cwd)
print("Содержимое директории:", dir_contents)

Содержимое директории: ['music.json', 'numbers.txt', 'data.pickle', 'file.json', 'papka', 'prices.csv', 'Работа с файлами.ipynb', 'Lab1_Auto_answers.ipynb', 'russian_ensure_ascii.json', 'russian.json', 'file.csv', 'test_1.txt', 'Расширенные_возможности_использования_функций_Работа_с_источниками_данных.ipynb', 'Lab1_Auto_new.ipynb', 'test.txt', '.ipynb_checkpoints', 'Dict_task_razbor.ipynb', 'Dict_task.ipynb', 'csv_lection.ipynb', 'prices.txt']


In [35]:
# список файлов и директорий в папке
os.listdir()

['music.json',
 'numbers.txt',
 'data.pickle',
 'file.json',
 'papka',
 'prices.csv',
 'Работа с файлами.ipynb',
 'Lab1_Auto_answers.ipynb',
 'russian_ensure_ascii.json',
 'russian.json',
 'file.csv',
 'test_1.txt',
 'Расширенные_возможности_использования_функций_Работа_с_источниками_данных.ipynb',
 'Lab1_Auto_new.ipynb',
 'test.txt',
 '.ipynb_checkpoints',
 'Dict_task_razbor.ipynb',
 'Dict_task.ipynb',
 'csv_lection.ipynb',
 'prices.txt']

In [40]:
# список файлов и директорий в другой директории отличной от текущей
os.listdir("/Users/elenamorozova/Desktop/My_course_materials/Python_auto_5.12")  # абсолютный путь

['.DS_Store', 'Day3_pandas', 'Day2_excel_modules', 'Day1_work_ with_files']

In [42]:
# список файлов и директорий в другой директории отличной от текущей
os.listdir("papka")  # относительный путь

['какой-то новый файл', 'untitled.txt', '.ipynb_checkpoints']

In [22]:
# Создание новой директории
os.mkdir("new_directory")

# Создание вложенных директорий
os.makedirs("parent/child")

In [23]:
# Удаление директории
os.rmdir("new_directory")

# Удаление директории и ее содержимого (рекурсивно)
os.removedirs("parent/child")

In [45]:
# Проверка существования файла или директории:

if os.path.exists("/Users/elenamorozova/Desktop"):
    print('File or directory exists')
else:
    print('File or directory does not exist')

File or directory exists


In [45]:
# Проверка, является ли путь директорией или файлом:

if os.path.isdir("/Users/elenamorozova/Desktop"):
    print('This is a directory')
    
elif os.path.isfile("/Users/elenamorozova/Desktop"):
    print('This is a file')

This is a directory


In [48]:
# Объединение путей

path = os.path.join('/Users', 'elenamorozova', 'Desktop')
path

'/Users/elenamorozova/Desktop'

In [49]:
if os.path.exists(path):
    print('File or directory exists')
else:
    print('File or directory does not exist')

File or directory exists


In [51]:
# Извлечение имени файла из пути

filename = os.path.basename('path/to/file.txt')
filename

'file.txt'

In [52]:
# Извлечение имени директории из пути

directory = os.path.dirname('path/to/file.txt')
directory

'path/to'

In [53]:
# Разделение пути на директорию и имя файла

directory, filename = os.path.split('path/to/file.txt')
directory, filename

('path/to', 'file.txt')

In [54]:
# Проверка, является ли путь абсолютным или относительным

if os.path.isabs('path/to/file.txt'):
    print('This is an absolute path')
else:
    print('This is a relative path')

This is a relative path


In [24]:
dir = '/Users/elenamorozova/Desktop/My_course_materials/Python_auto_5.12'
for root, dirs, files in os.walk(dir):
    print("Текущая директория", root)
    print("---")
    
    if dirs:
        print("Список папок", dirs)
    else:
        print("Папок нет")
    print("---")
    
    if files:
        print("Список файлов", files)
    else:
        print("Файлов нет")
    print("---")
    
    if files and dirs:
        print("Все пути:")
    for f in files:
        print("Файл ", os.path.join(root, f))
    for d in dirs:
        print("Папка ", os.path.join(root, d))
    print("===")

Текущая директория /Users/elenamorozova/Desktop/My_course_materials/Python_auto_5.12
---
Список папок ['Day3_pandas', 'Day2_excel_modules', 'Day1_work_ with_files']
---
Список файлов ['.DS_Store']
---
Все пути:
Файл  /Users/elenamorozova/Desktop/My_course_materials/Python_auto_5.12/.DS_Store
Папка  /Users/elenamorozova/Desktop/My_course_materials/Python_auto_5.12/Day3_pandas
Папка  /Users/elenamorozova/Desktop/My_course_materials/Python_auto_5.12/Day2_excel_modules
Папка  /Users/elenamorozova/Desktop/My_course_materials/Python_auto_5.12/Day1_work_ with_files
===
Текущая директория /Users/elenamorozova/Desktop/My_course_materials/Python_auto_5.12/Day3_pandas
---
Список папок ['Test2_modules', '.ipynb_checkpoints']
---
Список файлов ['Lab3_pandas.ipynb', '.DS_Store', 'Lection pandas.ipynb', 'Pandas_Intro_lection_auto.ipynb', 'train.csv']
---
Все пути:
Файл  /Users/elenamorozova/Desktop/My_course_materials/Python_auto_5.12/Day3_pandas/Lab3_pandas.ipynb
Файл  /Users/elenamorozova/Desktop/M

## Сериализация и Десериализация данных

Сериализация данных в программировании - это процесс преобразования объектов в формат, который может быть сохранен или передан, например, в файле или через сеть. Десериализация, с другой стороны, - это процесс восстановления сериализованных данных обратно в исходный объект. В Python для сериализации и десериализации данных часто используются модули pickle и json.

![https://app.diagrams.net/#G1hW2mNoQfq5Y49n2TOazzJNmAxIg7WwGz](https://drive.google.com/uc?id=1hW2mNoQfq5Y49n2TOazzJNmAxIg7WwGz)

Пример JSON:
    
```JavaScript
{
    "firstName": "Иван",
    "lastName": "Иванов",
    "address": {
        "streetAddress": "Московское ш., 101, кв.101",
        "city": "Ленинград",
        "postalCode": "101101“
    },
    "phoneNumbers": ["812 123-1234", "916 123-4567“]
}
```

In [60]:
f = open('test.json')
data = f.read()
data

'{"firstName": "Иван", "lastName": "Иванов", "address": {"streetAddress": "Московское ш., 101, кв.101", "city": "Ленинград", "postalCode": "101101"}, "phoneNumbers": ["812 123-1234", "916 123-4567"]}'

In [61]:
f.close()

In [62]:
data[10:50]

'e": "Иван", "lastName": "Иванов", "addre'

In [63]:
# импортируем модуль JSON
import json

f = open('test.json')
data = json.load(f)
data

{'firstName': 'Иван',
 'lastName': 'Иванов',
 'address': {'streetAddress': 'Московское ш., 101, кв.101',
  'city': 'Ленинград',
  'postalCode': '101101'},
 'phoneNumbers': ['812 123-1234', '916 123-4567']}

In [64]:
data["address"]['city'] = 'Москва'

In [65]:
data

{'firstName': 'Иван',
 'lastName': 'Иванов',
 'address': {'streetAddress': 'Московское ш., 101, кв.101',
  'city': 'Москва',
  'postalCode': '101101'},
 'phoneNumbers': ['812 123-1234', '916 123-4567']}

Сериализация и десериализация с помощью модуля json

In [70]:
import json

# Пример сериализации объекта в JSON строку
data = {'name': 'John', 'age': 30, 'city': 'New York'}

json_string = json.dumps(data)
print(json_string, type(json_string))

# Пример десериализации объекта из JSON строки
loaded_data = json.loads(json_string)

print(loaded_data, type(loaded_data)) 

{"name": "John", "age": 30, "city": "New York"} <class 'str'>
{'name': 'John', 'age': 30, 'city': 'New York'} <class 'dict'>


In [72]:
# Преобразование JSON строки в Python объект
json_string = '{"name": "John", "age": 30, "city": "New York"}'
data = json.loads(json_string)
data

{'name': 'John', 'age': 30, 'city': 'New York'}

In [73]:
# Преобразование Python объекта в JSON строку
data = {
    'name': 'John',
    'age': 30,
    'city': 'New York'
}
json_string = json.dumps(data)
json_string

'{"name": "John", "age": 30, "city": "New York"}'

In [74]:
# json по умолчанию "не дружит" с русскими текстами
print(json.dumps({"english text": "русский текст"}))

{"english text": "\u0440\u0443\u0441\u0441\u043a\u0438\u0439 \u0442\u0435\u043a\u0441\u0442"}


In [75]:
print(
    json.dumps(
        {"english text": "русский текст"}, 
        ensure_ascii=False) # флаг ensure_ascii дает ожидаемый вид текста
)  

{"english text": "русский текст"}


In [25]:
import json

data = {
    'name': 'John',
    'age': 30,
    'city': 'New York'
}

# Открываем JSON файл для записи
with open('file.json', 'w') as json_file:
    json.dump(data, json_file)

Имейте ввиду результат десериализации не всегда эквивалентен исходному объекту.

In [81]:
def check_code_decode_json(src):
    
    json_str = json.dumps(src)
    python_obj = json.loads(json_str)

    print('Исходный python объект:', repr(src))
    print('json строка при сериализации:', repr(json_str))
    print('python объект при десериализации', repr(python_obj))
    
    return src == python_obj

In [85]:
src = [1, 2, 3, {"4": 5, '6': 7}]
check_code_decode_json(src)

Исходный python объект: [1, 2, 3, {'4': 5, '6': 7}]
json строка при сериализации: '[1, 2, 3, {"4": 5, "6": 7}]'
python объект при десериализации [1, 2, 3, {'4': 5, '6': 7}]


True

In [86]:
# использование tuple
src = [(1, 2, 3)]
check_code_decode_json(src)

Исходный python объект: [(1, 2, 3)]
json строка при сериализации: '[[1, 2, 3]]'
python объект при десериализации [[1, 2, 3]]


False

In [87]:
# в json ключи приводятся к строке, а в неявном виде не десериализуется назад
src = [{4: 5, 6: 7}]
check_code_decode_json(src)

Исходный python объект: [{4: 5, 6: 7}]
json строка при сериализации: '[{"4": 5, "6": 7}]'
python объект при десериализации [{'4': 5, '6': 7}]


False

#### Dump и load

In [48]:
import json

data = {
    "firstName": "Jane",
    "lastName": "Doe",
    "hobbies": ["running", "sky diving", "singing"],
    "age": 35,
    "children": [
        {
            "firstName": "Alice",
            "age": 6
        },
        {
            "firstName": "Bob",
            "age": 8
        }
    ]
}

# Открываем JSON файл для записи
with open('file.json', 'w') as json_file:
    json.dump(data, json_file)

In [131]:
from pprint import pprint

with open('file.json') as f:
    data = json.load(f)

pprint(data) 

{'age': 35,
 'children': [{'age': 6, 'firstName': 'Alice'}, {'age': 8, 'firstName': 'Bob'}],
 'firstName': 'Jane',
 'hobbies': ['running', 'sky diving', 'singing'],
 'lastName': 'Doe'}


## Работа с csv

In [49]:
import csv

data = [
    ['Name', 'Age', 'City'],
    ['John', '30', 'New York'],
    ['Alice', '25', 'London'],
    ['Bob', '35', 'Paris']
]

# Открываем CSV файл для записи
with open('file.csv', 'w') as csv_file:
    csv_writer = csv.writer(csv_file)

    # Записываем строки в CSV файл
    for row in data:
        csv_writer.writerow(row)

In [50]:
import csv

# Открываем CSV файл для чтения
with open('file.csv', 'r') as csv_file:
    csv_reader = csv.reader(csv_file)

    # Читаем строки CSV файла
    for row in csv_reader:
        # row - список значений в текущей строке
        print(row)


['Name', 'Age', 'City']
['John', '30', 'New York']
['Alice', '25', 'London']
['Bob', '35', 'Paris']


In [111]:
with open('file.csv') as f:
    reader = csv.reader(f)
    print(list(reader))

[['Name', 'Age', 'City'], ['John', '30', 'New York'], ['Alice', '25', 'London'], ['Bob', '35', 'Paris']]


In [112]:
with open('file.csv') as f:
    reader = csv.reader(f)
    headers = next(reader)
    print('Headers: ', headers)
    for row in reader:
        print(row)

Headers:  ['Name', 'Age', 'City']
['John', '30', 'New York']
['Alice', '25', 'London']
['Bob', '35', 'Paris']


In [113]:
with open('file.csv') as f:
    reader = csv.DictReader(f)
    for row in reader:
        print(row)

{'Name': 'John', 'Age': '30', 'City': 'New York'}
{'Name': 'Alice', 'Age': '25', 'City': 'London'}
{'Name': 'Bob', 'Age': '35', 'City': 'Paris'}


In [114]:
with open('file.csv') as f:
    reader = csv.reader(f, delimiter=',')
    for row in reader:
        print(row)

['Name', 'Age', 'City']
['John', '30', 'New York']
['Alice', '25', 'London']
['Bob', '35', 'Paris']


In [27]:
a = [5,4,6]
a.sort()
print(a)

[4, 5, 6]
