# О типах файлов

Как правило, результатом эксперимента является файл с необработанными числовыми данными, записанными в некоторый файл или их набор. Наиболее распространёнными являются .txt, .dat, .csv и другие форматы. Каждый из них создавался для различного использования и имеет свои преимущества. Мы начнём работу с первых двух типов.<br>
.txt и .dat с точки зрения работы с ними в python не имеют различий, поэтому и говорим о них одновременно. Они способны хранить в себе любые символы в любом визуальном формате, так как поле ввода текста является буквально чистым листом, который заполняется как угодно. В этом и ззаключается простота с одной стороны, и сложность:<br>
1) Сам пользователь решает, как распологать данные и чем их делить
2) Призодится помнить то, что предыдущий пользователь (вы в прошлом) нарешали вытворить в этом файле и соответственно обработать его

В противопоставление им позже познакомимся с .csv форматом. Он имеет чёткую структуры таблицы с делением по озаглавленным столбцам и строкам. Стандартизация позволяет использовать одинаковые инструменты и сразу извлекать данные в удобном для обработки виде, но требует больших знаний этих инструментов

# .txt, .dat

## open-close

В изучаемом языке программирования работа с файлами должна начинаться с их открытия, а заканчиваться закрытием. Для этого существуют одноимённые функции `open('file_name', mode, ...)`, `.close()` <br>
Аргумент <i><mode</i> определяет что мы собираемся делать с файлом: открыть для чтения('r'), создать и записать начисто('w'), открыть и добавить текст('a') и другие. Режимов довольно много, мы ограничимся этими тремя<br>
Название файла может быть указано в двух вариантах: относительно текущего файла программы - относительный путь, полным путём к файлу - абсолютный путь. Начнём с первого

Предлагаю вам повторять все описанные действия самостоятельно, чтобы прочувствовать процесс и съэкономить свободное время <br>
Попробуем создать первый файл в той же папке, где хранится ваш .ipynb или .py файл

In [1]:
file = open('first_file.txt', mode='w')

При создании файла нужно указать его расширение, чтобы операционной системе было понятно, как с ним работать. Объект открытого файла сохранили в переменную <i>file</i>. Сейчас этот файл должен быть создан - проверьте<br>
Запишем какой-нибудь текст

In [2]:
text = 'Какой-нибудь текст'
file.write(text)
file.close()

Для записи применили метод `.write(text)` к ранее созданной переменной файла и закрыли его. Если захотите записать текст дважды, то увидете, что он добавляется в одну строку. Чтобы избежать этого добавим символ переноса строки `'\n'`

In [3]:
file = open('first_file.txt', mode='w')
text = 'Какой-нибудь текст\n'
file.write(text)
file.write(text)
file.write(text)
file.close()

Часто в качестве разделителя смысловых абзацев используют комбинацию `'\r\n'`, а для отступов знакомую нам табуляцию `'\t'`<br>
Раз мы умеем записывать файлы, то пришла очередь их считывать. Нетрудно догадаться, что для этого будем использовать режим 'r' и метод `.read()`

In [4]:
file = open('first_file.txt', mode='r')
print(file.read())
file.close()

Какой-нибудь текст
Какой-нибудь текст
Какой-нибудь текст



Что записывали, то и получили назад (кто-то ожидал иного?)<br>
Зная стремление программистов упростить себе жизнь, должны же они были придумать способ убрать необходимость постоянно закрывать за собой файлы - и он есть!

In [5]:
with open('first_file.txt', mode='r') as file:
    print(file.read())

Какой-нибудь текст
Какой-нибудь текст
Какой-нибудь текст



Конструкция <i>with</i> работает с рядом функций и способна корректно завершать работу с ними при выходе из её тела. Далее будем пользоваться только ею<br>
Теперь попробуем прочитать наш файл с помощью абсолютного пути. Зайдите в папку с файлом, скопируйте путь к ней из верхней строки проводника и вставьте перед названием файла со слешом. Понадобиться заменить все символы `'\\'` на `'\\ \\'` или `'/'`, иначе интерпритатор будет видеть спецсимволы вместо пути

In [6]:
with open('C:\\Users\\armix\\ProcessingData\\Module_2\\first_file.txt', mode='r') as file:
    print(file.read())

Какой-нибудь текст
Какой-нибудь текст
Какой-нибудь текст



Под конец части добавим к имеющемуся тексту что-нибудь ещё в режиме 'a' и выведем содержимое

In [7]:
with open('C:\\Users\\armix\\ProcessingData\\Module_2\\first_file.txt', mode='a') as file:
    file.write('\tЧто-нибудь ещё')
    
with open('C:\\Users\\armix\\ProcessingData\\Module_2\\first_file.txt', mode='r') as file:
    print(file.read())

Какой-нибудь текст
Какой-нибудь текст
Какой-нибудь текст
	Что-нибудь ещё


Старый текст остался на месте

## Сохранение и получение данных

В первую очередь стоит договориться о формате сохранения данных: скорее всего, будем иметь дело с более чем одной физической величиной или параметром, а значит, используемый контейнер должен соответсвовать нашей задаче. Словарь - хороший вариант. Ключами станут названия физических величин, а значениями - список из числовых данных<br>
Далее определимся с методом хранения. Логично разбить измерения физ. величин (далее ФВ) по столбцам с некоторым разделителем. Это может быть определённое число пробелов или спецсимвол. Пусть будет `;`

Сформируем некоторый словарь, который затем преобразуем в текст

In [8]:
data = {'Current': [1, 2, 3, 4],
        'Voltage': [0.1, 0.2, 0.3, 0.4]}

Логично, если количество измеренных значений совпадает у всех ФВ. Теперь нам нужно написать функцию, которая преобразует словарь в строку с разделением по строкам и столбцам, где столбец соответсвует отдельно взятой величине, а строка - одновременно измеренным значениям всех ФВ<br>
Первоя строка должна выглядеть так:

In [9]:
string_1 = 'Current;Voltage\n'

Сразу включим символ переноса строки. Как быть с данными? Формат файла не позволяет отдельно заполнять столбцы, но можем строки. На семинаре сформируем хранилище циклом построчно и внутрь него добавим цикл по элементам словаря, а сейчас сделаем это частично вречную:

In [10]:
for i in range(len(data['Current'])):
    string = f'{data['Current'][i]};{data['Voltage'][i]}\n'
    print(string)

1;0.1

2;0.2

3;0.3

4;0.4



Пойдём построчно:
1) Запустили цикл по индексам одного из списков, длину которого получили функцией `len(object)`
2) Создали переменную, в которую записываем данные в виде f-строки<br>

Осталось построчно записать всё это в файл, начнём!

In [11]:
def write_data(data: dict):
    """Сохранение данных в файл"""
    with open('data_file.dat', mode='a') as file:
        file.write(string_1)
        for i in range(len(data['Current'])):
            string = f'{data['Current'][i]};{data['Voltage'][i]}\n'
            file.write(string)

write_data(data)

Желающие могут попробовать применить <i>list comprehention</i> для оптимизации работы 

Теперь у нас есть файл для последующей работы. Зная разделитель и наличие заглавной строки, можно переходить к обратной операции - чтению из файла и формированию словаря<br>
Воспользуемся удобным методом построчного чтения `file.readlines()` или `file.readline()`, возвращающий одну строку:

In [12]:
with open('data_file.dat', mode='r') as file:
    for string in file.readlines():
        print(string.strip())

Current;Voltage
1;0.1
2;0.2
3;0.3
4;0.4


Так на каждой итерации будем иметь новую строку без необходимости заполнять память сразу всем файлом. Метод `str.strip()` Убирает лишние пробелы и спецсимволы по краям строки. <u>Вашей задачей будет сформировать функцию, принимающую путь к файлу и загружающую данные в словарь с ключами из первой строки</u>. А вот чтение значений мы сделаем здесь<br>
В первую очередь нам нужен файл без первой строки - удалим её вручную. Теперь подготовим словарь с созданными ключами

In [13]:
data_read = {'Current': [],
             'Voltage': []}

Читаем данные построчно и заполняем списки

In [15]:
with open('data_file.dat', mode='r') as file:
    for string in file.readlines():
        string = string.split(';')
        data_read['Current'].append(float(string[0]))
        data_read['Voltage'].append(float(string[1]))
        
data_read

{'Current': [1.0, 2.0, 3.0, 4.0], 'Voltage': [0.1, 0.2, 0.3, 0.4]}


1) Открыли файл
2) Запустили построчное чтение
3) Разбили строку по разделителям
4) Заполнили каждый из двух списков нужным числом<br>

Теперь умеем и сохранять словари в файл, и читать данные с сохранением в удобный тип данных

## numpy

В большой библиотеке `numpy`, о которой подробнее поговорим в третьем модуле, есть функции для работы c .txt файлами

In [16]:
import numpy as np

Традиционное сокращение названия при импорте

In [18]:
np.savetxt('file_name.txt', np.array([[1, 2, 3, 4], [1, 2, 3, 4], [1, 2, 3, 4]]).transpose(), delimiter=';', header='a, b, c')

Сохраняем массив в файл
1) Первым аргументом указываем путь и название файла
2) Массив чисел для сохранения. Используется нестандартный контейнер, которому передаём список со списками отдельных столбцов - поэтому требуется транспонирование. Если бы передовали список, внутри которого каждый список содержит элементы строки, то обошлись бы без дополнительного метода
3) Разделитель
4) Заголовок, чтобы понимать соответсвие физической величины и столбца

In [19]:
np.loadtxt('file_name.txt', delimiter=';', unpack=True)

array([[1., 2., 3., 4.],
       [1., 2., 3., 4.],
       [1., 2., 3., 4.]])

Загружаем массив из файла
1) Путь и название файла
2) Разделитель
3) Требуется ли распаковка массива в изначальный вид, то есть при значении <i>True</i> получим список со списками, содержащими столбцы. При <i>unpack-False</i> получим список со списками строк, как мы сохраняли данные выше

При таком методе придётся отдельно считывать первую строку с названиями столбцов