# 1. Чтение данных из файла

Часто для анализа необходимо загрузить данные, находящиеся во внешнем файле. Этот файл может быть простым текстовым документом, XML-документом или иметь любой другой пригодный для хранения данных формат. Для достижения этой цели Python предоставляет целый ряд разнообразных инструментов. Работа будет производиться в новой тетради IPython.

Самый простой способ прочитать данные из файла – использовать функцию open из стандартной библиотеки. Эта функция позволяет считать содержимое простого текстового файла. Информацию о том, какие аргументы принимает функция и какое значение возвращает можно найти в ```docstring``` этой функции. Чтобы прочитать ```docstring```, то есть строку документации по этой функции, необходимо набрать вопросительный знак и затем имя функции:

```?open```

В результате внизу появляется требуемое описание функции.

По данному тексту можно понять, что первый аргумент является обязательным и имеет смысл пути к файлу с данными (если файл лежит в рабочей директории, можно просто написать имя файла). Второй аргумент определяет режим, в котором требуется открыть файл. Существуют несколько основных режимов:
- r 	 - режим	чтения	(	режим	по умолчанию	)
- w 	 - режим	записи	(	данные из старого файла	стираются	)
- а 	 - режим	дозаписи	(	новые	данные будут	добавлены	в	конец файла )
- r+ 	 - режим	чтения	и	записи

Последний аргумент сейчас не представляет интереса. Функция возвращает объект-файл, с помощью которого будет происходить взаимодействие с файлом:

In [4]:
file_obj = open("example.txt","r")

Таким образом файл ```example.txt```, находящийся в рабочем каталоге, будет открыт только для чтения. С помощью метода read() можно вывести на экран все содержимое файла:

In [5]:
print (file_obj.read())

Привет мир!
Это новый файл!


Часто бывает удобно считывать файл не целиком. С помощью метода ```readline``` можно не считывать весь файл, а считать только несколько первых строк. При первом вызове метода будет возвращена первая строка, а при повторном – вторая. Также сначала нужно открыть файл для чтения заново.

In [6]:
file_obj = open("example.txt","r")
print(file_obj.readline())

Привет мир!



In [7]:
print(file_obj.readline())

Это новый файл!


In [8]:
print(file_obj.readline())




На самом деле пользоваться такими функциями совершенно не обязательно. С файлом можно работать как с обычным генератором. В следующем примере строчки файла выводятся с помощью цикла for:

In [24]:
file_obj = open("example.txt")
s ="" 
for line in file_obj:
    s+=line.strip()+'\n'

In [25]:
print(s)

Привет мир!
Это новый файл!



In [21]:
help(open)

Help on built-in function open in module io:

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)
    Open file and return a stream.  Raise OSError upon failure.
    
    file is either a text or byte string giving the name (and the path
    if the file isn't in the current working directory) of the file to
    be opened or an integer file descriptor of the file to be
    wrapped. (If a file descriptor is given, it is closed when the
    returned I/O object is closed, unless closefd is set to False.)
    
    mode is an optional string that specifies the mode in which the file
    is opened. It defaults to 'r' which means open for reading in text
    mode.  Other common values are 'w' for writing (truncating the file if
    it already exists), 'x' for creating and writing to a new file, and
    'a' for appending (which on some Unix systems, means that all writes
    append to the end of the file regardless of the current seek position

Функция strip() удаляет все пробелы в начале и конце строки, включая символы табуляции, новой строки и
так далее.

Бывает необходимым сохранить строки файла в виде списка. Это можно сделать с помощью конструктора списка list(), в качестве аргумента которого будет передан объект-файл. Поскольку объект-файл можно использовать как генератор, получившийся список будет содержать все строки файла.

In [119]:
file_obj = open("example.txt")
data_list = list(file_obj)
for line in data_list:
    print (line.strip())


Привет, мир!
тестовый файл
занятие по чтению данных из файла в Python


Другой способ состоит в использовании метода readlines() файл-объекта. Этот метод возвращает список из всех содержащихся в файле строк:

In [26]:
file_obj = open("example.txt")
data_list = file_obj.readlines()
for line in data_list: 
    print(line.strip())


Привет мир!
Это новый файл!


Оба способа дают одинаковый результат и можно выбрать любой из них.
После того, как работа с файлом закончена, файл нужно закрыть с помощью команды close(). Считается хорошим тоном закрывать файлы, работа с которыми закончена. Во-первых, так будут освобождены системные ресурсы, которые задействованы в работе с файлом. Во-вторых, после закрытия файла он не может быть по ошибке испорчен и, если он редактировался, изменения точно будут сохранены на диске. Если метод close() был вызван для открытого файла, попытка продолжить работу с ним приведет к возникновению ошибки.

In [27]:
file_obj = open('example.txt')
file_obj.close()
file_obj.read()

ValueError: I/O operation on closed file.

Файл, с которым производилась работа до этого момента, был в кодировке ANSCII. Однако часто бывает необходимым прочитать файл в другой кодировке, например UTF8. Эта кодировка соответствует русскоязычной кириллице. Если непосредственно использовать функцию ореn(), как это делалось раньше:

In [28]:
file_obj = open("example1.txt")
data_list = file_obj.readlines()
for line in data_list: 
    print(line.strip())

п»їРџСЂРёРІРµС‚, РјРёСЂ!
С‚РµСЃС‚РѕРІС‹Р№ С„Р°Р№Р»
Р·Р°РЅСЏС‚РёРµ РїРѕ С‡С‚РµРЅРёСЋ РґР°РЅРЅС‹С… РёР· С„Р°Р№Р»Р° РІ Python


Для того, чтобы корректно отобразить прочитанный файл, можно использовать библиотеку codecs. Импортирование библиотеки происходит с помощью ключевого слова import. После этого файл нужно прочитать функцией ореn(), которая определена в библиотеке codecs. Эта функция отличается тем, что в ней можно указать такие дополнительные параметры как кодировка файла.

In [23]:
import codecs
file_obj = codecs.open("example1.txt","r", encoding = "UTF8")
data_list = file_obj.readlines()
for line in data_list: 
    print(line.strip())


﻿Привет, мир!
тестовый файл
занятие по чтению данных из файла в Python


# 2.	Запись данных в файл

Сейчас мы подробно разбирем, как записать данные в файл средствами Python. Задача следующая – создать несколько текстовых строк и записать их в определенный файл.
С помощью стандартной функции open() необходимо открыть файл для записи:


In [40]:
file_obj = open('file_to_write_in.txt', '')

Таким образом файл file_to_write_in.txt в рабочем каталоге создается для записи. Если файл с таким именем существовал до этого, его содержимое теряется.
Теперь создадим переменную для строки, которую требуется записать в файл:

In [41]:
string = 'строка для записи в файл !!!! привет\n'

В конце строки набран символ перевода строки. Это делается для того, чтобы при записи нескольких строк в файл они располагались на разных строчках, а не склеивались в одну. Запись производится с помощью метода write, который в качестве аргумента принимает строку для записи в файл. После того, как нужные данные записаны, файл нужно обязательно закрыть с помощью метода close:

In [42]:
file_obj.write(string)
file_obj.close()

Если не закрыть файл, то очень легко его испортить. Хорошим тоном считается закрывать файлы сразу же, как только работа с ними прекращена.

In [43]:
file_obj = open("file_to_write_in.txt")
data_list = file_obj.readlines()
for line in data_list: 
    print(line.strip())

строка для записи в файл !!!! привет


Пусть теперь необходимо добавить к файлу еще одну строчку. Если открыть файл и записать вторую строку так, как это делалось раньше: 

In [143]:
file_obj = open('file_to_write_in.txt', 'w')
second_string = 'вторая строка для записи в файл\n' 
file_obj.write(second_string)
file_obj.close()

то окажется, что перед записью новой строки все содержимое файла было стерто.

В режиме "w", если файл уже существует, его содержимое перезаписывается новым. Чтобы добавить строчку к существующему файлу необходимо использовать режим "а":

In [144]:
# Запись 3 строки
file_obj = open('file_to_write_in.txt', 'a')
third_string = 'третья строка для записи в файл\n'
file_obj.write(third_string)
file_obj.close()


In [145]:
file_obj = open("file_to_write_in.txt")
data_list = file_obj.readlines()
for line in data_list: 
    print(line.strip())

вторая строка для записи в файл
третья строка для записи в файл


Часто необходимо записать сразу целый список строк в файл. Можно использовать цикл по списку из строк и записывать каждую с помощью функции write. Метод writelines позволяет сделать то же самое быстрее: достаточно просто передать в качестве первого аргумента список строк и он будет записан в файл.
В следующем примере файл будет открыт немного по-другому. С помощью конструкции with ... as ...
: удается избежать проблем с необходимость помнить о своевременном закрытии файла. Файл автоматически будет закрыт, как только весь код блока with будет выполнен.

In [146]:
digits = range(1,11)
with open("second_file_to_write_in.txt", "w") as file_obj:
    file_obj.writelines(digit + '\n' for digit in map(str, digits))


In [147]:
file_obj = open("second_file_to_write_in.txt")
data_list = file_obj.readlines()
for line in data_list: 
    print(line.strip())

1
2
3
4
5
6
7
8
9
10


Практическое задание написать программу реализующую:
    1. Создание 2-x массивов размерностью 5X5 из случайных чисел.
    2. Запись этих массивов в разные файлы.
    3. Чтение из файла записанных масивов и их перемножение.
    4. Записи и чтения результата перемножения в файл.