# Files and exceptions
<pre>
Для того чтобы открыть файл нужно:
* Указать его уникальное имя (имя каталога и имя файла);
* Указать режим доступа к файлу (чтение / запись).

Операция открытия файла создает объект “файл”. 
В следующем примере, переменная f ссылается на новый объект “файл”
</pre>

In [None]:
f = open("test.dat","w")
print f

<pre>
Функция <i>open</i> принимает два аргумента:
* имя файла;
* режим доступа. "w" указывает на то, что мы открыли файл на запись.

Если файл с заданным именем ("test.dat" в нашем примере) не существует на диске, он будет создан.
Если файл с заданным именем существует, то он будет перезаписан (заменен нашим).
Когда мы печатаем объект файла, мы видим имя файла, режим доступа к нему а также адрес местонахождения объекта в памяти.

Чтобы записать в файл данные, мы используется метод <i>write</i> объекта <i>файл</i>.
</pre>

In [None]:
f.write("Now is the time")
f.write("to close the file")

<pre>
Закрытие файла сообщает системе о том, что мы закончили запись в файл, что делает файл доступным для чтения из него:
</pre>

In [None]:
f.close()

<pre>
Теперь мы можем открыть файл снова, на этот раз дл ячтения из него, и прочитать содержимое файла в строку.
На этот раз режим доступа для чтения "r":
</pre>

In [None]:
f = open("test.dat","r")

<pre>
Если мы попытаемся открыть несуществующий файл, мы получим ошибку:
</pre>

In [None]:
f = open("test.cat","r")

<pre>
Метод <i>read</i> читает содержимое файла. 
Вызов метода <i>read</i> без аргументов приводит к тому, что вычитывается содержимое всего файла:
</pre>

In [None]:
text = f.read()
print text

<pre>
Обратите внимание, что между словами <i>time</i> и <i>to</i> нет пробела, так как мы его не записывали между строками в файл.

Метод <i>read</i> также может принимать аргумент, указывающий, сколько символов необходимо прочитать:
</pre>

In [None]:
f = open("test.dat","r")
print f.read(5)

<pre>
Если в файле осталось символов меньше, чем задано аргументом метода <i>read</i>, вернутся оставшиеся символы.
</pre>

In [None]:
print f.read(1000006)

<pre>
Когда будет достигнут конец файла, вернется пустая строка:
</pre>

In [None]:
print f.read()

<pre>
Следующая функция копирует файл, вычитывая и записывая по 50 символов за один раз.

Аргументы функции:
* Имя входного файла (source / input);
* Имя выходного файла (destination / output)
</pre>

In [None]:
def copyFile(oldFile, newFile):
    f1 = open(oldFile, "r")
    f2 = open(newFile, "w")
    while True:
        text = f1.read(50)
        if text == "":
            break
        f2.write(text)
    f1.close()
    f2.close()
    return

<pre>
Инструкция <i>break</i> приводит к выходу из цикла. Выполнение передается на инструкцию, следующую за циклом.

В данном примере цикл <i>while</i> бесконечный так как значение <i>True</i> всегда <i>true</i>. 
Выход из цикла возможен только при условии что строка <i>text</i> окажется пустой, а это возможно только в случае, когда будет достигнут конец файла.

В качестве упражнения используйте функцию <i>copyFile</i> для создания копии файла <i>test.dat</i> под названием <i>copy_of_test.dat</i>
</pre>


In [None]:
# Type your code here


# 1. Text files

<pre>
Текстовый файл - файл, содержащий печатные символы и пробелы, сгруппированные в строки, разделенные символами новой строки.

Python предоставляет легкие и изящные способы работы с текстовыми файлами.

Чтобы продемонстрировать это, создадим текстовый файл с тремя строками текста, разделенными символами новой строки:
</pre>

In [None]:
f = open("test.dat","w")
f.write("line one\nline two\nline three\n")
f.close()

<pre>
Метод <i>readline</i> вычитывает все символы до символа новой строки включительно:
</pre>

In [None]:
f = open("test.dat","r")
print f.readline()

<pre>
Метод <i>readlines</i> возвращает все оставшиеся строки в виде списка строк:
</pre>

In [None]:
print f.readlines()

<pre>
В данном случае вывод представлен в виде списка, означающем, что строки представлены в кавычках,
а символ новой строки представлен в виде '\n'.

По достижении конца файла метод <i>readline</i> возвращает пустую строку
а метод <i>readlines</i> возвращает пустой список:
</pre>

In [None]:
print f.readline()
print f.readlines()
f.close()

<pre>
Ниже представлен пример программы построчного процессинга файла.
<i>filterFile</i> создает копию <i>oldFile</i>,
пропуская строки, начинающиеся с "#":
</pre>

In [None]:
def filterFile(oldFile, newFile):
    f1 = open(oldFile, "r")
    f2 = open(newFile, "w")
    while True:
        text = f1.readline()
        if text == "":
            break
        if text[0] == '#':
            continue
        f2.write(text)
    f1.close()
    f2.close()
    return

<pre>
Инструкция <i>continue</i> прерывает текущую итерацию цикла, но цикл продолжается со следующей итерации.
Выполнение программы передается на начало цикла,
затем проверяется условие и и выполняется инструкция , соответсвующая результату условия.

Таким образом, если <i>text</i> является пустой строкой, цикл прекращается.
Если первый символ <i>text</i> является символом '#', управление передается на начало цикла для следующей итерации.
И только если оба условия не выполняются, мы копируем <i>text</i> в новый файл.

В качестве упражнения создайте файл и запишите в него следующие строки:

    First line
    # This line will be omitted
    # This line omitted too
    Second line
    
Используя функцию filterFile скопируйте созданный вами файл в другой и изучите его содержимое.
Содержимое результирующего файла должно представлять собой 

    First line
    Second line    
</pre>


In [None]:
# Type your code here


# 2. Writing variables

<pre>
Аргументом метода <i>write</i> должна быть строка, 
так что если вы хотите поместить в файл значения других типов, вы должны прежде конвертировать их строку.
Самый простой способ конвертации - это использовать <i>str</i> функцию.
</pre>

In [None]:
f = open("test.dat","w")
x = 52
f.write (str(x))

<pre>
В качестве альтернативы можно использовать оператор форматирования <i>%</i>.
В случяе применения к целым числам, <i>%</i> является оператором остатка от деления (modulus operator). 
В случае, когда првым операндом является строка, <i>%</i> становется оператором форматирования.

Первым операндом является строка, а вторым - котеж выражений (tuple).
Результатом является строка, содержащая значения выражений в формате, соответствующей формату строки.

Например, формат <i>%d</i> означает, что первым элементом кортежа должен быть представлен в виде числа.
Символ <i>d</i> обозначает <i>decimal</i> (десятичное):
</pre>

In [None]:
cars = 52
"%d" % cars

<pre>
Результатом будет строка <i>'52'</i>.
Форматтеры могут располагаться в любом месте строки,
то есть мы можем представить данное значение в форме:
</pre>

In [None]:
cars = 52
"In July we sold %d cars." % cars

<pre>
Следующий форматтер <i>%f</i> представляет следующий элемент в кортеже в качестве числа с плавающей точкой,
а следующий за ним форматтер <i>%s</i> представляет третий элемент кортежа в качестве строки:
</pre>

In [None]:
"In %d days we made %f million %s." % (34, 6.1, 'dollars')

<pre>
По умолчанию, числа с плавающей точкой представлены в виде 6 знаков после запятой.
Число выражений в кортеже должно соответствовать количеству форматтеров в строке.
Также, должны соответствовать типы форматтера и выражения:
</pre>

In [None]:
"%d %d %d" % (1,2) # Error

In [None]:
"%d" % "dollars" # Error

<pre>
Также, в форматтере можно указать количество отображаемых цифр:
</pre>

In [None]:
"%6d" % 62

In [None]:
"%12f" % 6.1

<pre>
Цифра после <i>%</i> определяет минимальное количество пробелов, которое будет занимать результирующее число.
Если число имеет меньше цифр, к нему добавляются пробелы в начало.
Если число в форматтере отрицательное, пробелы добавляются в конец числа:
</pre>

In [None]:
"%-6d" % 62

<pre>
Для чисел с плавающей точкой можно также указать количество значащих цифр после запятой:
</pre>

In [None]:
"%12.2f" % 6.1

<pre>
В качестве примера представим себе словарь, содержащий имена студентов в качестве ключа
и почасовую ставку в качестве значения.
Ниже представлен пример функции, отображающей содержимое словаря в отформатированном виде:
</pre>

In [None]:
def report (wages) :
    students = wages.keys()
    students.sort()
    for student in students :
        print "%-20s %12.2f" % (student, wages[student])
        #print("{:20s} {:12.2f}".format(student, wages[student]))

<pre>
Для демонстрации работы данной функции создадим небольшой словарь
и напечатаем его содержимое:
</pre>

In [None]:
wages = {'mary': 6.23, 'joe': 5.45, 'joshua': 4.25}
report (wages)

# 3 Directories
<pre>
При создании нового файла путем открытия его на запись,
новый файл создается в текущей директории (директории, в которой вы находитесь в данный момент и из которой запущена ваша программа).

Точно так же, когда вы открываете файл для чтения,
Python ищет его в текущей директории.

Если вы хотите открыть файл, который находится за пределами текущей директории,
вы должны указать полнуй путь к этому файлу,
который состоит из имени директории, где находится файл:
</pre>

In [None]:
f = open("/usr/share/dict/words","r")
print f.readline()
f.close()

# 4 Pickling
<pre>
Прежде чем поместить данные в файл их необходимо конвертировать в строки.
</pre>

In [None]:
f = open("test.dat", "w")
f.write (str(12.3))
f.write (str([1,2,3]))
f.close()

<pre>
Проблема возникает при вычитке значения обратно из файла вы получаете строку.
Исходный тип значения был утерян.
Также, нельзя сказать где заканчивается одно значение и начинается другое:
</pre>

In [None]:
f = open("test.dat", "r")
data = f.readline()
print data
f.close()

<pre>
Решением проблемы может быть запаковка данных (pickling).
Запаковка данных позволяет сохранить структуру данных.
Модуль <i>pickle</i> содержит все необходимые для этого методы.
</pre>

In [None]:
import pickle
f = open("test.pck","w")

<pre>
Чтобы сохранить структуру данных, используется метод <i>dump</i>:
</pre>

In [None]:
pickle.dump(12.3, f)
pickle.dump([1,2,3], f)
f.close()

<pre>
Затем, мы можем открыть файл для чтения и загрузить структуру данных, которую мы ранее задампировали:
</pre>

In [None]:
f = open("test.pck","r")
x = pickle.load(f)
print x, type(x)
y = pickle.load(f)
print y, type(y)

<pre>
Каждый раз при вызове метода <i>load</i> мы получаем одну запись из файла в соответствии с исходным значением.
</pre>

# 5. Exceptions

<pre>
Каждый раз при возникновении ошибки кидается исключение.
Зачастую, выполнение программы останавливается и Python печатает сообщение об ошибке.
Например,деление на ноль кидает исключение:
</pre>

In [None]:
print 55/0

<pre>
Так же как попытка обратиться к несуществующему элементу списка:
</pre>

In [None]:
a = []
print a[5]

<pre>
Или попытаться обратиться к словарю по несуществующему ключу:
</pre>

In [None]:
b = {}
print b["what"]

<pre>
Или попытаться открыть несуществующий файл на чтение:
</pre>

In [None]:
f = open("Idontexist", "r")

<pre>
В каждом из описанных случаев сообщение об ошибке состоит из двух частей:
 * Тип ошибки слева от двоеточия;
 * Описание ошики после двоеточия
 
В большинстве случаев Python также печатает стек вызовов, где возникло исключение.

Иногда нам может понадобиться выполнить операцию, которая может вызвать исключение,
но мы не хотим, чтобы программа прекращала свою работу.

Мы можем обрабатывать исключения, используя инструкции <i>try</i> и <i>except</i>.

Например, мы можем запросить у пользователя имя файла и, затем, попытаться открыть его на чтение.
Если файл с указанным именем не существует мы не хотим, чтобы программа завершалась аварийно;
мы хотим обработать исключение:
</pre>

In [None]:
filename = raw_input("Enter a file name: ")
try:
    f = open (filename, "r")
except IOError:
    print "There is no file named", filename

<pre>
Инструкция <i>try</i> выполняет инструкции в первом блоке.

Если исключение не взникнет, инструкция <i>except</i> будет проигнорирована.

Если возникнет исключение типа <i>IOError</i>, то будут выполнены инструкции блока <i>except</i> и, затем, программа продолжит свою работу.

Мы можем инкапсулировать эту возможность в тело функции:

<i>exists</i> принимает параметр <i>filename</i> и возвращает True если файл существует,
и False, если файл не существует:
</pre>

In [None]:
def exists(filename):
    try:
        f = open(filename)
        f.close()
        return True
    except IOError:
        return False

<pre>
Можно использовать несколько блоков <i>except</i> для обработки разных типов исключений.

Если программа обнаружила ошибку, возможно программно бросить исключение.

Ниже приведен пример программы, принимающей ввод от пользователя и сравнивающей его значение с числом 17.
Предположим, что 17 является невалидным значением в данной программе и программа кидает исключение:
</pre>

In [None]:
def input_number() :
    x = input ("Pick a number: ")
    if x == 17 :
        raise ValueError, "17 is a bad number"
    return x

<pre>
Инструкция <i>raise</i> принимает два аргумента:
* Тип исключения;
* Описание возникшей ошибки, которое увидит пользователь.

<i>ValueError</i> является одним из типов исключений Python для разных случаев.

Другим примером типа исключения являются <i>TypeError</i>, <i>KeyError</i>, <i>NotImplementedError</i> и другие.

Если функция, вызывающая <i>input_number</i> обрабатывает ошибки, то программа продолжит свою работу после ее вызова;
иначе, Python напечатает сообщение об ошибке и завершит работу программы:
</pre>

In [None]:
input_number()

<pre>
В качестве упражнения напишите функцию, которая использует <i>input_number</i> для ввода числа с клавиатуры 
и обрабатывает <i>ValueError</i> исключение.
</pre>

In [None]:
# Type your code here


# 6 Glossary

* file: A named entity, usually stored on a hard drive, floppy disk, or CD-ROM, that contains a stream of characters.
directory: A named collection of files, also called a folder.
* path: A sequence of directory names that specifies the exact location of a file.
* text file: A file that contains printable characters organized into lines separated by newline characters.
* break statement: A statement that causes the flow of execution to exit a loop.
* continue statement: A statement that causes the current iteration of a loop to end. The flow of execution goes to the top of the loop, evaluates the condition, and proceeds accordingly.
* format operator: The % operator takes a format string and a tuple of expres- sions and yields a string that includes the expressions, formatted according to the format string.
* format string: A string that contains printable characters and format sequences that indicate how to format values.
* format sequence: A sequence of characters beginning with % that indicates how to format a value.
* pickle: To write a data value in a file along with its type information so that it can be reconstituted later.
* exception: An error that occurs at runtime.
* handle: To prevent an exception from terminating a program using the try and except statements.
* raise: To signal an exception using the raise statement.