### Большая часть задач требует операций с файлами, поэтому для воспроизводимости результатов работы кода эти файлы нужно создавать

Ниже приведен блок, обязательный к исполнению, чтобы задания ниже были рабочими.

In [1]:
# импорт модулей, которые будут использоваться далее
import os, chardet, random
from shutil import copy


# Определим вспомогательные функции, которые далее будут использоваться в заданиях.
# Ф-ия проверки существования пути и его создания, при необходимости.
def check_path(target_path):
    
    if not os.path.exists(target_path):
        os.makedirs(target_path)


# Ф-ия проверки кодировки и перевода в Unicode
def my_decoder(val):
    
    if type(val) is unicode:
        return val
    else:
        return unicode(val, encoding=chardet.detect(val)['encoding'])


# Ф-ия генерации файлов и директорий для задания 2.1.
def generate_sample_files_and_dirs(target_path, file_cnt=10, copies_cnt=2, dir_cnt=5):
    
    """
    Функция генерации случайных файлов и директорий.
    Создает file_cnt+copies файлов и dir_cnt директорий.
    
    target_path - директория, где будут созданы случайные файлы;
    file_cnt - количество уникальных файлов;
    copies_cnt - количество копий файлов;
    dir_cnt - количество директорий.
    """
    
    # создаем target _path, если его нет
    check_path(target_path)
    # генерируем список случайных int'ов (будем использовать для длины случайной последовательности байт)
    length_list = [random.randint(100000, 1000000) for i in range(file_cnt)]
    # задаем последовательность [0-9][A-z] (необходима для генерации имен файлов)
    symbols = [chr(x) for x in range(ord('A'), ord('Z')+1)] +\
              [chr(x) for x in range(ord('a'), ord('z')+1)] +\
              map(str, range(10))
    # генерируем случайные списки имен файлов и директорий от 5 до 10 символов
    filenames_list = [''.join(random.sample(symbols, random.randint(5,10))) for i in range(file_cnt)]
    file_copies_list = [''.join(random.sample(symbols, random.randint(5,10))) for i in range(copies_cnt)]
    dirs_list = [''.join(random.sample(symbols, random.randint(5,10))) for i in range(dir_cnt)]
    # создаем файлы
    for filename, byte_length in zip(filenames_list, length_list):
        with open(os.path.join(target_path, filename), 'w') as f:
            f.write(os.urandom(byte_length))
    # создаем копии файлов
    for s_file, t_file in zip(random.sample(os.listdir(target_path), copies_cnt), file_copies_list):
        source_file = os.path.join(target_path, s_file)
        target_file = os.path.join(target_path, t_file)
        copy(source_file, target_file)
    # создаем директории
    for directory in dirs_list:
        check_path(os.path.join(target_path, directory))


        
# создадим рабочую директорию
tmp_dir_name = 'tmp_dir_for_4hw'
check_path(tmp_dir_name)

# и исходные файлы для заданий
#1.1
text = """123
4567
 8910
"""
with open(os.path.join(tmp_dir_name, 'task_1.1_source'), 'w') as f:
    f.write(text)

#1.2    
eng_lat = """apple - malum, pomum, popula
fruit - baca, bacca, popum
punishment - malum, multa
art - ars, artificium, sollertia, fabrica, professio
technique - ars
skill - peritia, ars, scientia, sollertia, queentia, hexis
"""
with open(os.path.join(tmp_dir_name, 'task_1.2_source'), 'w') as f:
    f.write(eng_lat)
    
#2.2
eng_rus = """heap - куча, ворох, груда, отвал, масса, множество
technique - техника, метод, способ, технические приемы
club - клуб, дубинка, булава, клюшка, трефы
mechanism - механизм, устройство, аппарат, техника
hockey-stick - клюшка
mountain - гора, куча, множество, масса
"""
with open(os.path.join(tmp_dir_name, 'task_2.2_source'), 'w') as f:
    f.write(eng_rus)

#3.2
text1 = """country
арбуз и дыня
asdE,45kl
sollertia
тест непечатного символа
"""
text2 = """countryman
Яблоко
фывА!
sollertia
тест непечатного символа\t
smth. else...
"""
with open(os.path.join(tmp_dir_name, 'task_3.2.1_source'), 'w') as f1, open(os.path.join(tmp_dir_name, 'task_3.2.2_source'), 'w') as f2:
    f1.write(text1)
    f2.write(text2)

In [2]:
!cat tmp_dir_for_4hw/task_1.1_source

123
4567
 8910


### Workaround для Windows

Ниже:

1) Приведен вывод аналога команды cat для Windows.

In [2]:
!type tmp_dir_for_4hw\task_1.1_source

123
4567
 8910


2) Определена функция print_cmd(), позволяющая кракозябры превратить в кириллицу.

In [3]:
def print_cmd(command_output, encoding='IBM866'):
    
    for line in command_output:
        # в этом if-е происходит замена абсолютного пути на относительный (маленький элемент паранойи) )))
        if 'C:\\' in line:
            line = line.upper()
            HIDE_PATH = slice(line.index('C:\\'), line.index('\\IPYTHON'.upper()))
            line = line.replace(line[HIDE_PATH], '.')
        print line.decode(encoding)

3) Приведен пример использования этой функции.

In [4]:
cmd1 = !dir tmp_dir_for_4hw
cmd2 = !tree tmp_dir_for_4hw

print_cmd(cmd1, chardet.detect('\n'.join(cmd1))['encoding'])
print '-' * 80
print_cmd(cmd2)

 Том в устройстве C не имеет метки.
 Серийный номер тома: 9045-F648

 Содержимое папки .\IPYTHON\TMP_DIR_FOR_4HW

10.06.2017  20:37    <DIR>          .
10.06.2017  20:37    <DIR>          ..
10.06.2017  20:37    <DIR>          go_more_deeper
10.06.2017  20:37    <DIR>          random_file_dir
10.06.2017  20:33                18 task_1.1_source
10.06.2017  20:33               216 task_1.2_source
10.06.2017  20:33               425 task_2.2_source
10.06.2017  20:33               103 task_3.2.1_source
10.06.2017  20:33               112 task_3.2.2_source
               5 файлов            874 байт
               4 папок   1 564 954 624 байт свободно
--------------------------------------------------------------------------------
Структура папок
Серийный номер тома: 9045-F648
.\IPYTHON\TMP_DIR_FOR_4HW
├───go_more_deeper
│   └───deepest_way
└───random_file_dir
    ├───s9KuhlXip
    └───sBJalMmi


# Базовый уровень

## Задание 1.1

Напишите функцию, копирующую файл

source_path должен существовать, а отсутствующие промежуточные папки из target_path должны быть созданы

Подсказка: можно прочитать исходный файл и записать в новый. 

Опциональное усложнение: попробуйте написать так, чтобы функция работала и с большими файлами (нужно, чтобы содежимое файла не считывалось полностью в память)

In [5]:
# Вариант №1. Подходит для относительно небольших файлов, т.к. содержимое файла полностью загружается в ОЗУ.
def copy_file(source_path, target_path):
    
    # выделим из target_path директорию
    dirname = os.path.split(target_path)[0]
    # создание dirname при необходимости
    check_path(dirname)
    # открытие соответствующих файлов на чтение/запись
    with open(source_path, 'r') as sf, open(target_path + '_copy', 'w') as tf:
        return tf.write(sf.read())
        

# Вариант №2. Предпочтительно использовать в случае обработки огромных файлов,
# т.к. в этом случае мы производим чтение построчно, и данные из файла занимают
# в памяти ровно столько, сколько "весит" текущая строка. Т.о. мы не испытываем
# дефицит ОЗУ при обработке больших файлов.
def copy_big_file(source_path, target_path):
    
    # выделим из target_path директорию
    dirname = os.path.split(target_path)[0]
    # создание dirname при необходимости
    check_path(dirname)
    # открытие соответствующих файлов на чтение/запись
    with open(source_path, 'r') as sf, open(target_path + '_bigcopy', 'w') as tf:
        return tf.writelines(sf.xreadlines())


s_path = os.path.join(tmp_dir_name, 'task_1.1_source')
t_path = os.path.join(tmp_dir_name, 'go_more_deeper', 'deepest_way', 'task_1.1_source')

copy_file(s_path, t_path)
copy_big_file(s_path, t_path)

In [6]:
!type tmp_dir_for_4hw\go_more_deeper\deepest_way\task_1.1_source_copy
print '-' * 5
!type tmp_dir_for_4hw\go_more_deeper\deepest_way\task_1.1_source_bigcopy

123
4567
 8910
-----
123
4567
 8910


In [None]:
!cat tmp_dir_for_4hw/go_more_deeper/deepest_way/task_1.1_source_copy
print '-' * 5
!cat tmp_dir_for_4hw/go_more_deeper/deepest_way/task_1.1_source_bigcopy

## Задание 1.2

##### В файле source_path находится англо-латинский словарь, то есть список слов на английском языке и их переводы на латинский язык (переводов может быть несколько). Необходимо создать из него латино-английский словарь по пути target_path. Например, из словаря



apple - malum, pomum, popula

fruit - baca, bacca, popum

punishment - malum, multa



##### нужно сделать словарь.

baca - fruit

bacca - fruit

malum - apple, punishment

multa - punishment

pomum - apple

popula - apple

popum - fruit

##### Не забудьте, что слова нужно расположить в алфавитном порядке.
##### Будет полезна функция strip у строки для удаления пробелов


In [7]:
# Определим функцию создания словаря на основе данных из исходного файла.
# Эта же функция нам понадобится в задании 2.2
def make_dict(source_file_path):
    
    trans_dict = {}
    with open(source_file_path, 'r') as sf:
        for line in sf.xreadlines():
            # для тогоб чтобы не думать о кодировках, переводим строки в Unicode
            line = my_decoder(line)
            source_word, translate_words = line.split(' - ')
            for word in translate_words.split(','):
                if word.strip() in trans_dict:
                    trans_dict[word.strip()] = ', '.join([trans_dict[word.strip()], source_word.strip()])
                else:
                    trans_dict[word.strip()] = source_word.strip()
    return trans_dict


def eng_lat_2_lat_eng(source_path, target_path):
    
    # выделим из target_path директорию
    dirname = os.path.split(target_path)[0]
    # создание dirname при необходимости
    check_path(dirname)
    # формирование Латинско-Английского словаря
    lat_eng_dict = make_dict(source_path)
    # запись данных в алфавитном порядке из полученного словаря в файл
    with open(target_path, 'w') as tf:
        lat_eng_lines = [
            ' - '.join([lat_word, lat_eng_dict[lat_word]]) + '\n'
            for lat_word in sorted(lat_eng_dict.keys())
        ]
        return tf.writelines(lat_eng_lines)


s_path = os.path.join(tmp_dir_name, 'task_1.2_source')
t_path = os.path.join(tmp_dir_name, 'go_more_deeper', 'task_1.2_Lat-Eng_dict')

eng_lat_2_lat_eng(s_path, t_path)

In [8]:
!type tmp_dir_for_4hw\go_more_deeper\task_1.2_Lat-Eng_dict

ars - art, technique, skill
artificium - art
baca - fruit
bacca - fruit
fabrica - art
hexis - skill
malum - apple, punishment
multa - punishment
peritia - skill
pomum - apple
popula - apple
popum - fruit
professio - art
queentia - skill
scientia - skill
sollertia - art, skill


In [None]:
!cat tmp_dir_for_4hw/go_more_deeper/task_1.2_Lat-Eng_dict

## Задание 1.3

Напишите функцию, вычисляющую длину русского слова, независимо от его кодировки

Если параметр encoding задан, то нужно декодировать текст при помощи этой кодировки. А если он не задан, то кодировку надо определить самостоятельно.

##### Если кодировка не задана, то точное решение здесь написать не получится. Но можно воспользоваться функцией my_decoder из лекции

In [9]:
def my_len(word, encoding=None):
    
    if encoding:
        return len(word.decode(encoding))
    else:
        return len(my_decoder(word))

In [10]:
my_len('текст') == 5

True

In [11]:
my_len(u'текст') == 5

True

In [12]:
my_len(u'ааааа'.encode('utf_16'), encoding='utf_16') == 5

True

In [13]:
my_len(u'текст'.encode('windows-1251')) == 5

True

# Продвинутый уровень

## Задание 2.1

Напишите функцию, которая выписывает список файлов в данной директории и сортирует их в соответствии с их размером. Функция должна получать путь к директории в качестве аргумента и печатать на экран имена всех файлов в ней и их размеры, причем первыми должны идти файлы с наибольшими размерами, а в случае одинакового размер файлы сортируются по алфавиту.

##### Указание. Изучите функции listdir и stat из модуля os и функции isfile и join из модуля os.path.


In [14]:
def get_dir_content_info(dir_path):
    
    files_list = [(filename, os.stat(os.path.join(dir_path, filename)).st_size)
                  for filename in os.listdir(dir_path)
                      if os.path.isfile(os.path.join(dir_path, filename))
                 ]
    for filename, size in sorted(files_list, reverse=True, key=lambda (x, y): y):
        print '{:<10}\t{}'.format(filename, size)


# создадим директорию с тестовым набором файлов
dir_path = os.path.join(tmp_dir_name, 'random_file_dir')
generate_sample_files_and_dirs(dir_path, 15, 3, 2)

get_dir_content_info(dir_path)

ICyupo    	989957
ki2IUXoHfE	955055
rN7ZWXJ   	955055
tOqbEVuX  	919697
G4sLp     	888605
I0bLhS5E4G	843995
jTpSZG0s  	799639
xVQdmiMZr 	714565
notrCIwDT 	690629
uSjsfMk   	690629
Cx8tYkO9F 	615312
UMqK2otvl 	577784
hIUT62u   	505823
9S5h1dIGr 	438521
g946znhKoX	438521
9hzf25mPQy	284996
jX4Tag85G 	261383
0oehO     	223596


##### Комментарий

Того же результата можно было добиться используя <b>os.path.isfile(path)</b> вместо <b>os.stat(path).st_size</b>

## Задание 2.2

Аналогично 1.2, но только теперь англо-русский в русско-английский словарь. Дополнительно теперь будет ещё параметр encoding для кодировки файлов. Если он None, то нужно самостоятельно определить кодировку файла.

##### Решение будет почти дублировать 1.2, но сначала текст нужно привести в unicode

##### Из словаря

heap - куча, ворох, груда, отвал, масса, множество

technique - техника, метод, способ, технические приемы

club - клуб, дубинка, булава, клюшка, трефы

mechanism - механизм, устройство, аппарат, техника

hockey-stick - клюшка

mountain - гора, куча, множество, масса

##### получим

аппарат - mechanism

булава - club

ворох - heap

гора - mountain

груда - heap

дубинка - club

клуб - club

клюшка - club, hockey-stick

куча - heap, mountain

масса - heap, mountain

метод - technique

механизм - mechanism

множество - heap, mountain

отвал - heap

способ - technique

техника - technique, mechanism

технические приемы - technique

трефы - club

устройство - mechanism


In [15]:
def eng_rus_2_rus_eng(source_path, target_path, encoding=None):
    
    # выделим из target_path директорию
    dirname = os.path.split(target_path)[0]
    # создание dirname при необходимости
    check_path(dirname)
    # формирование Русско-Английского словаря
    rus_eng_dict = make_dict(source_path)
    # если параметр encoding не задан, то определяем его исходя из кодировки исходного файла
    if not encoding:
        with open(source_path, 'r') as sf:
            # формируем тестовую строку для chardet из первых 3-х строк исходного файла
            lines = ''.join([sf.next() for i in range(3)])
        # определяем кодировку
        encoding = chardet.detect(lines)['encoding']
    # запись данных в алфавитном порядке из полученного словаря в файл
    with open(target_path, 'w') as tf:
        rus_eng_lines = [
            ' - '.join([rus_word, rus_eng_dict[rus_word]]).encode(encoding) + '\n'
            for rus_word in sorted(rus_eng_dict.keys())
        ]
        return tf.writelines(rus_eng_lines)


s_path = os.path.join(tmp_dir_name, 'task_2.2_source')
t_path1 = os.path.join(tmp_dir_name, 'go_more_deeper', 'task_2.2_Rus-Eng_dict1')
t_path2 = os.path.join(tmp_dir_name, 'go_more_deeper', 'task_2.2_Rus-Eng_dict2')

eng_rus_2_rus_eng(s_path, t_path1)
eng_rus_2_rus_eng(s_path, t_path2, encoding='windows-1251')

Для выходного файла <b>task_2.2_Rus-Eng_dict1</b> использовалась та же кодировка, что у файла источника - <b>utf-8</b>. По всей видимости утилита <b>type</b> не умеет распознавать эту кодировку, поэтому мы видим кракозябры.

In [16]:
!type tmp_dir_for_4hw\go_more_deeper\task_2.2_Rus-Eng_dict1

Р°РїРїР°СЂР°С‚ - mechanism
Р±СѓР»Р°РІР° - club
РІРѕСЂРѕС… - heap
РіРѕСЂР° - mountain
РіСЂСѓРґР° - heap
РґСѓР±РёРЅРєР° - club
РєР»СѓР± - club
РєР»СЋС€РєР° - club, hockey-stick
РєСѓС‡Р° - heap, mountain
РјР°СЃСЃР° - heap, mountain
РјРµС‚РѕРґ - technique
РјРµС…Р°РЅРёР·Рј - mechanism
РјРЅРѕР¶РµСЃС‚РІРѕ - heap, mountain
РѕС‚РІР°Р» - heap
СЃРїРѕСЃРѕР± - technique
С‚РµС…РЅРёРєР° - technique, mechanism
С‚РµС…РЅРёС‡РµСЃРєРёРµ РїСЂРёРµРјС‹ - technique
С‚СЂРµС„С‹ - club
СѓСЃС‚СЂРѕР№СЃС‚РІРѕ - mechanism


Используем хак, определенный в начале это Notebook'а.

In [17]:
cmd = !type tmp_dir_for_4hw\go_more_deeper\task_2.2_Rus-Eng_dict1
print_cmd(cmd, chardet.detect('\n'.join(cmd))['encoding'])

аппарат - mechanism
булава - club
ворох - heap
гора - mountain
груда - heap
дубинка - club
клуб - club
клюшка - club, hockey-stick
куча - heap, mountain
масса - heap, mountain
метод - technique
механизм - mechanism
множество - heap, mountain
отвал - heap
способ - technique
техника - technique, mechanism
технические приемы - technique
трефы - club
устройство - mechanism


Для выходного файла <b>task_2.2_Rus-Eng_dict2</b> использовалась нативная кодировка Windows, поэтому кириллица отобразилась корректно.

In [18]:
!type tmp_dir_for_4hw\go_more_deeper\task_2.2_Rus-Eng_dict2

аппарат - mechanism
булава - club
ворох - heap
гора - mountain
груда - heap
дубинка - club
клуб - club
клюшка - club, hockey-stick
куча - heap, mountain
масса - heap, mountain
метод - technique
механизм - mechanism
множество - heap, mountain
отвал - heap
способ - technique
техника - technique, mechanism
технические приемы - technique
трефы - club
устройство - mechanism


In [None]:
!cat tmp_dir_for_4hw/go_more_deeper/task_2.2_Rus-Eng_dict1

In [None]:
!cat tmp_dir_for_4hw/go_more_deeper/task_2.2_Rus-Eng_dict2

# Сложный уровень

## Задание 3.1

Существует исследование, говорящее о том, что в словах текста можно произвольно переставить буквы (не затрагивая первую и последнюю), и от этого читабельность текста практически не ухудшится. Напишите функцию для проверки этого факта. Ваша функция должна получать на вход какой-нибудь текст (может быть и на русском языке) и переставлять буквы в его словах случайным образом. 

Если seed None, то буквы переставляются не случайным образом, а сортируются по алфавиту (латинские символы считаем меньше кириллических). Если seed не None, то нужно использовать это seed при инициализации рандома. Сравните результаты.

##### будем считать, что текст это последовательность кириллических и латинских символов разделённая пробелом
##### вам потребуется модуль random и функции random.seed и random.shuffle
##### проверьте результат работы на не юникодовских строчках и объясните результат

In [19]:
def text_shuffle(text, seed=None):
    words = text.split()
    for i, word in enumerate(words):
        word_list = list(word)
        shuffle_part = list(word_list[1:-1])
        if seed:
            random.seed(seed)
            random.shuffle(shuffle_part)
        else:
            shuffle_part.sort()
        word_list[1:-1] = shuffle_part
        word = ''.join(word_list)
        words[i] = word
    text = ' '.join(words)
    return text

<b>Примеры Unicode-строк</b>

In [20]:
text1 = u'Читаемость имеет значение'
text2 = u'Beautiful is better than ugly'
text3 = u'abrАСadabra testing' # АС - кириллица

Вызов ф-ии <b>text_shuffle</b> с параметром <b>seed</b>. В первых двух случаях <b>seed</b> одинаковый, поэтому результат совпадает.

In [21]:
print '{}\t|\t{}\t|\t{}'.format(text_shuffle(text1, 3).encode('utf-8'), text_shuffle(text2, 3), text_shuffle(text3, 3).encode('utf-8'))
print '{}\t|\t{}\t|\t{}'.format(text_shuffle(text1, 3).encode('utf-8'), text_shuffle(text2, 3), text_shuffle(text3, 3).encode('utf-8'))
print '{}\t|\t{}\t|\t{}'.format(text_shuffle(text1, 2).encode('utf-8'), text_shuffle(text2, 2), text_shuffle(text3, 2).encode('utf-8'))

Чтмиосаеть иеемт зннеичае	|	Bfeiuutal is bteter tahn ulgy	|	aarbbdСraАa teintsg
Чтмиосаеть иеемт зннеичае	|	Bfeiuutal is bteter tahn ulgy	|	aarbbdСraАa teintsg
Чмтаеоисть имеет зчаенние	|	Btauieful is bteter than ugly	|	ardСАaabbra tsteing


Вызов ф-ии <b>text_shuffle</b> без параметра <b>seed</b>.

In [22]:
print '{}\t|\t{}\t|\t{}'.format(text_shuffle(text1).encode('utf-8'), text_shuffle(text2), text_shuffle(text3).encode('utf-8'))

Чаеимостть иеемт заеиннче	|	Baefituul is beettr tahn ugly	|	aaabbdrrАСa teinstg


Проверим как отработает функция, если на вход подать тип str, а не Unicode.

In [23]:
text4 = 'Читаемость имеет значение'
text5 = 'Beautiful is better than ugly'

print '{}\t|\t{}'.format(text_shuffle(text4), text_shuffle(text5))
print '{}\t|\t{}'.format(text_shuffle(text4, 5), text_shuffle(text5, 5))

Ё����������������ь е������т Ї������������ѵ	|	Baefituul is beettr tahn ugly
�Ѱ��и����ЧѼ���Ќ �им��е� �на��з�н�е�	|	Beauftuil is betetr than ugly


##### Комментарий

В случае использования юникодовский строк сортировка и перемешивание происходят посимвольно, а в случае байтовых последовательностей (тип str) - побайтово.

## Задание 3.2

Напишите функцию, которая читает два файла построчно (то есть не загружая всё содержимое в память), и записывает в выходной файл результат лексиграфического сравнение срочки из первого файла и из второго (First, Second и Equal по аналогии c предыдущим ДЗ).

##### Комментарий

Т.к. в задании явно не указано, должно ли быть сравнение регистрозависимым или нет, дополнительно реализовал флаг у функции.

In [24]:
def compare(x, y):
    
    if x < y:
        return 'First'
    elif x > y:
        return 'Second'
    else:
        return 'Equal'


def process(fst_source_path, snd_source_path, target_path, reg_flag=True):
    
    """
    Функция построчного лексиграфического сравнения файлов.
    Если reg_flag=True, то сравнение регистрозависимо, т.е. Z > a, Я > а и т.п.
    Если reg_flag=False, то сравнение происходит без учета регистра, т.е. Z < a, Я < а и т.п.
    """
    
    with open(fst_source_path, 'r') as f1,\
         open(snd_source_path, 'r') as f2,\
         open(target_path, 'w') as fr:
        for str1, str2 in zip(f1.xreadlines(), f2.xreadlines()):
            # переведем строки в Unicode и учтем значение флага
            if reg_flag:
                str1, str2 = my_decoder(str1.strip()), my_decoder(str2.strip())
            else:
                str1, str2 = my_decoder(str1.strip()).upper(), my_decoder(str2.strip()).upper()
            # посимвольное сравнение строк
            for s1, s2 in zip(list(str1), list(str2)):
                res = compare(ord(s1), ord(s2))
                if res != 'Equal':
                    break
            # если все символы одинаковы, то меньше слова с меньшим кол-ом символов
            if res == 'Equal':
                res = compare(len(str1), len(str2))
            # переводим строки обратно в последовательность байт
            str1, str2 = str1.encode('utf-8'), str2.encode('utf-8')
            print '"{}" _or_ "{}"\t=>\t{}'.format(str1, str2, res)
            fr.write(res + '\n')


s_path1 = os.path.join(tmp_dir_name, 'task_3.2.1_source')
s_path2 = os.path.join(tmp_dir_name, 'task_3.2.2_source')
t_path1 = os.path.join(tmp_dir_name, 'go_more_deeper', 'leksic_compare_result1')
t_path2 = os.path.join(tmp_dir_name, 'go_more_deeper', 'leksic_compare_result2')

# регистрозависимое сравнение
process(s_path1, s_path2, t_path1)
print '-' * 80
# сравнение без учета регистра
process(s_path1, s_path2, t_path2, reg_flag=False)

"country" _or_ "countryman"	=>	First
"арбуз и дыня" _or_ "Яблоко"	=>	Second
"asdE,45kl" _or_ "фывА!"	=>	First
"sollertia" _or_ "sollertia"	=>	Equal
"тест непечатного символа" _or_ "тест непечатного символа"	=>	Equal
--------------------------------------------------------------------------------
"COUNTRY" _or_ "COUNTRYMAN"	=>	First
"АРБУЗ И ДЫНЯ" _or_ "ЯБЛОКО"	=>	First
"ASDE,45KL" _or_ "ФЫВА!"	=>	First
"SOLLERTIA" _or_ "SOLLERTIA"	=>	Equal
"ТЕСТ НЕПЕЧАТНОГО СИМВОЛА" _or_ "ТЕСТ НЕПЕЧАТНОГО СИМВОЛА"	=>	Equal


<b><i>Проверим содержимое выходных файлов:

In [25]:
!type tmp_dir_for_4hw\go_more_deeper\leksic_compare_result1
print '-' * 5
!type tmp_dir_for_4hw\go_more_deeper\leksic_compare_result2

First
Second
First
Equal
Equal
-----
First
First
First
Equal
Equal


In [None]:
!cat tmp_dir_for_4hw/go_more_deeper/leksic_compare_result1
print '-' * 5
!cat tmp_dir_for_4hw/go_more_deeper/leksic_compare_result2