In [None]:
# ФАЙЛЫ 

# Открытие:  файловая_переменная = open(имя_файла, режим_доступа)
# файловая переменная – имя переменной, которая ссылается на файловый объект
# имя_файла – строковый литерал, задающий имя файла
# режим_доступа – строковый литерал, задающий режим доступа (чтение, запись, и т.д.), в котором файл будет открыт.

# режим чтения открывается по умолчанию

# РАСПОЛОЖЕНИЕ 
# Когда в функцию open() передается имя файла без указания пути, интерпретатор Python исходит из предположения, 
# что место расположения файла то же, что у исполняемой программы. 
# поэтому для точной работы требуется указывать точное положение файла: 
test_file = open('C:\\Users\\temp\\test.txt', 'w')

# при этом для экранирования можно использовать сырые строки: 
test_file = open(r'C:\Users\temp\test.txt', 'w')   # добавилась буква r в начале пути

# в задачах путь будет прописан через прямо слэш:
file1 = open(r'C:/Users/temp/test.txt')    # используем прямой слеш / (абсолютный путь)
file2 = open(r'temp/data.txt')             # используем прямой слеш / (относительный путь)

In [2]:
# хороший пример работы с сырыми строками:

path = 'C:\new\text.txt'
print(path)
print()

path = r'C:\new\text.txt'       # оцени разницу
print(path)

C:
ew	ext.txt

C:\new\text.txt


In [None]:
# кодировка 

file = open('info.txt', 'r')                    # если только латиница
file = open('info.txt', 'r', encoding='utf-8')  #  кодировка для чтения файлов на русском языке

In [3]:
# получить кодировку: 
file1 = open('students.txt', 'w')
file2 = open('customers.txt', 'w', encoding='utf-8')

print(file1.encoding)
print(file2.encoding)

file1.close()
file2.close()

UTF-8
utf-8


In [None]:
# закрытие файлов: 
# если файл изменялся, это позволит корректно его сохранить;
# если открытый файл потребуется другим программам, ваша программа может его блокировать;
# не стоит держать в памяти лишние, уже не нужные, данные;
# удалить открытый кем-то файл проблематично.

file = open('info.txt', 'r')    # открываем файл с именем info.txt для чтения

                                # работаем с содержимым файла info.txt

file.close()                    # закрываем файл после окончания работы

In [4]:
file1 = open('students.txt', 'w')
file2 = open('customers.txt', 'w')

file1.close()

print(file1.closed)     # вернет True
print(file2.closed)     # вернет False

file2.close()  

True
False


In [None]:
# Чтение файлов 
# read() – читает все содержимое файла;
# readline() – читает одну строку из файла;
# readlines() – читает все содержимое файла и возвращает список строк.

file = open('languages.txt', 'r', encoding='utf-8')

content = file.read()       # данные считаются в переменную контент в виде строки
# примерно так: 'Python\nJava\nJavascript\nC#\nC\nC++\nPHP\nR\nObjective-C'

# Метод readline()
# Файловый метод readline() считывает одну строку из файла (до символа конца строки '\n'), 
# при этом возвращается считанная строка вместе с символом '\n'. 
# Если считать строку не удалось – достигнут конец файла и больше строк в нем нет, возвращается пустая строка.
content = file.readline() 
# хрнаиться будет 'Python\n', причем убрать ненужный хвост можно при помощи line = line.rstrip()

# чтение всего содержимого удобно через цикл
file = open('languages.txt', 'r', encoding='utf-8')

for line in file:
    print(line.strip())
    
file.close()

# Метод readlines()
# Файловый метод readlines() считывает все строки из файла и возвращает список из всех считанных строк 
# (одна строка — один элемент списка). При этом, каждая строка в списке заканчивается символом переноса строки  '\n'
file = open('languages.txt', 'r', encoding='utf-8')

languages = [line.strip() for line in file.readlines()]  # удобно списочное выражение для исключения ненужных хвостов
file.close()

# при этом: Если передать в функцию list() ссылку на файловый объект list(file) , 
# получим тот же результат, что при вызове метода file.readlines()

# ПРИМЕЧАНИЕ : хочешь читать бинарный файл? добавляй 'b' к команде - open(file, 'rb') 
# для текстового аналогично: добавляй 't'

# Примечание 5. После того, как файл (file) открыт, можно получить различную относящуюся к нему информацию.
#  Три полезных атрибута (свойства): 
# file.closed	возвращает истину (True), если файл закрыт, иначе возвращает ложь (False)
# file.mode	возвращает режим доступа с помощью которого был открыт файл
# file.name	возвращает имя файла

# файлы лучше всего открывать в менеджере контекста. 
# это позволит избежать проблем в случае ошибок в процессе программы 
# + после выхода из блока менеджера файл закроется автоматически - не нужно будет закрывать его через close()
with open('languages.txt', 'r', encoding='utf-8') as file:
    for line in file:
        print(line)
                          # автоматическое закрытие файла
print('Файл закрыт')

# С помощью менеджера контекста можно работать с несколькими файлами.
with open('input.txt', 'r') as input_file, open('output.txt', 'w') as output_file:
    # обработка файлов

In [6]:
# Существуют специальные символы:
# \n – перемещает позицию печати на одну строку вниз;
#\r – перемещает позицию печати в крайнее левое положение строки.

print('aaaaaa\rbb')
print()
print('aaaaaa\nbb')

bbaaaa

aaaaaa
bb


In [14]:
# примеры: просто считать и распаковать содержимое

name= input()
file= open(name)
print(*[line.strip() for line in file.readlines()])
file.close()

Which of the following functions do you use to write data in the binary format? Python provides a wide range of built-in functions for file handling. It makes it really easy to create, update, read, and delete files. Open a File Remember! While specifying the exact path для указания внезапной остановки повествования; Иногда среднее тире называют коротким тире


In [13]:
# вывести предпоследнюю строку файла
name= input()
file= open(name)
print([line.strip() for line in file.readlines()][-2]) 
file.close()

для указания внезапной остановки повествования;


In [12]:
# вывести случайную строку
from random import choice
file= open('/Users/tony_builder/Downloads/lines.txt')
print(choice([line.strip() for line in file.readlines()])) 
file.close()

Python provides a wide range of built-in functions for file handling. It makes it really easy to create, update, read, and delete files.


In [15]:
# вывести сумму двух чисел

file= open('/Users/tony_builder/Downloads/numbers.txt')
print(sum([int(line.strip()) for line in file.readlines()])) 
file.close()

491000626


In [27]:
# Вам доступен текстовый файл nums.txt. В файле записано два целых числа, они могут быть разделены символами пробела и конца строки. 
# Напишите программу, выводящую на экран сумму этих чисел.

file= open('/Users/tony_builder/Downloads/nums.txt')

print(sum([int(line.strip()) for line in file.readlines() if line.strip().isdigit()])) 

file.close()


453491626


In [28]:
# Вам доступен текстовый файл prices.txt с информацией о заказе из интернет магазина. В нем каждая строка с помощью символа табуляции (\t) разделена на три колонки:
# наименование товара;
# количество товара (целое число);
# цена (в рублях) товара за 1 шт (целое число).
# Напишите программу, выводящую на экран общую стоимость заказа.

file= open('/Users/tony_builder/Downloads/prices.txt')
# print(sum([int(line.strip()) for line in file.readlines() if line.strip().isdigit()])) 
print(file.read())
file.close()


телефон	4	12500
бургер	1	500
курс	1	1400
подписка	40	9500
наушники	2	22450
телефон	2	2500
ноутбук	5	155000
диван	100	300



In [33]:
file= open('/Users/tony_builder/Downloads/prices.txt')
list_goods= [line.strip().split('\t') for line in file.readlines() ]

list_cost = list(map(lambda good: int(good[1])* int(good[2]) , list_goods))

print(list_cost)

print(sum(list_cost))

file.close()

[50000, 500, 1400, 380000, 44900, 5000, 775000, 30000]
1286800


In [None]:
# позиция в файле

# текущая позиция - курсор
# Вызов методов read(), readlines(), readline() перемещает текущую позицию туда, где завершилось чтение. 
# Для методов read() и readlines() это конец файла, для метода readline() – следующая строка после прочитанной.

# Для повторного чтения данных из файла, можно:
# 1)переоткрыть файл, тогда курсор снова попадёт в начало;
# 2) переместить курсор с помощью файлового метода seek().

# SEEK(): 
# Файловый метод seek() задаёт позицию курсора в БАЙТАХ от начала файла. 
# Чтобы перевести курсор в самое начало файла необходимо вызвать метод seek(), передав ему в качестве аргумента значение 0.

# Метод seek() не очень полезен при работе с текстовыми файлами, так как не учитывает разделение текста на строки. 
# А вот при работе с файлами в двоичном режиме умение работать с позицией и смещениями очень важно!

# В самом начале курсор (текущая позиция) равен нулю, после считывания первой строки, 
# курсор смещается на 8 байт (по байту на каждый из символов 'P', 'y', 't', 'h', 'o', 'n' 
# и два байта на символ перевода строки '\n')

# метод tell() - скажет, где сейчас курсор

In [34]:
with open('/Users/tony_builder/Downloads/input.txt', encoding='utf-8') as file:
    print('Repeat after me:', file.readline().strip())
    for line in file:
        print(line.strip() + '!')

Repeat after me: pop
goes!
the!
weasel!!


In [35]:
# вывести строку из файла задом наперед
with open('/Users/tony_builder/Downloads/text.txt', encoding='utf-8') as file:
    print(file.readline().strip()[::-1])

.enil hcae fo rettel tsrif eht tuo tnirp dna txt.egassem_terces daeR


In [38]:
# вывести все строки файла в обратном порядке
with open('/Users/tony_builder/Downloads/data.txt', encoding='utf-8') as file:
    print(*[line.strip() for line in file.readlines()][::-1], sep='\n')

Complex is better than complicated.
Simple is better than complex.
Explicit is better than implicit.
Beautiful is better than ugly.


In [47]:
# вывести только строки максимальной длины
with open('/Users/tony_builder/Downloads/lines (1).txt', encoding='utf-8') as file:
    lines_list= [line.strip() for line in file.readlines()]
    print(*[line for line in lines_list if len(line)== len(max(lines_list , key=lambda elem: len(elem)))], sep='\n')


believe in their..
Life is what 12345
better than ugly!!
Explicit is better


In [49]:
# вывести сумму чисел каждой строки

with open('/Users/tony_builder/Downloads/numbers (1).txt', encoding='utf-8') as file:
    print(*[sum([int(elem) for elem in line.strip().split() if elem.isdigit()]) for line in file.readlines()], sep='\n')

# для себя: 
# 1) создаем список из прочтенных линий 
# 2) в этом списке каждую линию разбиваем на список по пробелу (получатся некие списки, содержащие числа и пустые пробелы) 
# 3) убираем все лишние (в нашем случае это пробелы) условием - isdigit() 
# 4) берем от полученных подсписков сумму (для каждого подсписка) 
# 5) имеем в итоге список сумм каждой строки - распаковываем его

256
78
114
15
1089


In [68]:
# вывести сумму всего, что является целым неотрицательным числом

# воспомогательная функция - убирает все лишнее из строки, оставляя только числа так, 
# чтобы ПОСЛЕДОВАТЕЛЬНОСТЬ ЧИСЕЛ БЕЗ ПРОБЕЛА тоже считалась цельным числом
def except_trash(string):
    for elem in string:
        new_string= string
        if not elem.isdigit(): new_string=string.replace(elem, ' ')
        string=new_string
    return new_string


with open('/Users/tony_builder/Downloads/nums (1).txt', encoding='utf-8') as file:
    print(sum([sum([int(i) for i in except_trash(line).split()]) for line in file.readlines()]))

124410


In [87]:
# вывести число букв текста, число слов и число строк

with open('/Users/tony_builder/Downloads/file.txt', encoding='utf-8') as file:
    list_lines= [line.strip() for line in file.readlines()]
    file.seek(0)
    num_letters= len([al for al in list(file.read().strip().replace(' ','')) if al.isalpha()])
    file.seek(0)
    # ниже строка - если нужны ТОЛЬКО слова
    #num_words= sum([len([word for word in [elem.strip('.,;:-?!') for elem in line.split()] if word.isalpha()]) for line in list_lines])
   
# а в эту переменную входят даже цифры - словом считается последовательность непробельных символов   
    num_words= sum([len([elem.strip('.,;:-?!') for elem in line.split()]) for line in list_lines])
    file.seek(0)
    num_lines = len(file.readlines())
    print(f'Input file contains:\n{num_letters} letters\n{num_words} words\n{num_lines} lines')

Input file contains:
1069 letters
229 words
12 lines


In [88]:
# вывести три пары случайных Имя+фамилия из двух файлов

with open('/Users/tony_builder/Downloads/first_names.txt', encoding='utf-8')  as fn, open('/Users/tony_builder/Downloads/last_names.txt', encoding='utf-8') as ln:
    names=[line.strip() for line in fn.readlines()]
    surnames= [line.strip() for line in ln.readlines()]
    from random import choice
    print(*[f'{choice(names)} {choice(surnames)}' for _ in range(3)], sep='\n')




Dave Roller
Fredric Trahan
Enoch Swank


In [96]:
# вывести названия всех стран, чья численность больше 500 000 и название страны начинается на G

with open('/Users/tony_builder/Downloads/population.txt', encoding='utf-8') as file:
    list_lines= [line.strip() for line in file.readlines()]
    print(*[line.split('\t')[0]  for line in list_lines if int(line.split('\t')[1])>500000 and line.split('\t')[0][0]=='G'] , sep='\n')



Germany
Ghana
Guatemala
Greece
Guinea
Georgia
Guinea-Bissau
Gabon
Guyana


In [109]:
# прочитать csv файл так, чтобы первая строка стала названиями ключей, а все последующие строки - значениями ключей 
# в итоге на выходе должен быть список словарей 
# ниже сомтри разложено как это выглядит пошагово

def read_csv():
    with open('/Users/tony_builder/Downloads/data.csv', encoding='utf-8') as file:
        num_lines= len(file.readlines())                        # считаем число строк файла
        file.seek(0)                                            # возвращаемся на исходную в файле
        keys= file.readline().strip().split(',')                # собираем ключи из первой строки файла
        list_dictionaries=[]                                    # создаем пустой список под словари
        
        for _ in range (num_lines):                             # цикл для всех строк, начиная со второй

            one_dict= dict(zip(keys, file.readline().strip().split(',')))   # сшиваем в словарь ключи и значения строк
            list_dictionaries.append(one_dict)                              # цепляем его в список
            one_dict={}                                                     # обнуляем словарь

    return list_dictionaries[:-1]                               # убираем поганый хвост в конце (считает пробел к словарю)

In [108]:
with open('/Users/tony_builder/Downloads/data.csv', encoding='utf-8') as file:
    num_lines= len(file.readlines())                        # считаем число строк файла
    file.seek(0)                                            # возвращаемся на исходную в файле
    keys= file.readline().strip().split(',')                # собираем ключи из первой строки файла
    list_dictionaries=[]
    for _ in range (num_lines): 
        one_dict= dict(zip(keys, file.readline().strip().split(',')))
        list_dictionaries.append(one_dict)
        one_dict={}

print(list_dictionaries[:-1])

[{'policyID': '119736', 'statecode': 'FL', 'county': 'CLAY COUNTY', 'eq_site_limit': '498960', 'hu_site_limit': '498960', 'fl_site_limit': '498960', 'fr_site_limit': '498960', 'tiv_2011': '498960', 'tiv_2012': '792148.9', 'eq_site_deductible': '0', 'hu_site_deductible': '9979.2', 'fl_site_deductible': '0', 'fr_site_deductible': '0', 'point_latitude': '30.102261', 'point_longitude': '-81.711777', 'line': 'Residential', 'construction': 'Masonry', 'point_granularity': '1'}, {'policyID': '448094', 'statecode': 'FL', 'county': 'CLAY COUNTY', 'eq_site_limit': '1322376.3', 'hu_site_limit': '1322376.3', 'fl_site_limit': '1322376.3', 'fr_site_limit': '1322376.3', 'tiv_2011': '1322376.3', 'tiv_2012': '1438163.57', 'eq_site_deductible': '0', 'hu_site_deductible': '0', 'fl_site_deductible': '0', 'fr_site_deductible': '0', 'point_latitude': '30.063936', 'point_longitude': '-81.707664', 'line': 'Residential', 'construction': 'Masonry', 'point_granularity': '3'}, {'policyID': '206893', 'statecode': '

In [102]:
with open('/Users/tony_builder/Downloads/data.csv', encoding='utf-8') as file:
    keys= file.readline().strip().split(',')
    values= [line.strip() for line in file.readlines()] 
print(keys)
print()
print(values)

['policyID', 'statecode', 'county', 'eq_site_limit', 'hu_site_limit', 'fl_site_limit', 'fr_site_limit', 'tiv_2011', 'tiv_2012', 'eq_site_deductible', 'hu_site_deductible', 'fl_site_deductible', 'fr_site_deductible', 'point_latitude', 'point_longitude', 'line', 'construction', 'point_granularity']

['119736,FL,CLAY COUNTY,498960,498960,498960,498960,498960,792148.9,0,9979.2,0,0,30.102261,-81.711777,Residential,Masonry,1', '448094,FL,CLAY COUNTY,1322376.3,1322376.3,1322376.3,1322376.3,1322376.3,1438163.57,0,0,0,0,30.063936,-81.707664,Residential,Masonry,3', '206893,FL,CLAY COUNTY,190724.4,190724.4,190724.4,190724.4,190724.4,192476.78,0,0,0,0,30.089579,-81.700455,Residential,Wood,1', '333743,FL,CLAY COUNTY,0,79520.76,0,0,79520.76,86854.48,0,0,0,0,30.063236,-81.707703,Residential,Wood,3', '172534,FL,CLAY COUNTY,0,254281.5,0,254281.5,254281.5,246144.49,0,0,0,0,30.060614,-81.702675,Residential,Wood,1', '785275,FL,CLAY COUNTY,0,515035.62,0,0,515035.62,884419.17,0,0,0,0,30.063236,-81.707703,Re

In [99]:
# прочитал вложенный файл, чтобы понять что там внутри, как структурировано

import pandas as pd
print(pd.read_csv('https://stepik.org/media/attachments/lesson/530408/data.csv'))

   policyID statecode       county  eq_site_limit  hu_site_limit  \
0    119736        FL  CLAY COUNTY       498960.0      498960.00   
1    448094        FL  CLAY COUNTY      1322376.3     1322376.30   
2    206893        FL  CLAY COUNTY       190724.4      190724.40   
3    333743        FL  CLAY COUNTY            0.0       79520.76   
4    172534        FL  CLAY COUNTY            0.0      254281.50   
5    785275        FL  CLAY COUNTY            0.0      515035.62   
6    995932        FL  CLAY COUNTY            0.0    19260000.00   
7    223488        FL  CLAY COUNTY       328500.0      328500.00   
8    433512        FL  CLAY COUNTY       315000.0      315000.00   
9    142071        FL  CLAY COUNTY       705600.0      705600.00   

   fl_site_limit  fr_site_limit     tiv_2011     tiv_2012  eq_site_deductible  \
0       498960.0       498960.0    498960.00    792148.90                   0   
1      1322376.3      1322376.3   1322376.30   1438163.57                   0   
2       

In [None]:
# ЗАПИСЬ в ФАЙЛ

# 'w' - Открыть файл для записи. Если файл уже существует, то стереть его содержимое. Если файл не существует, он будет создан.
# 'a' - Открыть файл для записи. Все записываемые в файл данные будут добавлены в его конец. Если файл не существует, то он будет создан.
# 'r+' - Открыть файл для чтения и записи. В этом режиме происходит частичная перезапись содержимого файла с самого начала.
# 'x' -	Создать новый файл. Если файл уже существует, произойдет ошибка.  

# короче говоря, важно, КАК ты открыл файл - см ниже

In [113]:
# исходный текст файла
with open('/Users/tony_builder/Downloads/myfile_исходный.txt', 'r', encoding='utf-8') as file:
    print(*[line.strip() for line in file.readlines()] , sep='\n')

First line of the file.
Second line of the file.
Third line of the file.


Яндекс тестовое задание

In [14]:
with open('input.txt', 'r') as input_file:
	for line in input_file:
		a,b = line.split()

with open('output1.txt', 'w') as output_file:
	output_file.write(str(int(a)+int(b)))
print(str(int(a)+int(b)))


8


In [110]:
# это перезапишет файл (сотрет содержимое, запишет новое)
with open('/Users/tony_builder/Downloads/myfile.txt', 'w', encoding='utf-8') as file:
    file.write('Python and beegeek forever\n')
    file.write('We love stepik <3')

with open('/Users/tony_builder/Downloads/myfile.txt', 'r', encoding='utf-8') as file:
    print(*[line.strip() for line in file.readlines()] , sep='\n')

Python and beegeek forever
We love stepik <3


In [111]:
# это добавит строки в конец файла и перезапишет его
with open('/Users/tony_builder/Downloads/myfile.txt', 'a', encoding='utf-8') as file:
    file.write('Python and beegeek forever\n')
    file.write('We love stepik <3')

with open('/Users/tony_builder/Downloads/myfile.txt', 'r', encoding='utf-8') as file:
    print(*[line.strip() for line in file.readlines()] , sep='\n')

First line of the file.
Second line of the file.
Third line of the file.Python and beegeek forever
We love stepik <3


In [112]:
# это частично перезапишет файл (интересно)
with open('/Users/tony_builder/Downloads/myfile.txt', 'r+', encoding='utf-8') as file:
    file.write('Python and beegeek forever\n')
    file.write('We love stepik <3')

with open('/Users/tony_builder/Downloads/myfile.txt', 'r', encoding='utf-8') as file:
    print(*[line.strip() for line in file.readlines()] , sep='\n')

Python and beegeek forever
We love stepik <3ile.
Third line of the file.


In [1]:
# Работа с writelines()


# этот код создаст файл в корневую папку питона и запишет в него строки из списка
philosophers = ['Джoн Локк\n', 'Дэвид Хьюм\n', 'Эдмyнд Берк\n']

with open('philosophers.txt', 'w', encoding='utf-8') as file:
    file.writelines(philosophers)

In [4]:
# запись через print(чтозаписываем, file=output) - передаем аргумент file, получаем запись в файл

with open('philosophers_2.txt', 'w', encoding='utf-8') as output:
    print('Джoн Локк', file=output)
    print('Дэвид Хьюм', file=output)
    print('Эдмyнд Берк', file=output)

# обрати внимание, что print уже содержит перенос на новую строку по умолчанию

with open('philosophers_2.txt', 'r', encoding='utf-8') as output:
    print(*[line.strip() for line in output.readlines()] , sep='\n')

Джoн Локк
Дэвид Хьюм
Эдмyнд Берк


In [6]:
# практикуемся - записать в файл 25 разных чисел

with open('random.txt', 'w') as file:
    from random import randint
    file.writelines([f'{str(randint(111,777))}\n' for _ in range(25)])

In [18]:
# взять существуюшщий файл input и из него создать файл output - такой, что все строчки будут пронумерованы

with open('/Users/tony_builder/Downloads/input (1).txt', 'r') as start, open('output.txt', 'w') as res:
    list_lines= [line.strip() for line in start.readlines()]
    new_list= [f'{elem[0]}) {elem[1]}' for elem in list(enumerate(list_lines, 1))]
    # что сделали? создали новый список, в котором каждая строка превратилась в кортеж вида [(1, строка1), (2, строка2)...]
    # потом мы сразу перезаписали этот список в вид "первый элемент кортежа(номер) + скобка + второй элемент кортежа(строка)"
    
    res.writelines([f'{string}\n' for string in new_list])  # не забываем записать строку с переводом на след строку
    


In [3]:
# взять существующий файл с оценками и переписать его в новый, прибавив к каждой оценке от 0 до 5 баллов 
# чтобы максимум было 100 баллов

with open('/Users/tony_builder/Downloads/class_scores.txt', 'r') as first, open('new_scores.txt', 'w') as result:
    # cоздаем список списков строк по типу [[ученик, оценка], ...]
    list_lines= [line.strip().split() for line in first.readlines()]  

    # записываем новые строки так, что увеличиваем на 5 ТОЛЬКО те оценки, которые меньше 95 
    # - для это используем стандартный кортеж вида (a, b)[False/ True] с индексами выбора 0/1 
    new_lines = [f'{elem[0]} {(str(int(elem[1])+5),str(100))[int(elem[1])>95]}\n' for elem in list_lines]


    # убираем из последней строки перевод на новую строку
    new_lines[-1] = new_lines[-1][:-1] 
    result.writelines(new_lines) 

# логика в общем вся та же, что в задаче выше

with open('/Users/tony_builder/Downloads/class_scores.txt', 'r', encoding='utf-8') as one :
    print(*[line.strip() for line in one.readlines()] , sep='\n')

Гуев 100
Маргиев 99
Чаниев 95
Тепсикоев 94
Левитский 80
Габолаев 0
Хлюстова 10
Гергиева 85


In [12]:
# задача Жака Фреско 
# "Были разноцветные козлы. Сколько?"
# "Сколько чего?"
# "Сколько из них составляет более 7% от общего количества козлов?"

# или: записать в файл (лексикограф порядок) только тех козлов, число которых больше, чем 7% от всех козлов в списке 


with open('/Users/tony_builder/Downloads/goats.txt', 'r') as all_goats, open('answer.txt', 'w') as res_goats:
    # собираем названия козлов разных цветов из верхней части списка
    all_goats.readline()
    goats_specifies= []
    line= all_goats.readline()
    while line.strip()!= 'GOATS':
        goats_specifies.append(line.strip())
        line= all_goats.readline()
    
    # все остальные козлы, которых нам предстоит считать
    mass_goats = [line.strip() for line in all_goats.readlines()]

    # считаем всех козлов и записываем их в словарь, где ключи - цвета козлов, а значения - их количество
    num_goats = {}
    for goat in mass_goats:
        num_goats[goat] = num_goats.get(goat, 0) + 1

    # собираем в список тех козлов, количество которых больше 7% от общего числа
    only_true_goats=[]
    for item in num_goats.items():                          # запускаем цикл по кортежам вида (ключ, значение)
        if item[1]> 0.07* sum(list(num_goats.values())):    # если количество больше, чем 7% от общего числа - записываем его
            only_true_goats.append(item[0])


    # записываем отсортированный список козлов-победителей))
    res_goats.writelines([f'{elem}\n' for elem in sorted(only_true_goats)])




    

In [10]:
# конкатенация файлов:
# нужно собрать содержимое текстовых файлов в новый файл output.txt 
# файлы лежат в той же папке, их имена подаются с клавиатуры N-раз (каждое на новой строке)

file_names = [input() for _ in range(int(input()))]     # все имена файлов

with open('output.txt', 'w') as conc_f:
    new_lines=[]
    for name in file_names:
        with open(name, 'r') as temp:
            # conc_f.write(f'{name}\n')
            new_lines.extend([f'{line.strip()}\n' for line in temp.readlines()])
    
    new_lines[-1] = new_lines[-1][:-1] 
    conc_f.writelines(new_lines)

# это решение отличное! выводит все содержимое файлов , переходя со строчки на строчку через \n 
# но задача требует другое решение - просто дозапись. и это отвратительно выглядит - см решение ниже

In [12]:
file_names = [input() for _ in range(int(input()))]     # все имена файлов

with open('output.txt', 'w') as conc_f:
    new_lines=[]
    for name in file_names:
        with open(name, 'r') as temp:
            # conc_f.write(f'{name}\n')
            new_lines.extend(temp.readlines())
    conc_f.writelines(new_lines)

In [13]:
# лог файл - есть файл с именами пользователей и временем их входа и выхода с сайта 
# нужно собрать в отдельный файл тех, кто был в сети не менее часа 

# вспомогательная функция разбиения строчки со временем входа и выхода + вычисления разницы во времени
def timing(string):
    time_in= [int(i) for i in string.split(',')[1].split(':')]    # вернет время входа в формате [hour, minute]
    time_out= [int(i) for i in string.split(',')[2].split(':')]   # вернет время входа в формате [hour, minute]
    # два случая для времени входа и выхода: 
    # 1) когда в одни сутки вход и выход 
    # 2) когда вошел в одни сутки, а вышел в следующие
    if time_out[0]>= time_in[0]: res_time= (time_out[0]- time_in[0])*60 + (time_out[1]- time_in[1])
    else: res_time= (time_out[0]+24 - time_in[0])*60 + (time_out[1]- time_in[1])
    return res_time                                                                 # вернет время нахождения

with open('/Users/tony_builder/Downloads/logfile.txt', 'r') as log, open('output.txt', 'w') as res_users:
    all_users=[line.strip() for line in log.readlines()]
    only_more_hour_users= [user.split(',')[0] for user in all_users if timing(user)>=60]  # берем только тех, у кого больше 60 минут
    
    res_users.writelines([f'{user}\n' for user in only_more_hour_users])

In [None]:
# чтобы осталось в памяти 
# есть список студентов, нужно вывести число тех, кто набрал нужное число баллов по каждому предмету
# https://stepik.org/lesson/448983/step/3?unit=511577  - тут можно скачать файл и прочитать задание

with open('grades.txt', 'r') as file:
    all_students=[line.strip().split() for line in file.readlines()]
    only_good_students =[student[0] for student in all_students if all(map(lambda x:int(x)>=65, student[1:]))]
    print(len(only_good_students))

In [None]:
# найти самые длинные слова в текстовом файле, даже если они содержат знаки препинания или цифры (отстой, но что делать)

with open('words.txt', 'r') as file:
    list_words= file.read().strip().split()
    print(*[word for word in list_words if len(word)== max(map(lambda x:len(x), list_words))], sep='\n')


In [15]:
# вспомогательный код - чтобы не забывать, как собрать все слова из текстового файла в список
#  (но не убирая ни знаки препинания, ни цифры - они прижмутся к своим словам)
with open('output.txt', 'r') as file:
    list_words= file.read().strip().split()

    print(list_words)
    

['Тимур', 'Гуев', 'Роман', 'Гацалов', 'Габолаев', 'Георгий', 'Гергиева', 'Светлана', 'Гуева', 'Лариса', 'Засеев', 'Ирбек', 'Гуева', 'Лиза', 'Харисов', 'Артур', 'Янченко', 'Роман']


In [None]:
# вывести на экран последние 10 строк файла (каждую с новой строки) 
# + на подумать - как вывести их, не считывая ВЕСЬ файл в оперативку компьютера

# решение со считыванием файла в кубышку
with open(input(), 'r') as file:
    list_str=[line.strip() for line in file.readlines()]
    print(('\n'.join(list_str), '\n'.join(list_str[-10:]))[len(list_str)>10])


In [22]:
# вспомогательный код 

list_str=['a','a','a','a','a','a','a','a','a']#, 'b','b','b','b']

print(('\n'.join(list_str), '\n'.join(list_str[-10:]))[len(list_str)>10])

a
a
a
a
a
a
a
a
a


In [None]:
# уже интереснее - заменить ВСЕ запрещенные слова в любом виде (строчные, заглавные, смешанные, встречаются внутри другого слова)
# чем заменить? - звездочками (их количество = количеству букв в запрещенном слове)
# итак, имя файла для замены подается с клавиатуры (пусть будет file_ch) - нужно вывести его содержимое уже с заменой непотребства

with open('/Users/tony_builder/Downloads/forbidden_words.txt', 'r') as forb, open('/Users/tony_builder/Downloads/data (1).txt', 'r') as file_ch: 
    stop_words= forb.read().strip().split()     # здесь храним все слова, которые нужно заменить
    my_file_words = [line.strip().split() for line in file_ch.readlines()]      
    # собрали список списков слов из файла, где каждый подсписок - бывшая строка

    for bad_word in stop_words:                 # для каждого запрещенного слова 
        for string_list in my_file_words:           # для каждой строки в файле
            for i in range(len(string_list)):           # для каждого слова в строке делаем проверку:
                if bad_word.lower() in string_list[i].lower():    # если плохое слово содержится в проверяемом слове
                    bad_index= string_list[i].lower().find(bad_word)
                    string_list[i] = string_list[i][:bad_index] + '*'* len(bad_word) + string_list[i][bad_index+len(bad_word):]
                #string_list[i] =  string_list[i].replace(bad_word.lower(), '*'*len(bad_word)) 
    
    print(*[' '.join(elem) for elem in my_file_words], sep='\n')


# ДОРЕШАТЬ!!!!! прошла только один тест 
# https://stepik.org/lesson/448983/step/6?unit=511577

In [34]:
# взять текст в одном файле, записать его транслитерацией в другой файл

# словарь транслитерации
d = {
    'а': 'a', 'к': 'k', 'х': 'h', 'б': 'b', 'л': 'l', 'ц': 'c', 'в': 'v', 'м': 'm', 'ч': 'ch',
    'г': 'g', 'н': 'n', 'ш': 'sh', 'д': 'd', 'о': 'o', 'щ': 'shh', 'е': 'e', 'п': 'p', 'ъ': '*',
    'ё': 'jo', 'р': 'r', 'ы': 'y', 'ж': 'zh', 'с': 's', 'ь': "'", 'з': 'z', 'т': 't', 'э': 'je',
    'и': 'i', 'у': 'u', 'ю': 'ju', 'й': 'j', 'ф': 'f', 'я': 'ya'
    }

with open('cyrillic.txt', 'r', encoding='utf-8') as rus_text, open('transliteration.txt', 'w') as res_text:
    words = rus_text.read()
    new_words=[]
    for letter in list(words):
        if letter.lower() in d.keys(): 
            if letter.islower() : new_letter = d[letter]
            elif letter.isupper(): new_letter = d[letter.lower()].title()
        else: new_letter= letter
        new_words.append(new_letter)
    
    res_text.writelines(new_words)


In [None]:
# найти в предложенном файле те функции ,к которым нет комментария о ее названии 
# здесь это означает, что строка ПЕРЕД строкой с объявлением функции не начинается с #

with open(input(), 'r') as file:
    all_lines=[line.strip() for line in file.readlines()]
    lines_with_func = [line for line in all_lines if line.startswith('def') ]
    #file.seek(0)
    good_func= []
    for i in range(len(all_lines)):
        if all_lines[i].startswith('#'): good_func.extend(all_lines[i+1])
    
    bad_func=[]
    for line in lines_with_func:
        if line not in good_func: bad_func.append(line.split()[1].split('(')[0])
    
    print(('\n'.join(bad_func), 'Best Programming Team')[len(bad_func)==0])



In [37]:
with open('cyrillic.txt', 'r', encoding='utf-8') as file:

    print(file.readline())

Президент США Дональд Трамп продолжил обмен выпадами с руководством КНДР. В своем Twitter, комментируя выступление главы северокорейского МИДа Ли Ён Хо, американский лидер заявил, что если министр говорил от имени своего государства, то это означает, что КНДР долго не просуществует.



In [41]:


with open(input(), 'r') as file:
    all_lines=[line.strip() for line in file.readlines()]
    lines_with_func = [line for line in all_lines if line.startswith('def') ]
    #file.seek(0)
    good_func= []
    for i in range(len(all_lines)):
        if all_lines[i].startswith('#'): good_func.append(all_lines[i+1])
    
    bad_func=[]
    for line in lines_with_func:
        if line not in good_func: bad_func.append(line.split()[1].split('(')[0])
    
    print('\n'.join(bad_func))

powers
matrix
mean
greet
