Чтение файлов
Файловые дескрипторы

В Python есть абстракция над файлами — это указатель на файл или файловый дескриптор. Ничего сложного в этом нет, это наоборот упрощает работу со многими системными ресурсами.

Файловый дескриптор — это системный ресурс, доступ к которому предоставляет операционная система. Обычно файловый дескриптор можно открыть (получить/создать), закрыть (сообщить системе, что работа с ним закончена), можно записать в него что-то и прочитать что-то.
Открытие и закрытие файлов

Работа с файлами в Python начинается с открытия файла или получения от системы доступа к файлу, получение того самого файлового дескриптора. Для этого есть встроенная функция open, в которую надо обязательно передать имя файла, который мы хотим открыть, и можно указать, как именно мы хотим файл открыть:

fh = open('test_file.txt')

В этом примере fh — это файловый дескриптор, специальный объект, через который мы можем работать с файлом.

После того как работа с файлом завершена, надо вернуть ресурс (файл) системе. Для этого у файлового дескриптора надо вызвать метод close:

fh = open('test.txt')
fh.close()

Закрывать файл обязательно. Незакрытые дескрипторы могут стать причиной множества неочевидных проблем и сложностей. Самый простой случай — это испорченный файл и полностью утерянная информация, которая в нем могла содержаться.

Кроме того, надо помнить, что поскольку файловый дескриптор — это ресурс, который предоставляется операционной системой, то любое завершение работы приложения (аварийное или штатное) не означает закрытия всех открытых фалов и, опять же, может привести к ошибкам.

Если не указать, как мы хотим открыть файл, то он открывается только для чтения и при помощи fh можно будет только читать из файла. Если файла с именем test_file.txt в системе нет, то вы получите исключение.

Режимы открытия файлов в Python выбираются при помощи второго аргумента функции open.

Возможные режимы открытия файлов:
Режим 	Обозначение
'r' 	открытие на чтение (является значением по умолчанию).
'w' 	открытие на запись, содержимое файла удаляется, если файла не существует, создается новый.
'x' 	открытие на запись, если файла не существует, иначе исключение.
'a' 	открытие на дозапись, информация добавляется в конец файла.
'b' 	открытие в двоичном режиме.
't' 	открытие в текстовом режиме (является значением по умолчанию).
'+' 	открытие на чтение и запись
Чтение и запись в файл

Для записи в файл используется метод write у дескриптора fh. Этот метод возвращает количество записанных в файл символов.

Парный к нему метод — это метод read, который позволяет прочитать некоторое количество символов из файла.

fh = open('test.txt', 'w+')
fh.write('hello!')
fh.seek(0)

first_two_symbols = fh.read(2)
print(first_two_symbols)  # 'he'

fh.close()

В этом примере мы открыли файл для чтения и записи. Записали в файл строку 'hello!' и прочитали первые два символа из файла при помощи метода read, указав в качестве аргумента двойку.

Чтобы вернуть курсор на начало файла, вызвали метод seek и передали ему позицию, куда надо переместиться (0).

Чтобы прочитать всё содержимое файла за раз, можно вызвать метод read без аргументов:

fh = open('test.txt', 'w')
fh.write('hello!')
fh.close()

fh = open('test.txt', 'r')
all_file = fh.read()
print(all_file)  # 'hello!'

fh.close()

Пока файловый дескриптор не закрыт, вы можете читать из него частями, продолжая чтение с того места, на котором остановились:

fh = open('test.txt', 'w')
fh.write('hello!')
fh.close()

fh = open('test.txt', 'r')
while True:
    symbol = fh.read(1)
    if len(symbol) == 0:
        break
    print(symbol)

fh.close()

В этом примере в цикле мы читали и выводили в консоль содержимое файла по одному символу за раз. В результате вы получите в консоли:

h
e
l
l
o
!

Ещё есть удобный способ читать файл построчно, по одной строке за раз, для этого можно воспользоваться методом readline:

fh = open('test.txt', 'w')
fh.write('first line\nsecond line\nthird line')
fh.close()

fh = open('test.txt', 'r')
while True:
    line = fh.readline()
    if not line:
        break
    print(line)

fh.close()

В консоли будет вывод:

first
line

second
line

third
line

И аналогичный метод readlines, который читает весь файл полностью, но возвращает список строк, где элемент списка — это одна строка.

fh = open('test.txt', 'w')
fh.write('first line\nsecond line\nthird line')
fh.close()

fh = open('test.txt', 'r')
lines = fh.readlines()
print(lines)

fh.close()

Вывод в консоли будет:

['first line\n', 'second line\n', 'third line']

Обратите внимание, что все методы, которые читают файлы построчно, не опускают (удаляют) символ переноса строки.

Пусть у нас есть текстовый файл, который содержит данные с месячной заработной платой по каждому разработчику компании.

Пример файла:

Alex Korp,3000
Nikita Borisenko,2000
Sitarama Raju,1000

Как видим, структура файла — это фамилия разработчика и значение его заработной платы, разделенной запятой.

Разработайте функцию total_salary(path) (параметр path - путь к файлу), которая будет разбирать построчно файл и возвращать общую сумму заработной платы всех разработчиков компании.

Требования к задаче:

    функция total_salary возвращает значение типа float
    для чтения файла функция total_salary использует только метод readline
    мы пока не используем менеджер контекста with


In [43]:
def total_salary(path):
    fh = open('probe.txt', 'r')
    summ = []
    allsumm = 0
    while True:
        line = fh.readline()
        if not line:
            break
        else:
            count = 0
            count2 = 0
            for i in line:
                if i != ',':
                    count += 1
                else:
                    break
            for j in line:
                if j != '\n':
                    count2 += 1
                
        summ.append(line[count+1:count2])
    for i in summ:
        allsumm += float(i)
    fh.close()
    return allsumm


total_salary('F:\GoIT_Python_Project\GitHub\HomeWork\HW6\probe.txt')


6000.0