<h1>mmap: файлы, отображаемые в памяти</h1>

Отображение файлов в памяти обеспечивает прямой доступ к данным, хранящимся в файловой системе, за счет использования виртуальной памяти операционной системы вместо обычных функций ввода-вывода. Такой подход позволяет улучшить производительность операций ввода-вывода, поскольку он не требует выполнения отдельных системных вызовов для каждой попытки доступа или копирования данных между буферами. Вместо этого как ядро, так и пользовательское приложение получают прямой доступ к памяти.
В зависимости от конкретных задач файлы, отображаемые в памяти, могут рассматриваться как изменяемые строки или файловые объекты. Отображенный файл поддерживает ожидаемые методы файлового API, такие как close(), flush (), read (), readline (), seek (), tell () и write (). Он также поддерживает строковый API, предоставляющий такие средства, как взятие срезов и методы наподобие find ().

Между версиями функции mmap() для Unix и Windows существуют различия в поведении и получаемых аргументах, однако ниже эти различия не обсуждаются в полной мере. Для получения более подробной информации по этому вопросу обратитесь к документации стандартной библиотеки.

<h2>Чтение</h2>

Для создания файлов в памяти предназначена функция mmap (). Ее первым аргументом является дескриптор файла, получаемый c помощью метода fileno () объекта файла или функции os. open (). Ответственность за открытие файла перед вызовом функции mmap () и его закрытие, когда необходимость в нем отпадает, возлагается на вызывающий код.
Второй аргумент функции mmap () — размер в байтах той части файла, которая подлежит отображению. Если он равен 0, то отображается весь файл. Если он превышает текущий размер файла, то файл расширяется.
<b><em style="color:red">Примечание:</em>
Windows не поддерживает создание отображений нулевой длины.</b>

Необязательный именованный аргумент access поддерживается обеими платформами. Используйте константу ACCESS_READ для доступа только по чтению, константу ACCESS_WRITE — для доступа по сквозной записи (присваивание значений отображению в памяти записывается непосредственно в файл) и константу ACCESS_COPY — для доступа c правами копирования по записи (присваивание значений отображению в памяти не записывается в файл).

In [18]:
import mmap
import os
os.chdir('C:\\Users\\Acer\\example_2')
with open('lorem.txt', 'r') as f:
    with mmap.mmap(f.fileno(), 0,
                   access=mmap.ACCESS_READ) as m:
        print('First 10 bytes via read :', m.read(10))
        print('First 10 bytes via slice:', m[:10])
        print('2nd   10 bytes via read :', m.read(10))

First 10 bytes via read : b'Lorem ipsu'
First 10 bytes via slice: b'Lorem ipsu'
2nd   10 bytes via read : b'm dolor si'


Указатель файла отслеживает последний байт, к которому осуществлялся доступ посредством операции среза. В данном примере указатель перемещается вперед на 10 байт после первого чтения. Затем он перемещается в начало файла посредством операции среза и вновь перемещается вперед на 10 байт по срезу. После выполнения операции среза повторный вызов метода read () возвращает байты 11-20 файла.

<h2>Запись</h2>

Чтобы настроить получение обновлений для файла, отображаемого в памяти, откройте его для присоединения данных в режиме ’r+’ (а не *w'), прежде чем отображать его. Затем используйте любой из методов API, изменяющих данные (например, метод write (), присваивание срезу).
В следующем примере часть строки изменяется на месте c использованием режима доступа по умолчанию ACCESS__WRITE и присваивания срезу.

In [21]:
import shutil

# Copy the example file
shutil.copyfile('lorem.txt', 'lorem_copy.txt')

word = b'consectetuer'
reversed = word[::-1]
print('Looking for    :', word)
print('Replacing with :', reversed)

with open('lorem_copy.txt', 'r+') as f:
    with mmap.mmap(f.fileno(), 0) as m:
        print('Before:\n{}'.format(m.readline().rstrip()))
        m.seek(0)  # rewind

        loc = m.find(word)
        m[loc:loc + len(word)] = reversed
        m.flush()

        m.seek(0)  # rewind
        print('After :\n{}'.format(m.readline().rstrip()))

        f.seek(0)  # rewind
        print('File  :\n{}'.format(f.readline().rstrip()))

Looking for    : b'consectetuer'
Replacing with : b'reutetcesnoc'
Before:
b'Lorem ipsum dolor sit amet, consectetuer adipiscing elit.'
After :
b'Lorem ipsum dolor sit amet, reutetcesnoc adipiscing elit.'
File  :
Lorem ipsum dolor sit amet, reutetcesnoc adipiscing elit.


Слово “consectetuer”, находящееся посреди первой строки, изменяется в памяти и в файле.

<h2>Режим копирования</h2>
В режиме доступа ACCESS_COPY изменения не записываются в файл на диске.

In [25]:
# Copy the example file
shutil.copyfile('lorem.txt', 'lorem_copy_2.txt')

word = b'consectetuer'
reversed = word[::-1]

with open('lorem_copy_2.txt', 'r+') as f:
    with mmap.mmap(f.fileno(), 0,
                   access=mmap.ACCESS_COPY) as m:
        print('Memory Before:\n{}'.format(
            m.readline().rstrip()))
        print('File Before  :\n{}\n'.format(
            f.readline().rstrip()))

        m.seek(0)  # rewind
        loc = m.find(word)
        m[loc:loc + len(word)] = reversed

        m.seek(0)  # rewind
        print('Memory After :\n{}'.format(
            m.readline().rstrip()))

        f.seek(0)
        print('File After   :\n{}'.format(
            f.readline().rstrip()))

Memory Before:
b'Lorem ipsum dolor sit amet, consectetuer adipiscing elit.'
File Before  :
Lorem ipsum dolor sit amet, consectetuer adipiscing elit.

Memory After :
b'Lorem ipsum dolor sit amet, reutetcesnoc adipiscing elit.'
File After   :
Lorem ipsum dolor sit amet, consectetuer adipiscing elit.


В этом примере дескриптор файла нужно было переместить в начало независимо от дескриптора отображения, поскольку внутренние состояния обоих объектов поддерживаются по отдельности.