A PostgreSQL extension designed for tracing and analyzing queries executed within a session. This extension allows to capture and log information about running queries inside session. The collected information can retrieve heavy operations and most consumed resources during the execution of specific SQL queries.
For advanced users familiar with PostgreSQL's internal architecture, there is an option to set dynamic probes on C functions to examine the internals of the DBMS.
Under the hood, pg_uprobe utilizes one of the best code analysis tools - Frida and Frida Gum library, which is part of the Frida ecosystem and provides a low-level API for dynamic code injection.
Using the extension does not require patching or modifying PostgreSQL's source code. The Frida toolkit allows dynamically injecting the necessary code into a running PostgreSQL instance.
Once a connection to the DBMS is established, the extension can be used to enable tracing of all queries executed within session. Tracing can be enabled for your session using the start_session_trace() function, or for other sessions, such as those created by an application.
The collected information can reveal the following:
- Query text
- Time spent parsing the query
- Query plan
- Query plan type (generic, custom)
- Time spent planning the query
- Time spent executing the entire query
- Time spent executing each plan node
- Time spent waiting for events (wait events). For example: file reads, lock waits
- Shared memory locks acquired during query execution
This information is collected for every query executed during tracing.
If you are familiar with PostgreSQL's source code, our extension allows setting dynamic probes on some (see the "Limitations" section) C functions inside PostgreSQL core. Functions can be profiled either for your own session or for all sessions created after the probe is set. We have prepared several types of probes that can be installed.
Probe types:
- TIME - Measures the time spent executing the function
- HIST - Measures the time spent executing the function and builds a histogram of execution times
- MEM - Measures the change in PostgreSQL memory (MemoryContext) before and after the function execution
Supported PostgreSQL versions:
- PostgreSQL 15/16/17
- Postgres Pro Standard 15/16/17
- Postgres Pro Enterprise 15/16/17
Supported architectures:
- x86
- (We are working on supporting more architectures)
Supported operating systems:
- Linux
When tracing sessions, query execution time may increase. In our measurements, performance drops by ~5%. Therefore, session tracing should not be left enabled for extended periods. This tool is primarily intended for investigating issues, not detecting them.
Unfortunately, we cannot profile all PostgreSQL functions. A function must meet certain criteria:
- Not Inline
- Not Static
- i.e the function must be present in the ELF file
To check whether your desired function is in the ELF file, you can use the following commands (for instance Postgres Pro Enterprise 15):
objdump:
objdump -T /opt/pgpro/ent-15/bin/postgres
objdump -T /opt/pgpro/ent-15/bin/postgres | awk '{ print $7 }'
readelf:
readelf -s -W /opt/pgpro/ent-15/bin/postgres
readelf -s -W /opt/pgpro/ent-15/bin/postgres | awk '{ print $8 }'
nm:
nm -D --demangle /opt/pgpro/ent-15/bin/postgres
nm -D --demangle /opt/pgpro/ent-15/bin/postgres | awk '{ print $NF }'
Where /opt/pgpro/ent-15/bin/postgres
is the path to the installed Postgres Pro/PostgreSQL binaries.
Currently, the extension can only be built manually. There is no prebuilt packages.
Requirements:
- gcc
- CMake >= 3.15
- python
The installation process involves the following steps:
- Download Frida sources
- Build the Frida library
- Build the extension itself
git clone https://github.com/postgrespro/pg_uprobe
cd pg_uprobe
make USE_PGXS=1 PG_CONFIG=/opt/pgpro/ent-15/bin/pg_config install
Note: /opt/pgpro/ent-15/bin/pg_config
is the path to the installed pg_config application, which is stored in the same location as PostgreSQL.
In the $PGDATA/postgresql.conf
file, add the pg_uprobe extension to the list of shared libraries loaded at server startup:
shared_preload_libraries = 'pg_uprobe' # (change requires restart)
After this, restart the PostgreSQL cluster.
postgres=# CREATE EXTENSION pg_uprobe;
If you need to install it in a different schema, simply create the schema and install the extension there:
postgres=# CREATE SCHEMA uprobe;
postgres=# CREATE EXTENSION pg_uprobe SCHEMA uprobe;
We recommend installation in a dedicated schema. All objects will be created in the schema specified by the SCHEMA
clause. If you do not want to specify the schema qualifier when using the extension, consider modifying the search_path
parameter.
- pg_uprobe.data_dir - Path to the directory where the session trace results file and function profiling results files are created. Default:
$PGDATA/pg_uprobe
- pg_uprobe.trace_file_name - Name of the file for session trace results. Default:
trace_file.txt
- pg_uprobe.trace_file_limit - Limit in megabytes for the session trace results file. Default: 16 MB
- pg_uprobe.trace_write_mode - Output format for session tracing. Supported values: "text", "json". Default: json
- pg_uprobe.trace_lwlocks_for_each_node - If
true
, LWLock statistics will be reset after eachExecutor Node
execution; otherwise, statistics will be reset after thePortalRun
function completes. Default:true
- pg_uprobe.write_only_sleep_lwlocks_stat - If true, LWLock statistics will only be written in case of lock waits; otherwise, statistics for all acquired LWLocks will be written. Default: true
Documentation for session tracing
Documentation for profiling PostgreSQL functions
Simple example of session tracing
Simple example of profiling PostgreSQL functions
==============================<<>>==============================
Расширение PostgreSQL, предназначено для трассирования и анализа запросов, выполняемых в рамках сеанса. С помощью этого расширения можно захватывать и регистрировать информацию о запросах, которые были выполнены в процессе мониторинга. Собранную информацию можно детально исследовать, чтобы понять, на какие операции и ресурсы уходит время при выполнении конкретных SQL-запросов.
Для более продвинутых пользователей, которые знакомы с внутренним устройством PostgreSQL, есть возможность устанавливать динамические пробы в user space и также детально исследовать внутреннюю работу СУБД.
Под капотом pg_uprobe использует один из лучших инструментов для анализа кода - Frida, а также библиотеку Frida Gum, которая является частью экосистемы Frida и предоставляет низкоуровневый API для работы с динамическим внедрением кода.
Для использования расширения не требуется применять патчи или каким-либо образом изменять исходный код PostgreSQL. Инструментарий Frida позволяет динамически внедрять необходимый код в уже работающий PostgreSQL.
Когда подключение к СУБД уже создано, с помощью расширения можно включить трассирование всех запросов, которые будут выполняться в рамках этого сеанса. Включить трассирование можно как для своего сеанса, используя функцию start_session_trace(), так и для трассирования других сеансов, например сеансов, созданных приложением.
По собранной информации можно определить следующее:
- Текст запроса
- Время затраченное на разбор запроса
- План запроса
- Тип плана запроса(generic, custom)
- Время, затраченное на планирование запроса
- Время, затраченное на выполнение всего запроса
- Время, затраченное на выполнение каждого узла плана
- Время, затраченное на ожидание событий(wait events). Например: чтение файлов, ожидание блокировки
- Блокировки в разделяемой памяти, захваченные во время выполнения запроса
Эта информация будет собрана для каждого запроса, выполнявшегося в момент трассирования.
Если вы знакомы с исходным кодом PostgreSQL, наше расширение позволяет устанавливать динамические пробы в user space на некоторые(см. раздел "Ограничения") функции PostgreSQL. Профилировать функции можно как для своего сеанса, так и для всех сеансов, которые будут созданы после установки пробы. Мы подготовили несколько типов проб, которые можно установить.
Типы проб:
- TIME - Измеряет, сколько времени мы затратили на выполнение функции
- HIST - Измеряет, сколько времени мы потратили на выполнение функции, и после строится гистограмма по времени выполнения
- MEM - Измеряет, на сколько изменилась память PostgreSQL(MemoryContext) до выполнения функции и после
Поддерживаемые версии PostgreSQL:
- PostgreSQL 15/16/17
- Postgres Pro Standard 15/16/17
- Postgres Pro Enterprise 15/16/17
Поддерживаемые архитектуры:
- x86
- (Мы работаем над поддержкой большего количества архитектур)
Поддерживаемые операционные системы:
- Linux
При трассировании сеансов время выполнения запросов может увеличиться. В наших измерениях скорость выполнения падает на ~5%. Поэтому не стоит оставлять трассирование сеансов на длительное время. Этот инструмент предназначен, в первую очередь, для исследования проблемы, а не её обнаружения.
К сожалению, мы не можем профилировать все функции PostgreSQL. Функция должна обладать рядом свойств:
- Не Inline
- Не Static
- Другими словами, функция должна находиться в ELF файле
Чтобы проверить, находится ли необходимая вам функция в ELF файле, можно воспользоваться следующими командами:
objdump:
objdump -T /opt/pgpro/ent-15/bin/postgres
objdump -T /opt/pgpro/ent-15/bin/postgres | awk '{ print $7 }'
readelf:
readelf -s -W /opt/pgpro/ent-15/bin/postgres
readelf -s -W /opt/pgpro/ent-15/bin/postgres | awk '{ print $8 }'
nm:
nm -D --demangle /opt/pgpro/ent-15/bin/postgres
nm -D --demangle /opt/pgpro/ent-15/bin/postgres | awk '{ print $NF }'
Где /opt/pgpro/ent-15/bin/postgres - путь до установленных бинарников PostgreSQL.
На данный момент есть возможность установить расширения только собрав его непосредственно на машине где установлена СУБД.
Требования:
- gcc
- CMake >= 3.15
- python
В процессе установки будут выполнены следующие шаги:
- Скачиваются исходники Frida
- Собирается библиотека Frida
- Собирается само расширение
git clone https://github.com/postgrespro/pg_uprobe
cd pg_uprobe
make USE_PGXS=1 PG_CONFIG=/opt/pgpro/ent-15/bin/pg_config install
Где /opt/pgpro/ent-15/bin/pg_config
— путь до установленного приложения pg_config, который хранится там же, где установлен PostgreSQL.
В файле $PGDATA/postgresql.conf
необходимо добавить расширение pg_uprobe в список разделяемых библиотек, которые будут загружаться при запуске сервера:
shared_preload_libraries = 'pg_uprobe' # (change requires restart)
После этого необходимо перезапустить кластер PostgreSQL.
postgres=# CREATE EXTENSION pg_uprobe;
Если необходимо установить в другую схему, просто создайте её, и установите расширение в эту схему:
postgres=# CREATE SCHEMA uprobe;
postgres=# CREATE EXTENSION pg_uprobe SCHEMA uprobe;
Все объекты будут созданы в схеме, определенной предложением SCHEMA. Рекомендуется установка в выделенную схему где расширение создаст свои собственные функции. Если вы не хотите указывать квалификатор схемы при использовании расширения, рассмотрите возможность изменения параметра search_path.
- pg_uprobe.data_dir - Путь к каталогу, в котором будет создаваться файл с результатами трассирования сеанса и файлы с результатами профилирования функций. По умолчанию:
$PGDATA/pg_uprobe
- pg_uprobe.trace_file_name - Имя файла для результатов трассирования сеанса. По умолчанию:
trace_file.txt
- pg_uprobe.trace_file_limit - Лимит в мегабайтах для файла с результатами трассирования сеанса. По умолчанию: 16 МБ
- pg_uprobe.trace_write_mode - Формат вывода информации для трассирования сеанса. Поддерживаемые значения: "text", "json". По умолчанию:
json
- pg_uprobe.trace_lwlocks_for_each_node - Если
true
, статистика по LWLock будет сбрасываться после выполнения каждогоExecutor Node;
, иначе статистика будет сбрасываться после завершения функцииPortalRun
. По умолчанию:true
- pg_uprobe.write_only_sleep_lwlocks_stat - Если
true
, статистика по LWLock будет писаться только в случае ожидания блокировки, иначе будет писаться статистика по всем LWLock, которые были захвачены. По умолчанию:true
Документация по трассированию сеансов
Документация по профилированию функций PostgreSQL
Простой пример использования трассирования сеанса
Простой пример использования профилирования функций PostgreSQL