In [1]:
# look at tools/set_up_magics.ipynb
yandex_metrica_allowed = True ; get_ipython().run_cell('# one_liner_str\n\nget_ipython().run_cell_magic(\'javascript\', \'\', \n    \'// setup cpp code highlighting\\n\'\n    \'IPython.CodeCell.options_default.highlight_modes["text/x-c++src"] = {\\\'reg\\\':[/^%%cpp/]} ;\'\n    \'IPython.CodeCell.options_default.highlight_modes["text/x-cmake"] = {\\\'reg\\\':[/^%%cmake/]} ;\'\n    \'IPython.CodeCell.options_default.highlight_modes["text/x-sql"] = {\\\'reg\\\':[/^%%sql/]} ;\'\n)\n\n# creating magics\nfrom IPython.core.magic import register_cell_magic, register_line_magic\nfrom IPython.display import display, Markdown, HTML\nimport argparse\nfrom subprocess import Popen, PIPE, STDOUT, check_output\nimport html\nimport random\nimport sys\nimport os\nimport re\nimport signal\nimport shutil\nimport shlex\nimport glob\nimport time\n\n@register_cell_magic\ndef save_file(args_str, cell, line_comment_start="#"):\n    parser = argparse.ArgumentParser()\n    parser.add_argument("fname")\n    parser.add_argument("--ejudge-style", action="store_true")\n    parser.add_argument("--under-spoiler-threshold", type=int, default=None)\n    args = parser.parse_args(args_str.split())\n    \n    cell = cell if cell[-1] == \'\\n\' or args.no_eof_newline else cell + "\\n"\n    cmds = []\n    with open(args.fname, "w") as f:\n        f.write(line_comment_start + " %%cpp " + args_str + "\\n")\n        for line in cell.split("\\n"):\n            line_to_write = (line if not args.ejudge_style else line.rstrip()) + "\\n"\n            if not line.startswith("%"):\n                f.write(line_to_write)\n            else:\n                f.write(line_comment_start + " " + line_to_write)\n                run_prefix = "%run "\n                md_prefix = "%MD "\n                comment_prefix = "%" + line_comment_start\n                if line.startswith(run_prefix):\n                    cmds.append(line[len(run_prefix):].strip())\n                elif line.startswith(md_prefix):\n                    cmds.append(\'#<MD>\' + line[len(md_prefix):].strip())\n                elif line.startswith(comment_prefix):\n                    cmds.append(\'#\' + line[len(comment_prefix):].strip())\n                else:\n                    raise Exception("Unknown %%save_file subcommand: \'%s\'" % line)\n                \n        f.write("" if not args.ejudge_style else line_comment_start + r" line without \\n")\n    for cmd in cmds:\n        if cmd.startswith(\'#\'):\n            if cmd.startswith(\'#<MD>\'):\n                display(Markdown(cmd[5:]))\n            else:\n                display(Markdown("\\#\\#\\#\\# `%s`" % cmd[1:]))\n        else:\n            display(Markdown("Run: `%s`" % cmd))\n            if args.under_spoiler_threshold:\n                out = check_output(cmd, stderr=STDOUT, shell=True, universal_newlines=True)\n                out = out[:-1] if out.endswith(\'\\n\') else out\n                out = html.escape(out)\n                if len(out.split(\'\\n\')) > args.under_spoiler_threshold:\n                    out = "<details> <summary> output </summary> <pre><code>%s</code></pre></details>" % out\n                elif out:\n                    out = "<pre><code>%s</code></pre>" % out\n                if out:\n                    display(HTML(out))\n            else:\n                get_ipython().system(cmd)\n\n@register_cell_magic\ndef cpp(fname, cell):\n    save_file(fname, cell, "//")\n    \n@register_cell_magic\ndef cmake(fname, cell):\n    save_file(fname, cell, "#")\n\n@register_cell_magic\ndef asm(fname, cell):\n    save_file(fname, cell, "//")\n    \n@register_cell_magic\ndef makefile(fname, cell):\n    fname = fname or "makefile"\n    assert fname.endswith("makefile")\n    save_file(fname, cell.replace(" " * 4, "\\t"))\n        \n@register_line_magic\ndef p(line):\n    line = line.strip() \n    if line[0] == \'#\':\n        display(Markdown(line[1:].strip()))\n    else:\n        try:\n            expr, comment = line.split(" #")\n            display(Markdown("`{} = {}`  # {}".format(expr.strip(), eval(expr), comment.strip())))\n        except:\n            display(Markdown("{} = {}".format(line, eval(line))))\n    \n    \ndef show_log_file(file, return_html_string=False):\n    obj = file.replace(\'.\', \'_\').replace(\'/\', \'_\') + "_obj"\n    html_string = \'\'\'\n        <!--MD_BEGIN_FILTER-->\n        <script type=text/javascript>\n        var entrance___OBJ__ = 0;\n        var errors___OBJ__ = 0;\n        function halt__OBJ__(elem, color)\n        {\n            elem.setAttribute("style", "font-size: 14px; background: " + color + "; padding: 10px; border: 3px; border-radius: 5px; color: white; ");                    \n        }\n        function refresh__OBJ__()\n        {\n            entrance___OBJ__ -= 1;\n            if (entrance___OBJ__ < 0) {\n                entrance___OBJ__ = 0;\n            }\n            var elem = document.getElementById("__OBJ__");\n            if (elem) {\n                var xmlhttp=new XMLHttpRequest();\n                xmlhttp.onreadystatechange=function()\n                {\n                    var elem = document.getElementById("__OBJ__");\n                    console.log(!!elem, xmlhttp.readyState, xmlhttp.status, entrance___OBJ__);\n                    if (elem && xmlhttp.readyState==4) {\n                        if (xmlhttp.status==200)\n                        {\n                            errors___OBJ__ = 0;\n                            if (!entrance___OBJ__) {\n                                if (elem.innerHTML != xmlhttp.responseText) {\n                                    elem.innerHTML = xmlhttp.responseText;\n                                }\n                                if (elem.innerHTML.includes("Process finished.")) {\n                                    halt__OBJ__(elem, "#333333");\n                                } else {\n                                    entrance___OBJ__ += 1;\n                                    console.log("req");\n                                    window.setTimeout("refresh__OBJ__()", 300); \n                                }\n                            }\n                            return xmlhttp.responseText;\n                        } else {\n                            errors___OBJ__ += 1;\n                            if (!entrance___OBJ__) {\n                                if (errors___OBJ__ < 6) {\n                                    entrance___OBJ__ += 1;\n                                    console.log("req");\n                                    window.setTimeout("refresh__OBJ__()", 300); \n                                } else {\n                                    halt__OBJ__(elem, "#994444");\n                                }\n                            }\n                        }\n                    }\n                }\n                xmlhttp.open("GET", "__FILE__", true);\n                xmlhttp.setRequestHeader("Cache-Control", "no-cache");\n                xmlhttp.send();     \n            }\n        }\n        \n        if (!entrance___OBJ__) {\n            entrance___OBJ__ += 1;\n            refresh__OBJ__(); \n        }\n        </script>\n\n        <p id="__OBJ__" style="font-size: 14px; background: #000000; padding: 10px; border: 3px; border-radius: 5px; color: white; ">\n        </p>\n        \n        </font>\n        <!--MD_END_FILTER-->\n        <!--MD_FROM_FILE __FILE__.md -->\n        \'\'\'.replace("__OBJ__", obj).replace("__FILE__", file)\n    if return_html_string:\n        return html_string\n    display(HTML(html_string))\n\n    \nclass TInteractiveLauncher:\n    tmp_path = "./interactive_launcher_tmp"\n    def __init__(self, cmd):\n        try:\n            os.mkdir(TInteractiveLauncher.tmp_path)\n        except:\n            pass\n        name = str(random.randint(0, 1e18))\n        self.inq_path = os.path.join(TInteractiveLauncher.tmp_path, name + ".inq")\n        self.log_path = os.path.join(TInteractiveLauncher.tmp_path, name + ".log")\n        \n        os.mkfifo(self.inq_path)\n        open(self.log_path, \'w\').close()\n        open(self.log_path + ".md", \'w\').close()\n\n        self.pid = os.fork()\n        if self.pid == -1:\n            print("Error")\n        if self.pid == 0:\n            exe_cands = glob.glob("../tools/launcher.py") + glob.glob("../../tools/launcher.py")\n            assert(len(exe_cands) == 1)\n            assert(os.execvp("python3", ["python3", exe_cands[0], "-l", self.log_path, "-i", self.inq_path, "-c", cmd]) == 0)\n        self.inq_f = open(self.inq_path, "w")\n        interactive_launcher_opened_set.add(self.pid)\n        show_log_file(self.log_path)\n\n    def write(self, s):\n        s = s.encode()\n        assert len(s) == os.write(self.inq_f.fileno(), s)\n        \n    def get_pid(self):\n        n = 100\n        for i in range(n):\n            try:\n                return int(re.findall(r"PID = (\\d+)", open(self.log_path).readline())[0])\n            except:\n                if i + 1 == n:\n                    raise\n                time.sleep(0.1)\n        \n    def input_queue_path(self):\n        return self.inq_path\n        \n    def wait_stop(self, timeout):\n        for i in range(int(timeout * 10)):\n            wpid, status = os.waitpid(self.pid, os.WNOHANG)\n            if wpid != 0:\n                return True\n            time.sleep(0.1)\n        return False\n        \n    def close(self, timeout=3):\n        self.inq_f.close()\n        if not self.wait_stop(timeout):\n            os.kill(self.get_pid(), signal.SIGKILL)\n            os.waitpid(self.pid, 0)\n        os.remove(self.inq_path)\n        # os.remove(self.log_path)\n        self.inq_path = None\n        self.log_path = None \n        interactive_launcher_opened_set.remove(self.pid)\n        self.pid = None\n        \n    @staticmethod\n    def terminate_all():\n        if "interactive_launcher_opened_set" not in globals():\n            globals()["interactive_launcher_opened_set"] = set()\n        global interactive_launcher_opened_set\n        for pid in interactive_launcher_opened_set:\n            print("Terminate pid=" + str(pid), file=sys.stderr)\n            os.kill(pid, signal.SIGKILL)\n            os.waitpid(pid, 0)\n        interactive_launcher_opened_set = set()\n        if os.path.exists(TInteractiveLauncher.tmp_path):\n            shutil.rmtree(TInteractiveLauncher.tmp_path)\n    \nTInteractiveLauncher.terminate_all()\n   \nyandex_metrica_allowed = bool(globals().get("yandex_metrica_allowed", False))\nif yandex_metrica_allowed:\n    display(HTML(\'\'\'<!-- YANDEX_METRICA_BEGIN -->\n    <script type="text/javascript" >\n       (function(m,e,t,r,i,k,a){m[i]=m[i]||function(){(m[i].a=m[i].a||[]).push(arguments)};\n       m[i].l=1*new Date();k=e.createElement(t),a=e.getElementsByTagName(t)[0],k.async=1,k.src=r,a.parentNode.insertBefore(k,a)})\n       (window, document, "script", "https://mc.yandex.ru/metrika/tag.js", "ym");\n\n       ym(59260609, "init", {\n            clickmap:true,\n            trackLinks:true,\n            accurateTrackBounce:true\n       });\n    </script>\n    <noscript><div><img src="https://mc.yandex.ru/watch/59260609" style="position:absolute; left:-9999px;" alt="" /></div></noscript>\n    <!-- YANDEX_METRICA_END -->\'\'\'))\n\ndef make_oneliner():\n    html_text = \'("В этот ноутбук встроен код Яндекс Метрики для сбора статистики использований. Если вы не хотите, чтобы по вам собиралась статистика, исправьте: yandex_metrica_allowed = False" if yandex_metrica_allowed else "")\'\n    html_text += \' + "<""!-- MAGICS_SETUP_PRINTING_END -->"\'\n    return \'\'.join([\n        \'# look at tools/set_up_magics.ipynb\\n\',\n        \'yandex_metrica_allowed = True ; get_ipython().run_cell(%s);\' % repr(one_liner_str),\n        \'display(HTML(%s))\' % html_text,\n        \' #\'\'MAGICS_SETUP_END\'\n    ])\n       \n\n');display(HTML(("В этот ноутбук встроен код Яндекс Метрики для сбора статистики использований. Если вы не хотите, чтобы по вам собиралась статистика, исправьте: yandex_metrica_allowed = False" if yandex_metrica_allowed else "") + "<""!-- MAGICS_SETUP_PRINTING_END -->")) #MAGICS_SETUP_END

<IPython.core.display.Javascript object>

# Динамические библиотеки


<p><a href="https://www.youtube.com/watch?v=s3t8wIhj4WA&list=PLjzMm8llUm4AmU6i_hPU0NobgA4VsBowc&index=24" target="_blank">
    <h3>Видеозапись семинара</h3> 
</a></p>

[Ридинг Яковлева](https://github.com/victor-yacovlev/mipt-diht-caos/tree/master/practice/function-pointers)


Сегодня в программе:
* Создание и подгрузка динамической библиотеки
  * <a href="#create_dynlib" style="color:#856024">Создание</a>
  * Подгрузка 
    1. <a href="#load_с" style="color:#856024">При старте средствами OS (динамическая компоновка)</a> 
    <br> Вот [это](https://www.ibm.com/developerworks/ru/library/l-dynamic-libraries/) можно почитать для понимания, что в этом случае происходит.
    2. В произвольный момент времени:
      * <a href="#load_python" style="color:#856024">Из python</a> 
      * <a href="#load_с_std" style="color:#856024">Из программы на С (dlopen)</a> 
      * <a href="#load_с_mmap" style="color:#856024">Из программы на С с извращениями (mmap)</a> 
* Нетривиальный пример применения динамических библиотек
  <br> <a href="#c_interpreter" style="color:#856024">Развлекаемся и пишем простенький интерпретатор языка C (с поблочным выполнением команд)</a> 
  
  
Факты:
* Статическая линковка быстрее динамической. И при запуске программы и при непосредственно работе.
* https://agner.org/optimize/optimizing_cpp.pdf c155
* При компиляции динамической библиотеки неизвестно, где она будет располагаться в памяти, это проблема, так как загруженной библиотеке нужно понимать, где искать функции и глобальные переменные. Есть два решения проблемы, про которые можно почитать [на хабре](https://habr.com/ru/company/badoo/blog/323904/https://habr.com/ru/company/badoo/blog/323904/) (там описан один способ и есть ссылка на описание другого способа).
  
<a href="#hw" style="color:#856024">Комментарии к ДЗ</a>


# <a name="create_dynlib"></a> Создание динамической библиотеки 

In [16]:
%%cpp lib.c
%MD `-shared` - создаем *разделяемую* библиотеку
%MD `-fPIC` - генерируем *позиционно-независимый код* (Positional Independant Code)
%MD **Скопилируем разделяемую библиотеку:**
%run gcc -Wall -shared -fPIC lib.c -o libsum.so
%MD **Выведем символы из скомпилированной библиотеки, фильтруя их по подстроке `sum`**
%run objdump -t libsum.so | grep sum 

int sum(int a, int b) {
    return a + b;
}

float sum_f(float a, float b) {
    return a + b;
}

`-shared` - создаем *разделяемую* библиотеку

`-fPIC` - генерируем *позиционно-независимый код* (Positional Independant Code)

**Скопилируем разделяемую библиотеку:**

Run: `gcc -Wall -shared -fPIC lib.c -o libsum.so`

**Выведем символы из скомпилированной библиотеки, фильтруя их по подстроке `sum`**

Run: `objdump -t libsum.so | grep sum`

libsum.so:     file format elf64-x86-64
0000000000001111 g     F .text	000000000000001e sum_f
00000000000010f9 g     F .text	0000000000000018 sum


# <a name="load_python"></a> Загрузка динамической библиотеки из python'а

In [3]:
import ctypes

lib = ctypes.CDLL("./libsum.so")
%p lib.sum(3, 4) # По умолчанию считает типы int'ами, поэтому в этом случае все хорошо
%p lib.sum_f(3, 4) # А здесь python передает в функцию инты, а она принимает float'ы. Тут может нарушаться соглашение о вызовах и происходить что угодно

# Скажем, какие на самом деле типы в сигнатуре функции
lib.sum_f.argtypes = [ctypes.c_float, ctypes.c_float]
lib.sum_f.restype = ctypes.c_float
%p lib.sum_f(3, 4) # Теперь все работает хорошо

`lib.sum(3, 4) = 7`  # По умолчанию считает типы int'ами, поэтому в этом случае все хорошо

`lib.sum_f(3, 4) = 0`  # А здесь python передает в функцию инты, а она принимает float'ы. Тут может нарушаться соглашение о вызовах и происходить что угодно

`lib.sum_f(3, 4) = 7.0`  # Теперь все работает хорошо

# <a name="load_с"></a> Загрузка динамической библиотеки из программы на С. Стандартными средствами, автоматически при старте программы

In [23]:
%%cpp ld_exec_dynlib_func.c
%MD `-lsum` - подключаем динамическую библиотеку `libsum.so`
%MD `-L.` - во время компиляции ищем библиотеку в директории `.`
%MD `-Wl,-rpath -Wl,'$ORIGIN/'.` - говорим линкеру, чтобы он собрал программу так, чтобы при запуске она искала библиотеку в `'$ORIGIN/'.`. То есть около исполняемого файла программы
%run gcc -Wall -g ld_exec_dynlib_func.c -L. -lsum -Wl,-rpath -Wl,'$ORIGIN/.' -o ld_exec_dynlib_func.exe
%run ./ld_exec_dynlib_func.exe

#include <stdio.h>

// объявляем функции
// ~ #include "sum.h"
int sum(int a, int b);
float sum_f(float a, float b);

int main() {  
    #define p(stmt, fmt) printf(#stmt " = " fmt "\n", stmt);
    p(sum(1, 1), "%d");
    p(sum(40, 5000), "%d");
    
    p(sum_f(1, 1), "%0.2f");
    p(sum_f(4.0, 500.1), "%0.2f");
    return 0;
}

`-lsum` - подключаем динамическую библиотеку `libsum.so`

`-L.` - во время компиляции ищем библиотеку в директории `.`

`-Wl,-rpath -Wl,'$ORIGIN/'.` - говорим линкеру, чтобы он собрал программу так, чтобы при запуске она искала библиотеку в `'$ORIGIN/'.`. То есть около исполняемого файла программы

Run: `gcc -Wall -g ld_exec_dynlib_func.c -L. -lsum -Wl,-rpath -Wl,'$ORIGIN/.' -o ld_exec_dynlib_func.exe`

Run: `./ld_exec_dynlib_func.exe`

sum(1, 1) = 2
sum(40, 5000) = 5040
sum_f(1, 1) = 2.00
sum_f(4.0, 500.1) = 504.10


In [24]:
!ldd ld_exec_dynlib_func.exe

!mkdir tmp
!cp ld_exec_dynlib_func.exe tmp/ld_exec_dynlib_func.exe
!ldd tmp/ld_exec_dynlib_func.exe

	linux-vdso.so.1 (0x00007ffcbe540000)
	libsum.so => /home/pechatnov/vbox/caos/sem23-dynamic-lib/././libsum.so (0x00007f153c391000)
	libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f153c185000)
	/lib64/ld-linux-x86-64.so.2 (0x00007f153c39d000)
mkdir: cannot create directory ‘tmp’: File exists
	linux-vdso.so.1 (0x00007ffcac34d000)
	libsum.so => not found
	libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007fa104e20000)
	/lib64/ld-linux-x86-64.so.2 (0x00007fa105033000)


# <a name="load_с_std"></a> Загрузка динамической библиотеки из программы на С в произвольный момент времени, используя стандартные функции

In [13]:
%%cpp stdload_exec_dynlib_func.c
%MD `-ldl` - пародоксально, но для подгрузки динамических библиотек, нужно подгрузить динамическую библиотеку
%run gcc -Wall -g stdload_exec_dynlib_func.c -ldl -o stdload_exec_dynlib_func.exe
%run ./stdload_exec_dynlib_func.exe

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <sys/mman.h>
#include <fcntl.h>
#include <assert.h>
#include <dlfcn.h>

typedef float (*binary_float_function)(float, float);

int main() {  
    
    void *lib_handle = dlopen("./libsum.so", RTLD_NOW);
    if (!lib_handle) {
        fprintf(stderr, "dlopen: %s\n", dlerror());
        abort();
    }
   
    int (*sum)(int, int) = dlsym(lib_handle, "sum");
    binary_float_function sum_f = dlsym(lib_handle, "sum_f");
    
    #define p(stmt, fmt) printf(#stmt " = " fmt "\n", stmt);
    p(sum(1, 1), "%d");
    p(sum(40, 5000), "%d");
    
    p(sum_f(1, 1), "%0.2f");
    p(sum_f(4.0, 500.1), "%0.2f");
    
    dlclose(lib_handle);
    return 0;
}

`-ldl` - пародоксально, но для подгрузки динамических библиотек, нужно подгрузить динамическую библиотеку

Run: `gcc -Wall -g stdload_exec_dynlib_func.c -ldl -o stdload_exec_dynlib_func.exe`

Run: `./stdload_exec_dynlib_func.exe`

sum(1, 1) = 2
sum(40, 5000) = 5040
sum_f(1, 1) = 2.00
sum_f(4.0, 500.1) = 504.10


# <a name="load_с_std"></a> Загрузка динамической библиотеки из программы на С в произвольный момент времени, используя mmap

В примере отсутствует парсинг elf файла, чтобы выцепить адреса функций. Поэтому они просто захардкожены

Так же не производятся релокации. В общем это чисто образовательный пример, в реальности так делать не надо :)

In [25]:
%%cpp mmap_exec_dynlib_func.c
%run gcc -Wall -fsanitize=address -g mmap_exec_dynlib_func.c -o mmap_exec_dynlib_func.exe
%run ./mmap_exec_dynlib_func.exe

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <sys/mman.h>
#include <fcntl.h>
#include <assert.h>

int main() {
    int fd = open("libsum.so", O_RDWR);
    struct stat s;
    assert(fstat(fd, &s) == 0);
    void* mapped = mmap(
        /* desired addr, addr = */ NULL, 
        /* length = */ s.st_size, 
        /* access attributes, prot = */ PROT_READ | PROT_EXEC | PROT_WRITE, // обратите внимание на PROT_EXEC
        /* flags = */ MAP_SHARED,
        /* fd = */ fd,
        /* offset in file, offset = */ 0
    );
    assert(close(fd) == 0); // Не забываем закрывать файл (при закрытии регион памяти остается доступным)
    if (mapped == MAP_FAILED) {
        perror("Can't mmap");
        return -1;
    }
 
    int (*sum)(int, int) = (void*)((char*)mapped + 0x10f9); // 0x10f9 - тот самый оффсет из objdump'a
    float (*sum_f)(float, float) = (void*)((char*)mapped + 0x1111); 
    
    #define p(stmt, fmt) printf(#stmt " = " fmt "\n", stmt);
    
    p(sum(1, 1), "%d");
    p(sum(40, 5000), "%d");
    
    p(sum_f(1, 1), "%0.2f");
    p(sum_f(4.0, 500.1), "%0.2f");

    assert(munmap(
        /* mapped addr, addr = */ mapped, 
        /* length = */ s.st_size
    ) == 0);
    return 0;
}

Run: `gcc -Wall -fsanitize=address -g mmap_exec_dynlib_func.c -o mmap_exec_dynlib_func.exe`

Run: `./mmap_exec_dynlib_func.exe`

sum(1, 1) = 2
sum(40, 5000) = 5040
sum_f(1, 1) = 2.00
sum_f(4.0, 500.1) = 504.10


# <a name="c_interpreter"></a> Простенький интерпретатор для С

Идея такая: на каждый кусочек кода будем компилировать динамическую библиотеку, подгружать ее, и выполнять из нее функцию, в которой будет этот самый кусочек.

Взаимодействие между кусочками через глобальные переменные. (Все кусочки кода выполняются в основном процессе.)

Каждая динамическя библиотека компонуется со всеми предыдущими, чтобы видеть их глобальные переменные. Для этого же при загрузке библиотек берется опция RTLD_GLOBAL.

In [30]:
import os
import subprocess
import ctypes
from textwrap import dedent

uniq_counter = globals().get("uniq_counter", 0) + 1
libs = []
all_includes = []
all_variables = []


def add_includes_c(includes):
    global all_includes
    all_includes = list(set(all_includes) | set(includes.split('\n')))

    
def declare_c(declaration):
    assignment_pos = declaration.find('=')
    assignment_pos = assignment_pos if assignment_pos != -1 else len(declaration)
    decl_part = declaration[:assignment_pos].rstrip()
    var_name_begin = decl_part.rfind(' ')
    var_assignment = declaration[var_name_begin:]
    interprete_c(var_assignment, variables=[decl_part])

    
def interprete_c(code="", variables=[]):
    func_name = "lib_func_%d_%d" % (uniq_counter, len(libs))
    source_name = "./tmp/" + func_name + ".c"
    lib_name = "lib" + func_name + ".so"
    lib_file = "./tmp/" + lib_name
    includes_list = "\n".join(all_includes)
    variables_list = "; ".join("extern " + v for v in all_variables) + "; " + "; ".join(variables)
    out_file = "./tmp/" + func_name + ".out" 
    err_file = "./tmp/" + func_name + ".err" 
    lib_code = dedent('''\
        #include <stdio.h>
        {includes_list}
        {variables_list};
        void {func_name}() {{
            freopen("{err_file}", "w", stderr);
            freopen("{out_file}", "w", stdout);
            {code};
            fflush(stderr);
            fflush(stdout);
        }}
        ''').format(**locals())
    with open(source_name, "w") as f:
        f.write(lib_code)
    compile_cmd = (
        ["gcc", "-Wall", "-shared", "-fPIC", source_name, "-Ltmp"] + 
        ['-l' + lib_f for lib_f in libs] + 
        ["-Wl,-rpath", "-Wl," + os.path.join(os.getcwd(), "tmp"), "-o", lib_file]
    )
    try:
        subprocess.check_output(compile_cmd)
    except:
        print("%s\n%s" % (lib_code, " ".join(compile_cmd)))
        get_ipython().run_cell("!" + " ".join(compile_cmd))
        raise
    
    lib = ctypes.CDLL(lib_file, ctypes.RTLD_GLOBAL)  # RTLD_GLOBAL - важно! Чтобы позднее загруженные либы видели ранее загруженные
    func = lib[func_name]
    func()
    for fname, stream in [(err_file, sys.stderr), (out_file, sys.stdout)]:
        with open(fname, "r") as f:
            txt = f.read()
            if txt:
                print(txt, file=stream)
    libs.append(func_name)
    all_variables.extend(variables)
    

In [31]:
interprete_c(r'''
    printf("%d", 40 + 2); 
    dprintf(2, "Hello world!");
''')

42


Hello world!


In [32]:
add_includes_c('''
    #include <math.h>"
''')
interprete_c('''
    printf("%f", cos(60.0 / 180 * 3.1415))
''')

0.500027


In [33]:
declare_c('''
   int a = 4242
''')

In [34]:
interprete_c('''
    printf("1) %d", a);
''')
interprete_c('''
    printf("2) %06d", a);
''')
interprete_c('''
    printf("3) %6d", a);
''')
interprete_c('''
    printf("4) %0.2f", (float)a);
''')

1) 4242
2) 004242
3)   4242
4) 4242.00


In [35]:
add_includes_c('''
    #include <sys/types.h>
    #include <sys/stat.h>
    #include <fcntl.h>
    #include <unistd.h>
''')
declare_c('''
    int fd = open("./a.txt", O_WRONLY | O_CREAT, 0644)
''')
interprete_c('''
    dprintf(fd, "Hello students! a = %d", a);
    close(fd);
    printf("a.txt written and closed!");
''')

a.txt written and closed!


In [36]:
!cat a.txt

Hello students! a = 4242

# <a name="cpp"></a> Особенности с С++

[Itanium C++ ABI](https://itanium-cxx-abi.github.io/cxx-abi/abi.html#mangling) - тут есть про манглинг

In [79]:
%%cpp libsumcpp.cpp
%run g++ -std=c++11 -Wall -shared -fPIC libsumcpp.cpp -o libsumcpp.so # compile shared library
%run objdump -t libsumcpp.so | grep um

extern "C" {
    int sum_c(int a, int b) {
        return a + b;
    }
} 

int sum_cpp(int a, int b) {
    return a + b;
}

float sum_cpp_f(float a, float b) {
    return a + b;
}

class TSummer {
public:
    TSummer(int a);
    int SumA(int b);
    int SumB(int b) { return a + b; } // Обратите внимание, этой функции нет в символах [1]
    template <typename T>
    int SumC(T b) { return a + b; } // И уж тем более этой [1]
public:
    int a;
};

TSummer::TSummer(int a_arg): a(a_arg) {}
int TSummer::SumA(int b) { return a + b; } 

Run: `g++ -std=c++11 -Wall -shared -fPIC libsumcpp.cpp -o libsumcpp.so # compile shared library`

Run: `objdump -t libsumcpp.so | grep um`

libsumcpp.so:     file format elf64-x86-64
00000000000006b0 l     F .text	0000000000000000 frame_dummy
0000000000200e70 l     O .init_array	0000000000000000 __frame_dummy_init_array_entry
0000000000000000 l    df *ABS*	0000000000000000 libsumcpp.cpp
0000000000000722 g     F .text	0000000000000017 _ZN7TSummerC1Ei
000000000000073a g     F .text	0000000000000018 _ZN7TSummer4SumAEi
0000000000000722 g     F .text	0000000000000017 _ZN7TSummerC2Ei
00000000000006e0 g     F .text	0000000000000014 sum_c
0000000000000708 g     F .text	000000000000001a _Z9sum_cpp_fff
00000000000006f4 g     F .text	0000000000000014 _Z7sum_cppii


##### <a name="odr_inline"></a> Замечание про наличие символов inline-функций в объектных файлах

[1] - этих функций нет среди символов в данном запуске. Но в общем случае этого не гарантируется, так как методы класса имеют external linkage (класс не объявлен в анонимном namespace).

Но почему же их нет в таблице символов, если у них external linkage? `inline` (в данном случае неявный) позволяет определять функцию в нескольких единицах трансляции при условии, что определение будет одинаковым (смягчается требование [ODR](https://en.cppreference.com/w/cpp/language/definition)). То есть во всех единицах трансляции, где эта, функция используется, она должна быть не просто объявлена, а определена одинаковым образом. Что дает компилятору свободу для оптимизации - он может не создавать символа функции, так как этот символ все равно никому не понадобится для линковки - в других единицах трансляции все равно должно быть такое же определение функции.

<details>
<summary> Больше деталей про <code>inline</code>
    
</summary>
<p>
    
`inline` &mdash; это спецификатор [[cppref]](https://en.cppreference.com/w/cpp/language/inline) [[std.dcl.inline]](http://eel.is/c++draft/dcl.inline), используемый для объявления _inline function_ [[cppref]](https://en.cppreference.com/w/cpp/language/inline#Description)[[std.dcl.inline]](http://eel.is/c++draft/dcl.inline#2), и функции, определённые в теле класса, являются inline [[std.class.mcft]](http://eel.is/c++draft/class.mfct#1)[[std.class.friend]](http://eel.is/c++draft/class.friend#6).

</p>
</details>

[Issue по которому добавлено замечение](https://github.com/yuri-pechatnov/caos_2019-2020/issues/1)

In [83]:
%%cpp use_lib_cpp.c
%run gcc -Wall -g use_lib_cpp.c -ldl -o use_lib_cpp.exe
%run ./use_lib_cpp.exe

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <sys/mman.h>
#include <fcntl.h>
#include <assert.h>
#include <dlfcn.h>

int main() {  
    
    void *lib_handle = dlopen("./libsumcpp.so", RTLD_NOW);
    if (!lib_handle) {
        fprintf(stderr, "dlopen: %s\n", dlerror());
        abort();
    }
    
    int (*sum_c)(int, int) = dlsym(lib_handle, "sum_c");
    int (*sum)(int, int) = dlsym(lib_handle, "_Z7sum_cppii");
    float (*sum_f)(float, float) = dlsym(lib_handle, "_Z9sum_cpp_fff");
    
    #define p(stmt, fmt) printf(#stmt " = " fmt "\n", stmt);
    p(sum_c(1, 1), "%d");
    p(sum_c(40, 5000), "%d");
    
    p(sum(1, 1), "%d");
    p(sum(40, 5000), "%d");
    
    p(sum_f(1, 1), "%0.2f");
    p(sum_f(4.0, 500.1), "%0.2f");
    
    char* objStorage[100];
    void (*constructor)(void*, int) = dlsym(lib_handle, "_ZN7TSummerC1Ei");
    int (*sumA)(void*, int) = dlsym(lib_handle, "_ZN7TSummer4SumAEi");
    
    // f(1, 2, 3) --- , раздяеляет аргументы
    // (1, 3) + 3 --- , - operator, (итоговое значение 6)
    // p((1, 3) + 3, "%d"); // == 6
    p((constructor(objStorage, 10), sumA(objStorage, 1)), "%d"); // operator , - просто делает выполнеяет все команды и берет возвращаемое значение последней
    p((constructor(objStorage, 4000), sumA(objStorage, 20)), "%d"); 
    
    dlclose(lib_handle);
    return 0;
}

Run: `gcc -Wall -g use_lib_cpp.c -ldl -o use_lib_cpp.exe`

Run: `./use_lib_cpp.exe`

sum_c(1, 1) = 2
sum_c(40, 5000) = 5040
sum(1, 1) = 2
sum(40, 5000) = 5040
sum_f(1, 1) = 2.00
sum_f(4.0, 500.1) = 504.10
(constructor(objStorage, 10), sumA(objStorage, 1)) = 11
(constructor(objStorage, 4000), sumA(objStorage, 20)) = 4020


# <a name="hw"></a> Комментарии к ДЗ

* 
*
* inf19-2-posix/dl/cpp-class-loader
<br> Задача очень интересная, советую всем сделать :)
<br>
<br> А теперь, немного информации, чтобы сделать ее было проще. Прежде всего в системе есть заголовочный файл, который можно исклюдить в решении. И вам нужно написать cpp-шник, в котором реализованы объявленные хедере функции.

<details>
<summary>interfaces.h</summary>

```cpp

#include <string>

class AbstractClass
{
    friend class ClassLoader;
public:
    explicit AbstractClass();
    ~AbstractClass();
protected:
    void* newInstanceWithSize(size_t sizeofClass);
    struct ClassImpl* pImpl;
};

template <class T>
class Class : public AbstractClass
{
public:
    T* newInstance()
    {
        size_t classSize = sizeof(T);
        void* rawPtr = newInstanceWithSize(classSize);
        return reinterpret_cast<T*>(rawPtr);
    }
};

enum class ClassLoaderError {
    NoError = 0,
    FileNotFound,
    LibraryLoadError,
    NoClassInLibrary
};


class ClassLoader
{
public:
    explicit ClassLoader();
    AbstractClass* loadClass(const std::string &fullyQualifiedName);
    ClassLoaderError lastError() const;
    ~ClassLoader();
private:
    struct ClassLoaderImpl* pImpl;
};
```
</details>

<br> Что вообще должно у вас получиться:
<br> Пусть у вас в каком-то динамической библиотеке реализован класс:

<details>
<summary> module.h </summary>

```cpp
#pragma once

class SimpleClass
{
public:
    SimpleClass();
};
```
</details>

<details>
<summary> module.cpp </summary>

```cpp
#include "module.h"

#include <iostream>

SimpleClass::SimpleClass()
{
    std::cout << "Simple Class constructor called" << std::endl;
}
```
</details>

<br> Вы хотите этот класс загрузить из этой динамической библиотеки:

<details>
<summary> main.cpp </summary>

```cpp
#include "interfaces.h"

#include "module.h"

static ClassLoader * Loader = nullptr;

int testSimpleClass()
{
    Class<SimpleClass>* c = reinterpret_cast<Class<SimpleClass>*> (
		Loader->loadClass("SimpleClass"));
    if (c) {
        SimpleClass* instance = c->newInstance(); // тут произошел аналог new SimpleClass()
        (void)instance; 
        // над уничтожением объекта в этой задаче думать не нужно
        return 0;
    }
    else {
        return 1;
    }
}


int main(int argc, char *argv[])
{
    Loader = new ClassLoader();
    int status = testSimpleClass();
    delete Loader;
    return status;
}

```
</details>
