# Subprocess

Иногда нам необходимо вызвать какую-то внешнюю программу и использовать результат ее выполнения

In [51]:
import subprocess

## Просто запустить

Просто запустить программу (почти никогда нам не нужно просто запустить программу, но..)

In [52]:
subprocess.call(["./gen_svg", "out.svg"])

0

Что возвращает нам программа? 

In [55]:
retcod = subprocess.call(["./gen_svg", "out.svg"])

In [58]:
import sys

retcod = subprocess.call(["./gen_svg"])
if retcod != 0:
    print("Error", file=sys.stderr)

Error


## Ругаться на ошибку

In [215]:
subprocess.check_call(["./gen_svg", "out.svg"])

0

In [216]:
subprocess.check_call(["./gen_svg"])

CalledProcessError: Command '['./gen_svg']' returned non-zero exit status 1.

### Shlex

Мы привыкли набирать команду в виде строки - тут же надо с списком мучатся. Можно облегчить себе жизнь

In [74]:
import shlex
cmd = "./gen_svg out.svg"
shlex.split(cmd)

['./gen_svg', 'out.svg']

ВАЖНО использовать именно shlex. Обычный split может обработать некоторые ситуации неверно, например:

In [76]:
import shlex
cmd = "./gen_svg 'out (1).svg'"
print("shlex output:", shlex.split(cmd))
print("python split output:", cmd.split())

shlex output: ['./gen_svg', 'out (1).svg']
python split output: ['./gen_svg', "'out", "(1).svg'"]


In [79]:
cmd = "./gen_svg 'out.svg'"
subprocess.check_call(shlex.split(cmd))

0

## Вывод программы 
Получить вывод программы

In [95]:
cmd = "puzzle --version"
output = subprocess.check_output(shlex.split(cmd))
output

b"\n\n\nWELCOME TO TREE-PUZZLE 5.3.rc16!\n\n\n\nargv[1] = '--version'\n"

Что значит b перед строкой?

Python не знает, в какой кодировке будет писать ответ вызываемой программы. Если уверены, что кодировка - utf8, то просто пишите:

In [93]:
output.decode() # same - output.decode(encoding='utf8')

"\n\n\nWELCOME TO TREE-PUZZLE 5.3.rc16!\n\n\n\nargv[1] = '--version'\n"

Иначе надо задать decode другую кодировку

## Popen

В целом использовать описанные выше команды из subprocess можно, но обычно этого избегают, а используют более гибкий subprocess.Popen

In [217]:
?subprocess.Popen

Просто запустить процесс

In [98]:
cmd = "./gen_svg out.svg"
process = subprocess.Popen(shlex.split(cmd))
process.wait()

0

Хотим output

In [102]:
cmd = "puzzle --version"
process = subprocess.Popen(shlex.split(cmd), 
                           stdout=subprocess.PIPE # указываем, что мы хотим ловить output
                          )
process.wait()
process.stdout.read()

b"\n\n\nWELCOME TO TREE-PUZZLE 5.3.rc16!\n\n\n\nargv[1] = '--version'\n"

Так проще:

In [136]:
cmd = "puzzle --version"
process = subprocess.Popen(shlex.split(cmd), 
                           stdout=subprocess.PIPE # указываем, что мы хотим ловить stdout
                          )

stdout, _ = process.communicate()
stdout

b"\n\n\nWELCOME TO TREE-PUZZLE 5.3.rc16!\n\n\n\nargv[1] = '--version'\n"

А еще можно прямо указать, что мы ожидаем текст, а не бинарный вывод

In [137]:
cmd = "puzzle --version"
process = subprocess.Popen(shlex.split(cmd), 
                           stdout=subprocess.PIPE, # указываем, что мы хотим ловить stdout
                           text=True
                          )

stdout, _ = process.communicate()
stdout

"\n\n\nWELCOME TO TREE-PUZZLE 5.3.rc16!\n\n\n\nargv[1] = '--version'\n"

In [138]:
cmd = "puzzle --version"
process = subprocess.Popen(shlex.split(cmd), 
                           stdout=subprocess.PIPE, # указываем, что мы хотим ловить stdout
                           encoding='utf8',
                           text=True
                          )

stdout, _ = process.communicate()
stdout

"\n\n\nWELCOME TO TREE-PUZZLE 5.3.rc16!\n\n\n\nargv[1] = '--version'\n"

Хотим ловить информацию из потока ошибок

In [107]:
cmd = "puzzle --version"
process = subprocess.Popen(shlex.split(cmd), 
                           stdout=subprocess.PIPE, # указываем, что мы хотим ловить stdout
                           stderr=subprocess.PIPE  # указываем, что мы хотим ловить stderr
                          )

stdout, stderr = process.communicate()
stdout, stderr # оказывается, программа на stderr печатает свою версию в более простом формате
# в stderr могут содержаться важные сообщения типа warning (что не нашлось какого-то файла, потому результат неточен и тд)

(b"\n\n\nWELCOME TO TREE-PUZZLE 5.3.rc16!\n\n\n\nargv[1] = '--version'\n",
 b'puzzle (tree-puzzle) 5.3.rc16\n')

Некоторые программы пишут в stdout и stderr вразнобой - довольно важная информация, которую можно определить только из контекста, бьется на куски не совсем предсказуемым образом. В этом случае можно сказать Popen писать stderr в то же место, что и stdout

In [117]:
cmd = "puzzle --version" 
process = subprocess.Popen(shlex.split(cmd), 
                           stdout=subprocess.PIPE, # указываем, что мы хотим ловить stdout
                           stderr=subprocess.STDOUT  # перенаправить stderr в stdout
                          )

stdout, _ = process.communicate()
print(stdout.decode())

puzzle (tree-puzzle) 5.3.rc16



WELCOME TO TREE-PUZZLE 5.3.rc16!



argv[1] = '--version'



Можно записывать выдачу программ в отдельный открытый на запись файл

In [122]:
with open("out.log", 'w') as stdout,\
    open("err.log", 'w') as stderr:
    cmd = "puzzle --version"
    process = subprocess.Popen(shlex.split(cmd), 
                           stdout=stdout, # указываем, что мы хотим ловить stdout
                           stderr=stderr  # перенаправить stderr в stdout
                          )

process.communicate()
!cat out.log
!cat err.log




WELCOME TO TREE-PUZZLE 5.3.rc16!



argv[1] = '--version'
puzzle (tree-puzzle) 5.3.rc16


In [124]:
with open("out.log", 'w') as stdout:
    cmd = "puzzle --version"
    process = subprocess.Popen(shlex.split(cmd), 
                           stdout=stdout, # указываем, что мы хотим ловить stdout
                           stderr=subprocess.STDOUT # перенаправить stderr в stdout
                          )

process.communicate()
!cat out.log

puzzle (tree-puzzle) 5.3.rc16



WELCOME TO TREE-PUZZLE 5.3.rc16!



argv[1] = '--version'


## Как запустить скрипт на Python? 

In [148]:
!cat solution_f.py

import sys

with open(sys.argv[1]) as inp:
    a = inp.readline()
    b = inp.readline()
print(int(a) + int(b))


In [218]:
cmd = "python solution_f.py tests/1.txt"
process = subprocess.Popen(shlex.split(cmd), 
                           stdout=subprocess.PIPE, # указываем, что мы хотим ловить stdout
                           stderr=subprocess.STDOUT, # перенаправить stderr в stdout
                           text=True
                          )
print(process.communicate())

('3\n', None)


## Как запустить программу, ожидающую чего-то на stdin

In [146]:
!cat solution.py

a = input()
b = input()
print(int(a) + int(b))


In [219]:
!cat 'tests/1.txt'

1
2


In [220]:
with open('tests/1.txt') as stdin:
    cmd = "python solution.py"
    process = subprocess.Popen(shlex.split(cmd),
                           stdin=stdin, 
                           stdout=subprocess.PIPE, # указываем, что мы хотим ловить stdout
                           stderr=subprocess.STDOUT, # перенаправить stderr в stdout
                           text=True
                          )
print(process.communicate())

('3\n', None)


## Как запустить программу, которая ожидает строго определенный набор файлов с жестко заданными именами и путями к ним (например, они должны находиться в папке с ней)

На самом деле - таких программ море, тот же PHYLIP для филогении

In [223]:
!cat solution_i.py

import sys

with open("in.txt") as inp:
    a = inp.readline()
    b = inp.readline()
print(int(a) + int(b))


In [224]:
!cat 'tests/1.txt'

1
2


In [None]:
import os
import shutil


os.mkdir("run")
shutil.copy("solution_i.py", "run/solution_i.py")
shutil.copy("tests/1.txt", "run/in.txt")


In [225]:
!ls run/

in.txt        solution_i.py


In [226]:
cmd = "python solution_i.py"
process = subprocess.Popen(shlex.split(cmd), 
                           stdout=subprocess.PIPE, # указываем, что мы хотим ловить stdout
                           stderr=subprocess.STDOUT, # перенаправить stderr в stdout
                           text=True,
                           cwd='run' # перед запуском программы система переходит в эту папку. Все пути считаются относительно этой папки 
                          )
print(process.communicate())

('3\n', None)


Как запустить много процессов разом? 

In [232]:
import os
import shutil

In [241]:
procs = []
for i in range(10):
    cmd = "python solution_i.py"
    
    process = subprocess.Popen(shlex.split(cmd), 
                           stdout=subprocess.PIPE, # указываем, что мы хотим ловить stdout
                           stderr=subprocess.STDOUT, # перенаправить stderr в stdout
                           text=True,
                           cwd='run' # перед запуском программы система переходит в эту папку. Все пути считаются относительно этой папки 
                          )
    procs.append(process)

for p in procs:
    print(p.communicate())

('3\n', None)
('3\n', None)
('3\n', None)
('3\n', None)
('3\n', None)
('3\n', None)
('3\n', None)
('3\n', None)
('3\n', None)
('3\n', None)


Если процессы работают в одной папке и не дай бог пишут одинаковые временные файлы или файлы результатов - то так запустить не получится.
Надо для каждого процесса заводить свою временную папку и в ней работать. 

In [None]:
import tempfile

In [243]:
procs = []
for i in range(10):
    with tempfile.TemporaryDirectory() as tempdir:
        
        shutil.copy("solution_i.py", os.path.join(tempdir, "solution_i.py"))
        shutil.copy("tests/1.txt", os.path.join(tempdir, "in.txt"))
        cmd = "python solution_i.py"
        p = subprocess.Popen(shlex.split(cmd), 
                               stdout=subprocess.PIPE, # указываем, что мы хотим ловить stdout
                               stderr=subprocess.STDOUT, # перенаправить stderr в stdout
                               text=True,
                               cwd=tempdir # перед запуском программы система переходит в эту папку. Все пути считаются относительно этой папки 
                              )
        p.wait()
    procs.append(p)

for p in procs:
    print(p.stdout.read())

3

3

3

3

3

3

3

3

3

3



При этом потеряли возможность удалять временные папки сразу

Можно сделать вот так

In [257]:
procs = []
for i in range(10):
    tempdir = tempfile.TemporaryDirectory() 
        
    shutil.copy("solution_i.py", os.path.join(tempdir.name, "solution_i.py"))
    shutil.copy("tests/1.txt", os.path.join(tempdir.name, "in.txt"))
    cmd = "python solution_i.py"
    p = subprocess.Popen(shlex.split(cmd), 
                               stdout=subprocess.PIPE, # указываем, что мы хотим ловить stdout
                               stderr=subprocess.STDOUT, # перенаправить stderr в stdout
                               text=True,
                               cwd=tempdir.name# перед запуском программы система переходит в эту папку. Все пути считаются относительно этой папки 
                              )
    procs.append((p, tempdir) )

for p, td in procs:
    p.wait()
    print(p.stdout.read())
    td.cleanup() # удаляем временную папку

3

3

3

3

3

3

3

3

3

3



Но это временное и неудобное решение - with спасал нас от кучи возможных ошибок на случай, если мы забудем закрыть временную папку.
В следующий раз мы разберем модуль **concurrent.futures**, который позволяет все сделать максимально удобно