# Отладка

Классическая отладка с помощью Python Debugger.  
Напишем программу, которая будет принимать URL, заходить на сайт и считать количество вхождений подстроки.  
Но вот беда, в программе где-то есть ошибка и мы хотим ее локолизовать:

In [8]:
import requests, re

def main(site_url, substring):
    site_code = get_site_code(site_url)
    matching_substrings = get_matching_substrings(site_code, substring)
    print('"{}" founded {} times in "{}"'.format(substring, len(matching_substrings), site_url))

def get_site_code(site_url):
    if not site_url.startswith('http'):
        site_url = 'https://' + site_url
    return requests.get(site_url).text

def get_matching_substrings(source, substring):
    return re.findall(source, substring)

main('mail.ru', 'script') # Вызываем нашу программу

Чтобы включить встроенный отладчик, необходимо ипортировать библиотеку `pdb` и вызвать метод `set_trace()` в том месте, где бы мы хотели начать отлаживать код. Запускаем код и вводим следующие команды дебаггера:

1. **next** - переходим на следующую строку, где вызов функции get_matching_substrings()
2. **step** - проходим внутрь функции get_matching_substrings()
3. **next** - идем дальше, в вызов функции re.findall(), именно там и была ошибка
4. **step** - заходим внутрь функции re.findall(). Причина ошибки, попутаны местами аргументы, функция принимает сначала шаблон: def findall(pattern, string, flags=0)
5. **quit** - выходим из отладчика

In [9]:
import requests, re

def main(site_url, substring):
    # Включаем отладчик (debugger):
    import pdb
    # И запускаем его с этого места. У отладчика много команд, их можно посмотреть с помощью функции help:
    pdb.set_trace()

    site_code = get_site_code(site_url)
    matching_substrings = get_matching_substrings(site_code, substring)
    print('"{}" founded {} times in "{}"'.format(substring, len(matching_substrings), site_url))

def get_site_code(site_url):
    if not site_url.startswith('http'):
        site_url = 'https://' + site_url
    return requests.get(site_url).text

def get_matching_substrings(source, substring):
    return re.findall(source, substring)


main('mail.ru', 'script') # Вызываем нашу программу

> <ipython-input-9-ef69cb080ae5>(9)main()
-> site_code = get_site_code(site_url)
(Pdb) next
> <ipython-input-9-ef69cb080ae5>(10)main()
-> matching_substrings = get_matching_substrings(site_code, substring)
(Pdb) step
--Call--
> <ipython-input-9-ef69cb080ae5>(18)get_matching_substrings()
-> def get_matching_substrings(source, substring):
(Pdb) next
> <ipython-input-9-ef69cb080ae5>(19)get_matching_substrings()
-> return re.findall(source, substring)
(Pdb) step
--Call--
> /usr/lib/python3.6/re.py(214)findall()
-> def findall(pattern, string, flags=0):
(Pdb) quit


BdbQuit: 

Продолжим. Мы можем сразу перейти к проблемному месту, для этого можно установить `breakpoint`. Выполним следующие команды:

1. **b 19** - Установим `breakpoint` строки для дебаггера на которой он остановится. Вызов `b` без параметра отображает все установленные `breakpoint`
2. **cont** - команда `continue`, которая остановит на обозначенном ранее `breakpoint`

In [11]:
import requests, re

def main(site_url, substring):
    # Включаем отладчик (debugger):
    import pdb
    # И запускаем его с этого места. У отладчика много команд, их можно посмотреть с помощью функции help:
    pdb.set_trace()

    site_code = get_site_code(site_url)
    matching_substrings = get_matching_substrings(site_code, substring)
    print('"{}" founded {} times in "{}"'.format(substring, len(matching_substrings), site_url))

def get_site_code(site_url):
    if not site_url.startswith('http'):
        site_url = 'https://' + site_url
    return requests.get(site_url).text

def get_matching_substrings(source, substring):
    return re.findall(source, substring)


main('mail.ru', 'script') # Вызываем нашу программу

> <ipython-input-11-ef69cb080ae5>(9)main()
-> site_code = get_site_code(site_url)
(Pdb) b 19
Breakpoint 1 at <ipython-input-11-ef69cb080ae5>:19
(Pdb) cont
> <ipython-input-11-ef69cb080ae5>(19)get_matching_substrings()
-> return re.findall(source, substring)
(Pdb) quit


BdbQuit: 

Далее, можно закомментировать строчки вызова дебаггера, исправить код и посмотреть как полностью выполняется программа:

In [10]:
import requests, re

def main(site_url, substring):
    # Включаем отладчик (debugger):
    # import pdb
    # И запускаем его с этого места. У отладчика много команд, их можно посмотреть с помощью функции help:
    # pdb.set_trace()

    site_code = get_site_code(site_url)
    matching_substrings = get_matching_substrings(site_code, substring)
    print('"{}" founded {} times in "{}"'.format(substring, len(matching_substrings), site_url))

def get_site_code(site_url):
    if not site_url.startswith('http'):
        site_url = 'https://' + site_url
    return requests.get(site_url).text

def get_matching_substrings(source, substring):
    # return re.findall(source, substring) # До исправления ошибки
    return re.findall(substring, source)


main('mail.ru', 'script') # Вызываем нашу программу

"script" founded 279 times in "mail.ru"
