# Стандартные методы и функции для строк

##    in, find, index, starts/ends, rfind

Проверка вхождения строки в строку:

In [1]:
print('abc' in 'abcba')
print('abce' in 'abcba')

True
False


Если интересует место, где именно строка начинает входить в строку:

In [2]:
print('cabcd'.find('abc')) # Индекс первого вхождения или -1

1


In [3]:
print('cabcd'.find('aec'))

-1


In [4]:
print(str.find.__doc__)

S.find(sub[, start[, end]]) -> int

Return the lowest index in S where substring sub is found,
such that sub is contained within S[start:end].  Optional
arguments start and end are interpreted as in slice notation.

Return -1 on failure.


In [5]:
print('cabcd'.index('abc')) # Индекс первого вхождения или ValueError
print('cabcd'.index('aec'))

1


ValueError: substring not found

In [6]:
s = 'The man in black fled across the desert, and the gunslinger followed'
print(s.startswith('The man in black'))

True


In [7]:
print(str.startswith.__doc__)

S.startswith(prefix[, start[, end]]) -> bool

Return True if S starts with the specified prefix, False otherwise.
With optional start, test S beginning at that position.
With optional end, stop comparing S at that position.
prefix can also be a tuple of strings to try.


In [9]:
print(s.startswith(('The woman', 'The dog', 'The man in black')))

True


In [10]:
s = 'image.png'
print(s.endswith('.png'))

True


`.count()` находит число непересекающихся вхождений:

In [12]:
s = 'abacaba'
print(s.count('aba'))

s = 'ababa'
print(s.count('aba'))

2
1


Правосторонние аналоги функций:

In [13]:
s = 'abacaba'
print(s.rfind('aba'))

4


##      upper, lower, replace, split, strip, join

`upper(), lower()`

In [14]:
s = 'The man in black fled across the desert, and the gunslinger followed'
print(s.lower())
print(s.upper())

the man in black fled across the desert, and the gunslinger followed
THE MAN IN BLACK FLED ACROSS THE DESERT, AND THE GUNSLINGER FOLLOWED


In [15]:
print(s.count('the'))
print(s.lower().count('the'))

2
3


`replace()`

In [17]:
s = '1,2,3,4'
print(s)
print(s.replace(',', ', '))
print(s.replace(',', ', ', 2))

1,2,3,4
1, 2, 3, 4
1, 2, 3,4


`split()`

In [20]:
s = '1 2 3 4'
print(s.split())
print(s.split(' ', 2))

s = '1\t\t 2    3 \n             4'
print(s.split())


['1', '2', '3', '4']
['1', '2', '3 4']
['1', '2', '3', '4']


`strip()`

In [21]:
s = '      1, 2, 3, 4                     '
print(repr(s.rstrip()))
print(repr(s.lstrip()))
print(repr(s.strip()))

'      1, 2, 3, 4'
'1, 2, 3, 4                     '
'1, 2, 3, 4'


In [22]:
s = '_*__1, 2, 3, 4__*_'
print(repr(s.rstrip("*_")))
print(repr(s.lstrip("*_")))
print(repr(s.strip("*_")))

'_*__1, 2, 3, 4'
'1, 2, 3, 4__*_'
'1, 2, 3, 4'


`join()` - принимает то, по чему можно проитерироваться (например `map object`). 

Элементы последовательности должны быть строками.

In [23]:
numbers = map(str, [1, 2, 3, 4, 5])
print(repr(' '.join(numbers)))

'1 2 3 4 5'


##       format, f-строки

In [24]:
capital = 'London is the capital of Great Britain'

template = '{} is the capital of {}'
print(template.format('London', 'Great Britain'))
print(template.format('Vaduz', 'Liechtenstein'))

London is the capital of Great Britain
Vaduz is the capital of Liechtenstein


Использование именованных аргументов:

In [25]:
template = '{capital} is the capital of {country}'
print(template.format(capital='London', country='Great Britain'))
print(template.format(country='Liechtenstein', capital='Vaduz'))

London is the capital of Great Britain
Vaduz is the capital of Liechtenstein


----------

Благодаря форматированию можно обращаться к аттрибутам объекта:

In [26]:
import requests
template = 'Response from {0.url} with {0.status_code}'

res = requests.get('https://docs.python.org/3.5/')
print(template.format(res))

res = requests.get('https://docs.python.org/3.5/random')
print(template.format(res))

Response from https://docs.python.org/3.5/ with 200
Response from https://docs.python.org/3.5/random with 404


Интересуют только 3 знака после запятой:

In [30]:
from random import random

x = random()
print(x)
print("{:.3}".format(x))

0.6865281596172743
0.687


`f-строки`:

In [32]:
capital_country = {"Russia": "Moscow",
                   "United States": "Washington",
                   "Canada": "Ottawa",
                   "Germany": "Berlin",
                   "France": "Paris",
                   "Great Britain": "London"}


for country, capital in capital_country.items():
    print(f"{country}: {capital}") # f-строка

Russia: Moscow
United States: Washington
Canada: Ottawa
Germany: Berlin
France: Paris
Great Britain: London


## Задача 1

Вашей программе на вход подаются три строки `s, a, b`, состоящие из строчных латинских букв.

За одну операцию вы можете заменить все вхождения строки `a` в строку `s` на строку `b`.

Например, `s = "abab"`, `a = "ab"`, `b = "ba"`, тогда после выполнения одной операции строка `s` перейдет в строку `"baba"`, после выполнения двух и операций – в строку `"bbaa"`, и дальнейшие операции не будут изменять строку `s`.

Необходимо узнать, после какого минимального количества операций в строке `s` не останется вхождений строки `a`. Если операций потребуется более 1000, выведите `Impossible`.

Выведите одно число – минимальное число операций, после применения которых в строке `s` не останется вхождений строки `a`, или `Impossible`, если операций потребуется более 1000.

In [34]:
print(str.replace.__doc__)

S.replace(old, new[, count]) -> str

Return a copy of S with all occurrences of substring
old replaced by new.  If the optional argument count is
given, only the first count occurrences are replaced.


In [43]:
def main():
    s, a, b = input(), input(), input()

    ans = 'Impossible'

    if a not in s:
        print(0)
        return
    elif a in b:
        print(ans)
        return

    for i in range(1000):
        new_s = s.replace(a, b)
        if s == new_s:
            ans = i
            break
        s = new_s
    print(ans)

main()

aabbcc
aa
aaa
Impossible


In [46]:
s, a, b = input(), input(), input()

ans = 'Impossible'

if a not in s:
    print(0)
elif a in b:
    print(ans)
else:
    for i in range(1000):
        if s == s.replace(a, b):
            ans = i
            break
        s = s.replace(a, b)
    print(ans)

ababa
a
b
1


## Задача 2

Вашей программе на вход подаются две строки `s` и `t`, состоящие из строчных латинских букв.

Выведите одно число – количество вхождений строки `t` в строку `s`.

Пример:

`s = "abababa"`

`t = "aba"`

Вхождения строки `t` в строку`s`:

**aba**baba

ab**aba**ba

abab**aba**

In [47]:
print(str.startswith.__doc__)

S.startswith(prefix[, start[, end]]) -> bool

Return True if S starts with the specified prefix, False otherwise.
With optional start, test S beginning at that position.
With optional end, stop comparing S at that position.
prefix can also be a tuple of strings to try.


In [48]:
s = 'abba'
s.startswith('b')

False

In [49]:
print(str.find.__doc__)

S.find(sub[, start[, end]]) -> int

Return the lowest index in S where substring sub is found,
such that sub is contained within S[start:end].  Optional
arguments start and end are interpreted as in slice notation.

Return -1 on failure.


In [55]:
s = 'aaaaa'
t = 'a'

count, i = 0, 0
while s.find(t, i) != -1:
    count += 1
    i = s.find(t, i) + 1
print(count)

5


# Регулярные выражения

##     Регулярки, сырые строки

Регулярные выражения - одно из самых мощных средств поиска в текстовых документах.

Базовая концепция - с помощью регулярок описываем шаблон, а потом можем проверить, подходит ли строка под шаблон. Или в тексте можно найти все подстроки, походящие под шаблон.

Что такое сырые строки и что их отличает от обычных:

In [58]:
x = 'hello\n"world'
print(x)

hello
"world


Чтобы указать интерпретатору, что все символу нужно использовать ровно в том же виде, в котором они указаны (сырая строка):

In [59]:
x = r'hello\n"world' # raw
print(x)

hello\n"world


Некоторые метасимволы регулярок используют `\`, поэтому для описания шаблонов регулярок используются сырые строки.

##     