# Программирование на языке Python. Уровень 1.Основы языка Python

## Модуль 8. Работа со текстовыми данными

### Строки и обработка текстовых данных

#### Элементарные операции над строками

Строка в Python - это неизменяемый (unmutable) объект. При этом, во время работы со строками можно использовать операции, которые определены для списков:
- ```len()``` - эта функция Python вернет длину строки в символах
- можно делать срезы  (напимер, ```str_x[2:-1]``` вернет подстроку, начиная со 2-го символа, но без последнего символа)
- перебирать символы в строке в цикле ```for```\
__НО__:
- присваивать символы определенным позициям в строках нельзя
- также для строк не определены ```append()```, ```remove()```, ```sort()``` и прочее.

In [None]:
hello = "Привет"
print(len(hello)) # 6
print(hello[1:-1]) # риве
for char in hello:
    print(char)
# П
# р
# и
# в
# е
# т

In [None]:
hello.append("тттт") # ошибка AttributeError: 'str' object has no attribute 'append'
hello[2] = "ю" # ошибка TypeError: 'str' object does not support item assignment

Но со строками в Python можно делать ряд других операций:
- конкатенация строк (соединение) - оператором "``` + ```"
- разбиение строк методом ```split( str )``` (здесь str - это разделитель)
- соединение строк из списка методом ```join()```
- можно обрезать строки слева и/или справа функцией ```strip( str )```
- строки можно форматировать.

In [None]:
hello = "Hello"
world = "World"
hello_world = hello + ', ' + world+'!'
print(hello_world) # Hello, World!

list_hw = hello_world.split(', ')
print(list_hw) # ['Hello', 'World!']

print( ", ".join(list_hw) ) # Hello, World!

In [None]:
# убрать пробелы и ненужные символы
print("Hello world    !".strip(' !'))

# изменить регистр
print(hello_world.upper()) # HELLO, WORLD!
print(hello_world.lower()) # hello, world!
print(hello_world.capitalize()) # Hello, world!


##### Форматирование строк

Существует несколько методов форматирования:
- с помощью f-строк (например, ```f"{var1} {var2}"```)
- с использованием метода ```format()```
- как в Python 2.X, с использованием оператора "%"

In [None]:
# f-строки:
hello = "Hello"
world = "World"
print(f"{hello}, {world}!") # Hello, World!

import math

# можно "на лету" форматировать вывод чисел, например число знаков после запятой
print(f'The value of pi is approximately {math.pi:.4f}.') # 4 знака после запятой


In [None]:
# можно устанавливать ширину строки, что удобно при табличном выводе:
table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 7678}
for name, phone in table.items():
    print(f'{name:10} ==> {phone:10d}')

In [None]:
# функция format работает аналогично f-строке
hello = "Hello"
world = "World"
print("{}, {}!".format(hello, world)) # Hello, World!
print("{1}, {0}!".format(hello, world)) # World, Hello!

# можно удобно выводить содержимое словаря
table = {'Sjoerd': 4127, 'Jack': 4098, 'Dcab': 7678}
print('Jack: {Jack:d}; Sjoerd: {Sjoerd:d}; Dcab: {Dcab:d}'.format(**table)) # Jack: 4098; Sjoerd: 4127; Dcab: 7678

# форматирование в стиле Python 2.X:
print('Jack: %(Jack)d; Sjoerd: %(Sjoerd)d; Dcab: %(Dcab)d' % table)

In [None]:
# также в Python есть функции выравнивания по левому краю, правому краю и центру
print(hello.rjust(10))
print(hello.ljust(10))
print(hello.center(10))

#### __ПРАКТИКА__

1. Для введенной строки выведите (на отдельной строке): 
- второй символ этой строки; 
- предпоследний символ этой строки; 
- первые 3 символа этой строки; 
- всю строку, кроме последних двух символов; 
- все символы с четными индексами (считая, что индексация начинается с 0, поэтому символы выводятся, начиная с первого); 
- все символы с нечетными индексами, то есть начиная со второго символа строки; 
- все символы в обратном порядке; 
- все символы строки через один в обратном порядке, начиная с последнего; 
- длину данной строки. 


In [None]:
str_ = input("Введите строку: ")

# выведите второй символ этой строки; 

# выведите предпоследний символ этой строки; 

# выведите первые 3 символа этой строки; 

# выведите всю строку, кроме последних двух символов; 

# выведите все символы с четными индексами (считая, что индексация начинается с 0, поэтому символы выводятся, начиная с первого); 

# выведите все символы с нечетными индексами, то есть начиная со второго символа строки; 

# выведите все символы в обратном порядке; 

# выведите все символы строки через один в обратном порядке, начиная с последнего; 

# выведите длину данной строки. 



2. Дан текст, содержащий несколько строк, где через символ-разделитель ```|``` перечислены различные показатели. Требуется вывести их в табличной форме, упорядоченными по убыванию, в формате ```<Название показателя>: <число>```.

In [None]:
data = """
приборы|8%
тангаж|11.5%
развитие|0.05%
температура|11.1%
макроэкономика|9
инфлюэнца|100%
декупаж|9.99%
"""

# ваш код здесь

### Обработка текстовой информации: поиск и замена

#### Простой поиск и замена

У объектов класса str есть встроенные средства поиска подстроки:
- простая проверка наличия подстроки в строке: ```if x in y:```
- метод ```find( str )```, который возвращает позицию найденной подстроки или либо -1
- методы ```startswith( str )``` и ```endswith( str )``` проверяют, начинается или заканчивается данная строка строкой ```str```
- метод ```count( str )```, который возвращает количество вхождений подстроки в строку
- для замены одной подстроки на другую используйте метод ```replace( from, to )```

__ВНИМАНИЕ!__ Все эти методы чувствительны к регистру.

In [None]:
hello_world  = "Hello, World!"

print( 'World' in hello_world ) # True
print( 'world' in hello_world ) # False - т.к. чувствительность к регистру

print(hello_world.find(', ')) # 5

print(hello_world.startswith('Hell')) # True
print(hello_world.endswith('World')) # False, т.к. восклицательный знак


In [None]:
numbers = "2 12 85 06 42 4 718 29 3 70 420"

# замена
print(numbers.replace('42', '!!!')) # 2 12 85 06 !!! 4 718 29 3 70 !!!0

numbers = "2 12 85 06 42 4 718 29 3 70 420"
print(numbers.count("42")) # 2 - подсчет вхождений подстроки

#### ПРАКТИКА / ДЗ

1. Реализовать калькулятор, который принимает от пользователя через пробел строку следующего вида: «a op b», где a и b – некоторые числа, а ‘op’ определяет оператор и может принимать значения «+,-,*,/,**,%». В зависимости от оператора с помощью форматирования строк вывести результат в виде: «a + b = 3 + 2 = 5», где была получена строка «3 + 2». Для операций возведения в степень и деления по модулю использовать вместо знака оператора соответствующие выражения. Например, для строки «2 ** 3» должно быть выведено «a в степени b = 2 в степени 3 = 8».

In [None]:
# ваш код здесь
