 # Занятие 3. Передача аргументов по ссылке и значению. Генераторы списков. Регулярные выражения. Работа с файлами. Модули. Обработка ошибок.

## 1. Передача аргументов по ссылке и значению.

Как передаются переменные по ссылке или значению определяется в зависимости от передаваемого типа данных.

В Python существует два типа объектов: 

### Неизменяемые (immutable)

Неизменяемые объекты передаются _по значению_. 

Это значит, что при изменении значения переменной будет создан новый объект. К этому типу относятся: 
- числовые данные (int, float, complex) 
- символьные строки (str) 
- кортежи (tuple) 

Вы не можете изменить сам объект, т.е. когда вы присвоите переменной новое значение, интерпретатор создаст новый объект (если до этого этот объект был создан, то переменная просто получит ссылку), а первоначальный объект удалится из памяти сбощиком мусора, если ссылок на него больше нет.

In [None]:
n1 = 2
n2 = n1
n2 = 4
print(n1, n2)

### Изменяемые (mutable)

Изменяемые объекты передаются _по ссылке_. Это значит, что при изменении значения переменной объект будет изменен. К этому типу относятся: 
- списки (list) 
- множества (set) 
- словари (dict)

In [None]:
sp1 = [1,2,3]
sp2 = sp1
sp2.append(4)
print(sp1)

###  Подводные камни

In [None]:
print(id(n1))
print(id(n2))

In [None]:
print(id(sp1))
print(id(sp2))

In [None]:
def modify(lst):
    """
    Добавляет к передаваемому аргументу элемент 'new',
    lst - список, передаваемый на вход функции
    """
    lst.append('new')
    return lst

In [None]:
?modify

In [None]:
my_list = [1,2,3]
mod_list = modify(my_list)
print(mod_list)
print(my_list)

In [None]:
my_list = [1,2,3]
mod_list = modify(my_list[:])
print(mod_list)
print(my_list)

In [None]:
temp = [1, 3, 5]

In [None]:
temp[:]

In [None]:
print(id(temp[:]))
print(id(temp))

## 2. Генераторы списков.

In [4]:
import random
lst = []
for i in range(10):
    lst.append(random.randint(-10,10))
print(lst)

[2, -3, 7, 2, 8, -3, -2, 1, 1, 2]


In [5]:
[random.randint(-10,10) for i in range(10)]

[-5, -3, -9, 4, -2, 9, 1, -7, -8, 5]

In [6]:
lst_g = [i**2 for i in range(10)]
lst_g

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [7]:
only_positive = [i for i in lst if i >= 0]
only_positive

[2, 7, 2, 8, 1, 1, 2]

<font color='blue'>**Задание 1.**</font>

Создайте список четных чисел от 0 до 10, к каждому значению прибавьте 14

## 3. Регулярные выражения.

**Регулярное выражение** — это строка, задающая шаблон поиска подстрок в тексте.

Чаще всего регулярные выражения используются для:
- поиска в строке
- разбиения строки на подстроки
- замены части строки

В Python для работы с регулярными выражениями есть модуль re:

In [23]:
import re

### Поиск в строке

In [None]:
# Строка, в которой будет осуществлен поиск:
string = 'ДРП: Объем данной нефтебазы ДРП1234567 составляет 12000 тонн'

Метод _match()_ ищет по заданному шаблону в начале строки:

In [None]:
print(re.match('ДРП', string)) # Шаблон найден в строке
print(re.match('тонн', string)) # Шаблон не найден в строке

Метод _search()_ ищет по всей строке, но возвращает только первое найденное совпадение:

In [None]:
print(re.search('тонн', string)) # Шаблон найден в строке
print(re.search('тоннн', string)) # Шаблон не найден в строке

In [None]:
print(re.match('ДРП', string).group()) # Вывод содержимого исходной строки
print(re.search('тонн', string).group()) # Вывод содержимого исходной строки

Метод _findall()_ этот метод возвращает список всех найденных совпадений:

In [None]:
print(re.findall('ДРП', string))
print(re.findall('Привет', string))

###  Разбиение строки

In [None]:
string # Вспомним какая у нас задана строка

Метод _split()_ разделяет строку по заданному шаблону:

In [None]:
re.split(' ', string)

In [None]:
re.split(' ', string, maxsplit = 1)

###  Замена части строки

Метод _sub()_ ищет шаблон в строке и заменяет его на указанную подстроку, если шаблон не найден, строка остается неизменной:

In [None]:
re.sub('ДРП', 'DRP', string)

### Операторы

Мы рассмотрели поиск определенной последовательности символов. Но часто случается так, что нет определенного шаблона, и нам надо вернуть набор символов из строки, отвечающий определенным правилам. Такая задача часто стоит при извлечении информации из строк. Это можно сделать, написав выражение с использованием специальных символов. Вот наиболее часто используемые из них:

Оператор | Значение
------|----------
.     | Один любой символ, кроме новой строки \n.
?     | 0 или 1 вхождение шаблона слева (указывает число повторений)
+     | 1 и более вхождений шаблона слева (указывает число повторений)
*     | 0 и более вхождений шаблона слева (указывает число повторений)
\w     | Любая цифра или буква
\W     | Все, кроме буквы или цифры
\d     | Любая цифра
\D     | Все, кроме цифры
\s     | Любой пробельный символ
\S     | Любой непробельный символ
\b     | Граница слова
[..]     | Один из символов в скобках
[^..]     | Любой символ, кроме тех, что в скобках
\     | Экранирование специальных символов (\\. означает точку или \\+ — знак «плюс»)
^ и $     | Начало и конец строки соответственно
{n,m} | От n до m вхождений ({,m} — от 0 до m)
a\|b | Соответствует a или b
() | Группирует выражение и возвращает найденный текст
\t, \n, \r | Символ табуляции, новой строки и возврата каретки соответственно

In [24]:
pattern = '[0-9]'
string = 'Объем данной нефтебазы ДРП1234557 составляет 12000 тонн'
print(re.findall(pattern, string))

['1', '2', '3', '4', '5', '5', '7', '1', '2', '0', '0', '0']


In [None]:
pattern = '\d+'
string = 'Объем данной нефтебазы ДРП1234557 составляет 12000 тонн'
print(re.findall(pattern, string))

In [27]:
pattern = ' ([0-9]+)'
string = 'Объем данной нефтебазы ДРП1234557 составляет 12000 тонн'
print(re.findall(pattern, string))

['12000']


In [26]:
pattern = 'тонн$'
string = 'Объем данной нефтебазы ДРП1234557 составляет 12000 тонн'
print(re.findall(pattern, string))

['тонн']


In [25]:
pattern = '^тонн'
string = 'Объем данной нефтебазы ДРП1234557 составляет 12000 тонн'
print(re.findall(pattern, string))

[]


Методом compile() можно собрать регулярное выражение в отдельный объект, который может быть использован для поиска. Это также избавляет от переписывания одного и того же выражения.

In [28]:
log = [
    'Данные собраны в [DATAMARTS.dbo.FULL_CENTER_REALIZACIYA]'
    'АЗС=1 Площадь=120 Время простоя=3 чaca',
    'Данные собраны в [DATAMARTS.dbo.FULL_CENTER_REALIZACIYA]'
    'АЗС=2 Площадь=64 Время простоя=24 чaca',
    'Данные собраны в [DATAMARTS.dbo.FULL_CENTER_REALIZACIYA]'
    'АЗС=3 Площадь=130 Время простоя=56 часов',
    'Данные собраны в [DATAMARTS.dbo.FULL_CENTER_REALIZACIYA]'
    'АЗС=4 Площадь=84 Время простоя=13 часов']
pattern = re.compile('(АЗС=\d).*(Время простоя=\d+ [час]\w+)')
result = []
for line in log:
    result.append(pattern.search(line).groups())
print(result)

[('АЗС=1', 'Время простоя=3 чaca'), ('АЗС=2', 'Время простоя=24 чaca'), ('АЗС=3', 'Время простоя=56 часов'), ('АЗС=4', 'Время простоя=13 часов')]


In [None]:
#'(АЗС=[\d]).*(Время простоя=[\d]+ [час]\w+)'
# () - извлекаем то, что в скобках
# [] - один из символов
# \d - любая цифра
# \w - любая цифра или буква
# \S - любой не пробельный символ
# . - любой символ
# * - любая последовательность символов начиная с 0
# + - любая последовательность символов начиная с 1

<font color='blue'>**Задание 2.**</font>

Вывести кортеж с текстом ("Реализовано клиенту = ...", "в объеме = ... тонн")

In [None]:
Data_fuel = [
    'Реализовано клиенту = Лукойл, топлива типа = АИ-92, по ж/д, в объеме = 3200 тонн',
    'Реализовано клиенту = Роснефть, топлива типа = АИ-95, по ж/д, в объеме = 2200 тонн',
    'Реализовано клиенту = Транснефть, топлива типа = АИ-95, по ж/д, в объеме = 1200 тонн',
    'Реализовано клиенту = ИП_Кудряшов, топлива типа = ДТ Летнее, автотранспортом, в объеме = 800 тонн',
    ]

### Отключение экранирования

Символ 'r' (в любом регистре), отключает механизм экранирования. <br>
Экранированные последовательности - служебные символы. <br>
Экранированные последовательности позволяют вставить символы, которые сложно ввести с клавиатуры, например перевод строки (аналог Enter в текстовых редакторах, это /n)<br>
<br>
**Пример:**

In [None]:
print('Привет,\nКак дела?')

In [None]:
print(r'Привет,\nКак дела?')

Про экранированные последовательности можно почитать, например, здесь: https://pyprog.pro/python/py/str/esqape_sec.html

<font color='blue'>**Задание 3.**</font>

Придумайте шаблон для решения следущих задач:
1. Вернуть первое слово из строки:

In [None]:
string = 'ДРП: Объем данной нефтебазы ДРП1234567 составляет 12000 тонн'

In [None]:
# pattern = ?
# re.findall(pattern, string)

2. Вернуть первые два символа каждого слова:

In [None]:
# pattern = ?
# re.findall(pattern, string)

3. Вернуть список доменов из списка адресов электронной почты:
    * только @gmail и пр.
    * только gmail и пр.
    * только @gmail.com и пр.
    * только com и пр.

In [None]:
string = 'abc.test@gmail.com, xyz@test.ru, test.first@analyticsvidhya.com, qwerty.test@rest.ru'

In [None]:
# pattern = ?
# re.findall(pattern, string)

4. Извлечь из строки:
    * Дату
    * Год

In [None]:
string = 'Amit 34-3456 12-05-2007, XYZ 56-4532 11-11-2011, ABC 67-8945 12-01-2009'

In [None]:
# pattern = ?
# re.findall(pattern, string)

5. Проверить телефонный номер (длина 10 знаков и начинается на 8 или 9):

In [None]:
string = ['9999999999', '999999-999', '9887t9999', '898765453']

In [None]:
# pattern = ?

# for number in string:
#     if re.findall(pattern, number):
#         print('Yes')
#     else:
#         print ('No')

## 4. Работа с файлами.

Прежде, чем работать с файлом, его надо открыть. С этим справится встроенная функция open():

In [None]:
f = open('requirements.txt', 'r', encoding = 'UTF-8') # Cодержит 3 аргумента

Обозначения режимов открытия файла:
- 'r'	открытие на чтение (является значением по умолчанию).
- 'w'	открытие на запись, содержимое файла удаляется, если файла не существует, создается новый.
- 'x'	открытие на запись, если файла не существует, иначе исключение.
- 'a'	открытие на дозапись, информация добавляется в конец файла.
- 'b'	открытие в двоичном режиме.
- 't'	открытие в текстовом режиме (является значением по умолчанию).
- '+'	открытие на чтение и запись

Когда мы открыли файл,мы хотим прочитать из него информацию. Для этого есть два основных способа:

- Первый - метод read, читающий весь файл целиком, если был вызван без аргументов, и n символов, если был вызван с аргументом (целым числом n).

In [None]:
f = open('requirements.txt', 'r', encoding = 'UTF-8')
f.read() # Читаем все, что есть в файле

In [None]:
f = open('requirements.txt', 'r', encoding = 'UTF-8')
f.read(13) #Читаем первые 13 символов

- Второй способ - прочитать файл построчно, воспользовавшись циклом for:

In [None]:
f = open('requirements.txt', 'r', encoding = 'UTF-8')
for line in f:
    print(line, end = '')

Модуль os предоставляет множество функций для работы с операционной системой, причём их поведение, как правило, не зависит от ОС, поэтому программы остаются переносимыми.

In [90]:
import os

In [91]:
os.name # Имя операционной системы, доступные варианты: 'posix', 'nt', 'java'

'posix'

In [None]:
os.getcwd() # Текущая рабочая директория

In [None]:
# os.chdir(path) - Смена текущей директории

In [None]:
# os.path - Позволяет работать с путями к файлам и папкам

In [None]:
# Не самый хороший способ задания пути:
path = 'requirements.txt'
# Хороший кроссплатформенный метод указания пути:
path = os.path.join('requirements.txt')

In [None]:
dir_path = os.path.join(os.getcwd(), 'NewDir')
os.mkdir(dir_path) # Создаёт директорию

In [None]:
f = open(path, 'r', encoding = 'UTF-8')
for line in f:
    print(line)

In [43]:
path = os.path.join('requirements.txt')
f = open(path, 'r', encoding = 'UTF-8')
symbol = 'numpy'
for line in f:
# Считываем файл построчно
    if symbol in line: # Пока не найдем нужную информацию
        print(line)
        break

NameError: ignored

Запись в файл осуществляется с помощью метода write:

In [None]:
my_file = open('some.txt', 'a')
my_file.write('Python is a very interesting programming language! \nI like it!\n')
my_file.close()

In [None]:
with open('requirements.txt') as file_in:
    text = file_in.read()

text = text.replace('tensorflow_gpu', 'Unknown package')

with open('test.txt', 'w') as file_out:
    file_out.write(text)

<font color='blue'>**Задание 4.**</font>

1. Прочитайте построчно и выведите информацию из файла "test.txt"
2. Убедитесь, что замена из предыдущей ячейки была произведена корректно

## 5. Модули.

### Подключение модуля

In [None]:
16 ** 0.5

In [None]:
sqrt(16)

In [None]:
import math
math.sqrt(16)

In [None]:
sqrt(16)

In [None]:
from math import sqrt
sqrt(37)

In [None]:
from math import sqrt, sin, cos
print(sin(0.4))
print(cos(0.4))

### Разделение пространства имен

In [None]:
from math import * # Импортируем все имена из данного модуля

Возможно, у вас возникнет соблазн использовать этот метод, поскольку он позволяет вам напрямую использовать функцию без добавления имени модуля в качестве префикса. Тем не менее, он очень подвержен ошибкам, и вы также теряете возможность сказать, какой модуль фактически импортировал функцию

In [None]:
from math import *
log10(125)

In [None]:
from cmath import *
log10(125)

In [None]:
log10(125)

In [None]:
math.log10(125)

### Создание собственных модулей

In [None]:
import lib.lib1 as lib1
print(lib1.do_something())
print(lib1.more(8))

In [None]:
# def do_something():
#     return 'Hello'
# def more(num):
#     return num > 1

<font color='blue'>**Задание 5.**</font>

1. Создайте папку moduls
2. В папке moduls создать модуль на вход которому подается любая строка, а алгоритм возвращает список, в котором будут все большие буквы из входящей строки. Вызвать модуль.
3. В папке moduls создать модуль, в котором должен быть следующий алгоритм: на вход модуля подается число, на выходе получаем список со случайно сгенерированными положительными числами от 1 до 10, длина которого равна входящему числу. Вызвать модуль.
4. В папке moduls создать модуль на вход которому подается любая строка, а алгоритм возвращает словарь, в котором ключами являются буквы, а значениями количество этих букв в строке. Вызвать модуль.

In [None]:
# Подсказка к пункту 3, можно использовать метод .count()
'abfdvdwedaa'.count('a')

## 6. Обработка ошибок.

In [1]:
100/0
2 + 2

ZeroDivisionError: ignored

In [None]:
int('Hello')

In [None]:
n = '10'
# n = 'Hello'
try:
    n = int(n)
    print('n успешно преобразована к типу Int')
except ValueError: # Тип ошибки
    print('значение n невозможно преобразовать к типу int')

In [None]:
f = 'asdf'
# f = 2
try:
    f + 1
except Exception:
    print('Это что ещё такое?')
else:
    print('Всё хорошо.')
finally:
    print('Я закрыл файл.')
# Именно в таком порядке: try, except, затем else, и только потом finally.

In [3]:
%load hw03.py

**ДЗ №3**

Задача №1

In [15]:
import random
lst = []
for i in range(10):
    lst.append(random.randint(-10,20))
print(lst)

lst2 = [i**2 for i in lst]
print(lst2)

[2, 17, 2, 3, 18, 17, 9, 17, 18, 11]
[4, 289, 4, 9, 324, 289, 81, 289, 324, 121]


Задача №2

In [17]:
frukt1 = ['яблоко','банан','мандарин','','персик','киви', 'хурма']
frukt2 = ['банан','ананас','киви','лимон','персик', 'гранат']
frukt3 = [i for i in frukt1 if i in frukt2]
print(frukt3)

['банан', 'персик', 'киви']


*Задача* №3

In [21]:
import random
lst = []
for i in range(100):
    lst.append(random.randint(-10,150))
print('изначальный список - ',lst)
lst2 = [i for i in lst if i>0 and i%3 == 0 == i%4]
print('список по условиям - ',lst2)

изначальный список -  [146, 23, 124, 4, 134, 68, 74, 101, 137, 106, 68, 147, 150, 126, 72, 37, 25, 77, 67, -9, 90, -3, -10, 1, 9, 39, 13, 27, 84, 140, 34, 13, 82, 37, 143, 98, 7, 124, 91, 13, 57, 94, 9, 134, 146, 1, 113, 82, 113, 96, 41, 100, 91, 126, 5, 36, 95, 139, 146, 88, 55, 95, 38, 126, -9, 147, 101, 70, 108, 147, 105, 72, 40, 51, 32, 96, 103, 54, 73, 89, -3, 2, 124, 22, 111, 15, 150, 29, 43, 112, 27, 1, 6, 48, 140, 28, 3, 88, 21, 54]
список по условиям -  [72, 84, 96, 36, 108, 72, 96, 48]


Задача №4

Задача №5

Задача №6

In [46]:
import os
import random
import re

file = open("file.py", "w+")
i = 0
a = ''
while i < 2500:
    i = i + 1
    a = a + str(random.randint(0,10))
file.write(a)
file.close()

file = open("file.py", "r")
f = file.read()

print(f)

1030428323255379564236595062261070589027301738107238110055210861012693129922122400024159202559467159400535106866051000763992410402553856058296647103031018861710100010125993109970285210281884374577128010098530107001040597110714107101810841061707051661053732310699777442180010660117532476946301134538832205010036339488202668858918939861017910109799902868359536096410691005025020108591703610109598036385710589001030244513101076015966644107322119249010792070100699921010491510289851103108563101035689915426056310061054210775466002370661072107110952823104105914522539219030901036292910458771750109875731010708108200310101016917041037110349755981462060028929496370786476510386610995956770395616106103108310529847355173748816100104569601819734044476311024791096410351584907109128010382509101511014322714147510359104889910151628101101207122610872513718761564764373207450810045725339490745103888940574383872382143526078782710676011384831845555578440181749822861100117945933610320181082687583582288812113728335

Задача №7

Задача №8

Задача №9

[19, 10, 4, 0, 18, 11, 12, 11, 17, 1]
[361, 100, 16, 0, 324, 121, 144, 121, 289, 1]
