# Работа с Git

** [Установка git](https://git-scm.com/book/en/v2/Getting-Started-Installing-Git) **

*$ sudo apt-get install git-all*

**Если не получилось**, то попробуйте так:

*sudo apt-get purge runit*

*sudo apt-get purge git-all*

*sudo apt-get purge git*

*sudo apt-get autoremove*

*sudo apt update*

*sudo apt-get install git-daemon-sysvinit*

*sudo apt-get install git-all*

**Создаём акаунт** на [GitHub](https://github.com/)

Создаём у себя в профиле новый репозиторий

Ссылка на репозиторий нашего курса: https://github.com/arinaaageeva/python_nlp_2.git

**Создаём папочку** у себя на компьютере

Запускаем командную строку и переходим в созданную нами папку с помощью команды *cd*

Выполняем команду: *git init*

Связываем репозиторий на GitHub с локальным (папочкой на компьютере):

*git remote add origin <url>*  

Что бы добавить некоторый объект в репозиторий выполняем: 

*git add <объект>*

*git commit -m '<ваш коментарий>'*

*git push -u origin master*

**Клонируем репозиторий** на компьютер:

*git clone <url>*

# Введение в Python

## Система типов

**Язык программирования** – формальная знаковая система, предназначенная для записи компьютерных программ. Язык программирования определяет набор лексических, синтаксических и семантических правил, задающих внешний вид программы и действия, которые выполнит исполнитель (компьютер) под ее управлением.

Современные цифровые компьютеры являются двоичными и данные хранят в двоичном (бинарном) коде (хотя возможны реализации и в других системах счисления). Эти данные как правило отражают информацию из реального мира (имена, банковские счета, измерения и др.), представляющую высокоуровневые концепции.

Особая система, по которой данные организуются в программе – это **система типов языка программирования**. Языки могут быть классифицированы как системы со **статической типизацией** и языки с **динамической типизацией**.

При **статической типизации** переменная, параметр программы, возвращаемое значение функции связывается с типом в момент объявления и тип не может быть изменён позже. Примеры статически типизированных языков – Ада, С++, Java, Паскаль. Статически-типизированные языки могут быть в дальнейшем подразделены на языки с обязательной деклара-
цией, где каждая переменная и объявление функции имеет обязательное объявление типа, и языки с выводимыми типами.

Плюс статической типизации: хороша для написания сложного, но быстрого кода; многие ошибки исключаются уже на стадии компиляции.

Минус статической типизации: тяжело работать с данными из внешних источников.

При **динамической типизации** переменная связывается с типом в момент присваивания значения, а не в момент объявления переменной. Таким образом, в различных участках программы одна и та же переменная мо-
жет принимать значения разных типов. Примеры языков с динамической типизацией – **Python**, Ruby, PHP, Perl, JavaScript, Lisp.

Плюсы динамической типизации: (1) упрощается написание несложных программ; (2) иногда требуется работать с данными переменного типа (например, функция поиска подстроки возвращает позицию найденного символа или маркер "не найдено"); (3) облегчается работа с СУБД, которые принципиально возвращают информацию в "динамически типизированном" виде.

Минусы динамической типизации: (1) не позволяет заметить при компиляции простые "ошибки по недосмотру" – требуется как минимум выполнить данный участок кода; (2) снижение производительности из-за трат процессорного времени на динамическую проверку типа.

## Базовые типы данных

### Числа

In [17]:
a=1
print('a=%.5fi'%a)

a=1.00000i


In [1]:
a = 1
print('a = %d'%a, type(a))
a = 1.0
print('a = %d'%a, type(a))
a = complex(1, 1)
print('a = %.1f+%.1fi'%(a.real, a.imag), type(a))

a = 1 <class 'int'>
a = 1 <class 'float'>
a = 1.0+1.0i <class 'complex'>


**Пример приведение типов**

In [3]:
a = 1
b = 3

c = a/b

print('a =', a, type(a))
print('b =', b, type(b))
print('c =', c, type(c))

a = 1 <class 'int'>
b = 3 <class 'int'>
c = 0.3333333333333333 <class 'float'>


**"Ошибки" приведения типов**

Равны ли *a* и *b*?

In [9]:
a = 0.3 
b = 3 * 0.1 #питон считает с погрешностями десятичные числа

In [31]:
print(8*0.1)

0.8


Невероятно, но факт: Нет =)

In [6]:
a == b

False

In [11]:
print('a =', a)
print('b =', b)

a = 0.3
b = 0.30000000000000004


**Стандартные опирации с числами**

Кроме деления (/) и умножения (\*), очевидно, ещё можно производить сложение (+) и вычитание (-).

А также:

In [12]:
#деление без остатка
a = 1//3
print('a =', a, type(a))

a = 0 <class 'int'>


In [14]:
#остаток от деления
a = 5%2
print('a =', a, type(a))

a = 1 <class 'int'>


In [15]:
#возведение в степень
a = 5**2
print('a =', a, type(a))

a = 25 <class 'int'>


Много других возможностей для работы с числами можно найти в модуле [math](https://docs.python.org/3/library/math.html) 

In [17]:
import math 

pi_number = math.pi
print('Pi = %.6f'%pi_number)

sqrt_pi = math.sqrt(math.pi)
print('sqrt(Pi) = %.6f'%sqrt_pi)

Pi = 3.141593
sqrt(Pi) = 1.772454


### Логические переменные

In [36]:
True, False

(True, False)

In [37]:
print('1 == 0 - %r\n1 > 0 - %r\n1 != 0 - %r'%(1 == 0, 1 > 0, 1 != 0))

1 == 0 - False
1 > 0 - True
1 != 0 - True


In [38]:
print('0 -> %r\n1 -> %r\n'%(bool(0), bool(1)))
print('[] -> %r\n[None] -> %r\n'%(bool([]), bool([None])))

0 -> False
1 -> True

[] -> False
[None] -> True



### Списки

-- упорядоченные по местоположению коллекции объектов произвольных типов, размер которых не ограничен

In [18]:
my_list = [1, 'a', [2, 'b']]
print(my_list, type(my_list))
print('Длинна списка - %d'%len(my_list))
print('Нулевой элемент списка равен -', my_list[0], ', а последний -', my_list[-1])

[1, 'a', [2, 'b']] <class 'list'>
Длинна списка - 3
Нулевой элемент списка равен - 1 , а последний - [2, 'b']


**Срезы**

In [19]:
print('Срез от 0 элемента до 2 второго (2ой не включается):', my_list[0:2]) 

Срез от 0 элемента до 2 второго (2ой не включается): [1, 'a']


Аналогично my_list[0:2] можно записать my_list[:2].

Если номер левой границы среза опущен, то по уполчанию отсчет идет от начала списка т.е. от позиции 0.

Если опущен номер правой границы (правая граница не включается при срезе), то по умолчанию берутся все элементы до конца списка.

In [20]:
print('Срез от 1 элемента до конца списка:', my_list[1:]) 

Срез от 1 элемента до конца списка: ['a', [2, 'b']]


Отрицательные индексы также работают.

In [22]:
print('Срез от первого с конца элемента (-1) до конца списка:', my_list[-1:])

Срез от первого с конца элемента (-1) до конца списка: [[2, 'b']]


**Особенность оператора присваивания для списков**

In [26]:
array1 = [1, 2, 3]
array2 = array1
print('array2:', array2)

array2[1] = 4
print('array2:', array2)

#чему равен array1?
print('array1:', array1)

array2: [1, 2, 3]
array2: [1, 4, 3]


Если хочется этого избежать, то можно воспользоваться методом *copy* или модулем [copy](https://docs.python.org/2/library/copy.html)

In [None]:
array1 = [1, 2, 3]
array2 = array1.copy()
print('array2:', array2)

array2[1] = 4
print('array2:', array2)

print('array1:', array1)

**Опирации над списками**

In [29]:
array1 = [1, 2, 3]
array1.append(4)
print('1.', array1)
print('2.', array1.pop(), array1)
print('3.', array1.pop(1), array1)

array1 = array1 + [7, 5] # array1 += [7, 5]
print('4.', array1)

print('5.', array1.sort(), array1)
array1 = [1, 3, 7, 5]
print('6.', sorted(array1), array1)

array1.reverse()
print('7.', array1)

1. [1, 2, 3, 4]
2. 4 [1, 2, 3]
3. 2 [1, 3]
4. [1, 3, 7, 5]
5. None [1, 3, 5, 7]
6. [1, 3, 5, 7] [1, 3, 7, 5]
7. [5, 7, 3, 1]


**Оператор IF** 

In [None]:
if Test1: #Инструкция if c условным выражением Test1
    Statements1 #Ассоциированный блок 
elif Test2: #Необязательные части elif
    Statements2 
else: #Необязательный блок else
    Statements3 

In [39]:
a = [1, 2, 3]

if a != []:
    a.pop()
    print('1:', a)

if a:
    a.pop()
    print('2:', a)

1: [1, 2]
2: [1]


**Проход по списку (итерирование). Оператор FOR** 

In [None]:
for Target in Object: #Связывает элементы объекта с переменной цикла
    Statements #Повторяющееся тело цикла

In [40]:
a = []
b = []
for index in range(15):
    if 5 < index < 10: #index > 5 and index < 10
        a.append(index)
    if index < 5 or index > 10:
        b.append(index)
print('a = {} \nb = {}'.format(a, b))

a = [6, 7, 8, 9] 
b = [0, 1, 2, 3, 4, 11, 12, 13, 14]


** Задача 1. ** Сформировать список из чётных элементов.

In [21]:
A = [1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

In [24]:
result=[]
for i in A:
    if i%2==0:
        result.append(i)
print(result)

[4, 16, 36, 64, 100]


** Задача 2.** Сформировать список элементов, которые одновременно содержаться и в A, и в B (без дубликатов).

In [26]:
A = [1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89]
B = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13]

In [35]:
result=[]
for i in A:
    for j in B:
        if i==j and i not in result:
            result.append(j)
print(result)

[1, 2, 3, 5, 8, 13]


** Задача 3.** Придумать алгоритм, который позволил бы вырезать из списка все нулевые элементы и имел бы сложность O(n)

In [42]:
A = [1, 0, 0, 1, 0, 2, 3, 0, 0, 5, 0, 8, 13, 0, 0, 0]

In [50]:
j=0
for i in range(0,len(A)):  
    if A[i]!=0:
        A[j]=A[i]
        j+=1
A=A[0:j]
print(A)

[1, 2, 3, 4, 5, 6]


** Вложенные списки **

In [54]:
my_matrix = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

#вывести на экран диагональные элементы
print('Способ 1')

for i in range(len(my_matrix)):
    for j in range(len(my_matrix[i])):
        if i == j:
            print('my_matrix[%d][%d] = %d'%(i, j, my_matrix[i][j]))

print('Способ 2')
for i, row in enumerate(my_matrix):
    for j, element in enumerate(row):
        if i==j:
            print('my_matrix[%d][%d] = %d'%(i, j, element))

print('Способ 3')
for i, row in enumerate(my_matrix):
    print('my_matrix[%d][%d] = %d'%(i, i, row[i]))

print('Способ 4\n', [row[i] for i, row in enumerate(my_matrix)])

Способ 1
my_matrix[0][0] = 1
my_matrix[1][1] = 5
my_matrix[2][2] = 9
Способ 2
my_matrix[0][0] = 1
my_matrix[1][1] = 5
my_matrix[2][2] = 9
Способ 3
my_matrix[0][0] = 1
my_matrix[1][1] = 5
my_matrix[2][2] = 9
Способ 4
 [1, 5, 9]


**Задача 4.** Посчитать сумму всех элементов объекта my_matrix

In [56]:
result=0
for i in my_matrix:
    result+=sum(i)
print(result)

45


### Строки

In [18]:
string = 'Hello, World!'
print(string)
print(type(string))
print('Length %d'%len(string))

Hello, World!
<class 'str'>
Length 13


In [19]:
#отдельные символы строки можно извлечь с помощью выражений индексирования
for i in range(len(string)):
    print('Char %d -- %c'%(i, string[i]))

Char 0 -- H
Char 1 -- e
Char 2 -- l
Char 3 -- l
Char 4 -- o
Char 5 -- ,
Char 6 --  
Char 7 -- W
Char 8 -- o
Char 9 -- r
Char 10 -- l
Char 11 -- d
Char 12 -- !


In [20]:
#как и для списков придусмотрены срезы и возможность индексации в обратном порядке
print('%s %s'%(string[:5], string[-7:-1]))

Hello  World


In [21]:
#конкатенация строк
string+' I\'m born =)'

"Hello, World! I'm born =)"

Обратите внимание, что знак плюс (+) имеет различное значение для разных объектов: для чисел – сложение, а для строк – конкатенация. Это универсальное свойство языка Python, которое называется полиморфизмом, означает, что фактически выполняемая операция зависит от объектов, которые принимают в ней участие.

In [22]:
#строки неизменяемые!!!
string[0] = 'Y'

TypeError: 'str' object does not support item assignment

In [23]:
#методы специфичные для строк
begin_index_w = string.find('World')
begin_index_s = string.find('Space')

for word, begin_index in zip(['World', 'Space'], [begin_index_w, begin_index_s]):
    if begin_index != -1:
        print(('The '+word+' in the string starts with the %d')%begin_index)
    else:
        print('There is no '+word+' in the string')

The World in the string starts with the 7
There is no Space in the string


In [24]:
string.replace('World', 'Space')

'Hello, Space!'

In [25]:
words = string.split(',')
print('List:   %s'%words)
string = ','.join(words)
print('String: %s'%string)

List:   ['Hello', ' World!']
String: Hello, World!


In [26]:
'{0}; {1}'.format(string.upper(), string.lower())

'HELLO, WORLD!; hello, world!'

**Задача 5.** Определить процент строчных и прописных букв в строке 

In [5]:
string = 'В программировании, строковый тип (англ. string - нить, вереница) - тип данных, значениями которого является произвольная последовательность (строка) символов алфавита. Каждая переменная такого типа (строковая переменная) может быть представлена фиксированным количеством байтов либо иметь произвольную длину.'
print(string)

В программировании, строковый тип (англ. string - нить, вереница) - тип данных, значениями которого является произвольная последовательность (строка) символов алфавита. Каждая переменная такого типа (строковая переменная) может быть представлена фиксированным количеством байтов либо иметь произвольную длину.


In [67]:
#я решила, что время работы будет поменьше, если сразу добавить алфавит, а не собирать буквы из строки
upper='Й Ц У К Е Н Г Ш Щ З Х Ъ Ф Ы В А П Р О Л Д Ж Э Я Ч С М И Т Ь Б Ю Q W E R T Y U I O P A S D F G H J K L Z X C V B N M'
lower=upper.lower()
upper=upper.split(' ')
lower=lower.split(' ')

In [68]:
def count_letters(string,lower,upper):
    upper_count=0
    lower_count=0
    for i in string:
        if i in upper:
            upper_count+=1
        elif i in lower:
            lower_count+=1
    count=lower_count+upper_count
    return [lower_count/count,upper_count/count]

In [73]:
print(count_letters(string,lower,upper)[0]*100,'% строчных букв,',\
      count_letters(string,lower,upper)[1]*100,'% заглавных букв')

99.23076923076923 % строчных букв, 0.7692307692307693 % заглавных букв


**Задача 6. ** Вывести на экран самое длинное слово в строке string и его длинну

In [70]:
needed_symbols=upper+lower+[' ']

In [71]:
clean_str=string

for i in string:
    if i not in needed_symbols:
        clean_str=clean_str.replace(i,'')

In [72]:
def max_word(strings_list):
    maxx=0
    for i in strings_list:
        length=len(i)
        if length>maxx:
            maxx=length
            index_max=i
    return index_max, maxx   
print(max_word(clean_str.split()))

('последовательность', 18)


**Задача 7.** Проверить является ли палиндромом каждый элемент списка

In [25]:
Phrases = [u'Ежу хуже', u'Лев осовел', u'Зона заноз', u'Из искры возгорится пламя', u'Неуч учуен', u'Утоп в поту', 
           u'Маска как сам', u'Чем нежен меч', u'Отмывать деньги', u'Профессор кислых щей', u'Накрыться медным тазом', 
           u'Там холм лохмат', u'Он рёва наверно', u'Вид усов осудив', u'Лев с ума ламу свёл', u'Тёртый калач']

In [48]:
def is_palindrome(str):
    length=len(str)
    for i in range(0,length//2):
        if str[i]!=str[length-i-1]:
            return False
    return True

In [60]:
result={}
for i in Phrases:
    result[i]=is_palindrome(i.lower().replace(' ',''))
print(result)

{'Ежу хуже': True, 'Лев осовел': True, 'Зона заноз': True, 'Из искры возгорится пламя': False, 'Неуч учуен': True, 'Утоп в поту': True, 'Маска как сам': True, 'Чем нежен меч': True, 'Отмывать деньги': False, 'Профессор кислых щей': False, 'Накрыться медным тазом': False, 'Там холм лохмат': True, 'Он рёва наверно': False, 'Вид усов осудив': True, 'Лев с ума ламу свёл': False, 'Тёртый калач': False}
