# Введение в Python

## Работа с кодом

### Запуск интерпретатора через консоль

```python[3][.v]```

### Запуск исполняемого скрипта через консоль


```python3  my_first_script.py [-arg_1]```

## IDE (Integrated Development Environment)
* [PyCharm](https://www.jetbrains.com/ru-ru/pycharm/)


## CE (Code Editor)
* [VSCode](https://code.visualstudio.com)
* [Atom](https://atom.io/)
* [Sublime](https://www.sublimetext.com/)


## Тетрадки с кодом
* [Jupyter Notebook](https://jupyter.org/)
* [Google Cloud Colaboratory](https://colab.research.google.com/)

### Стиль оформления кода [pep8](https://peps.python.org/pep-0008/)*

*Самое главное из PEP8:*  
- отступ – 4 пробела
- длина строки < 80 символов
- переменные: var_recommended
- константы: CONST_RECOMMENDED

*(если Вы хороший человек).

In [None]:
import this

## Стандартные типы данных
https://docs.python.org/3/library/stdtypes.html

In [None]:
# Целое число integer -> int
# a = int(7)
a = 7

# Число с плавающей запятой -- float -> float
# b = float(3.14)
b = 3.14

# Текстовая последовательность -- string -> str
# c = str("Текст 1")
с = "Текст 1"
d = "Текст 2"
e = """Текст 3 может быть длинным и
можно переносить его на новые строки
можно переносить его на новые строки
можно переносить его на новые строки
можно переносить его на новые строки"""

# Логичекая переменная -- boolean -> bool
# f = bool(1)
f = True


# Списки list -> list
# g = list("123456789")
g = [1, 2, 3, 4, 5, 6, 7, 8, 9]

# Множества и словари -> set, dict
# h = set(["A", "B", "C"])
h = {"A", "B", "C"}

# i = dict((("key1", 1), ("key2", 2), ("key3", 3)))
i = {"key1": 1, "key2": 2, "key3": 3}

# И многие другие...

In [None]:
# Аннотации типов
a: int = 1
b: float = 3.14
c: str = "qwerty"

In [None]:
# строки форматирования
# https://docs.python.org/3/library/string.html#formatstrings

f"{0.2 + 0.1} > {0.3}, {0.7+0.1} < {0.7+0.1:.2f}"

'0.30000000000000004 > 0.3, 0.7999999999999999 < 0.80'

# Задания


In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive



### Задание 1. Таблица умножения
Вывести на экран таблицу умножения. Обратите внимание, что первая строка и столбец - заголовки.
```
    1  2  3  4  5  6  7  8  9 10
 1  1  2  3  4  5  6  7  8  9 10
 2  2  4  6  8 10 12 14 16 18 20
 3  3  6  9 12 15 18 21 24 27 30
 4  4  8 12 16 20 24 28 32 36 40
 5  5 10 15 20 25 30 35 40 45 50
 6  6 12 18 24 30 36 42 48 54 60
 7  7 14 21 28 35 42 49 56 63 70
 8  8 16 24 32 40 48 56 64 72 80
 9  9 18 27 36 45 54 63 72 81 90
10 10 20 30 40 50 60 70 80 90 100
```
Используйте форматированный вывод (f-строки)
Отменить принудительный перевод каретки на новую строку можно, указав параметр `end=''`  
`print(str, end='')`

In [None]:
print("    ", end="")
for i in range(1, 11):
    print(f"{i:4}", end="")
print()

for i in range(1, 11):
    print(f"{i:2}  ", end="")
    for j in range(1, 11):
        print(f"{i * j:4}", end="")
    print()

       1   2   3   4   5   6   7   8   9  10
 1     1   2   3   4   5   6   7   8   9  10
 2     2   4   6   8  10  12  14  16  18  20
 3     3   6   9  12  15  18  21  24  27  30
 4     4   8  12  16  20  24  28  32  36  40
 5     5  10  15  20  25  30  35  40  45  50
 6     6  12  18  24  30  36  42  48  54  60
 7     7  14  21  28  35  42  49  56  63  70
 8     8  16  24  32  40  48  56  64  72  80
 9     9  18  27  36  45  54  63  72  81  90
10    10  20  30  40  50  60  70  80  90 100


### Задание 2.
Создать строку из 1000 символов `A`. Преобразовать эту строку по следующему правилу:
* `AAA` заменить на `B`
* `BBB` заменить на `C`
* `CCC` заменить на `A`
* Повторять, пока есть совпадения

https://docs.python.org/3/library/stdtypes.html#str.replace


In [None]:
s = 'A'*1000
while("AAA" in s or "BBB" in s or "CCC" in s):
  s = s.replace("AAA","B").replace("BBB","C").replace("CCC","A")

s


'ACAA'

### Задание 3. Палиндром
Напишите функцию для проверки, является ли фраза палиндромом.

https://docs.python.org/3/glossary.html#term-function

In [None]:
import string

def isPalindrom(s):
    return s.strip().replace(" ", "").lower() == s.strip().replace(" ", "").lower()[::-1]

b = isPalindrom("adasdASDC")
print(b)
b = isPalindrom("Лепс спел")
print(b)
b = isPalindrom("101")
print(b)
b = isPalindrom("А роза упала на лапу Азора")
print(b)

False
True
True
True


### Задание 4. Генерация
Сгенерировать списки из 1000 элементов:
- **rnd**: список случайных целых чисел от -100 до 100
- **uni**: список, состоящий из целых значение из равномерного распределения [50, 100]
- **gauss_1**: список, заполненный значениями из нормальных распределений с параметрами $\mu=0, \sigma^2=1$
- **gauss_2**: список, заполненный значениями из нормальных распределений с параметрами $\mu=50, \sigma^2=81$

https://docs.python.org/3/library/random.html#module-random

In [None]:
from random import randint, uniform, gauss

rnd = [randint(-100, 100) for i in range(1000)]
uni = [uniform(50, 100) for i in range(1000)]
gauss_1 = [gauss(0, 1) for i in range(1000)]
gauss_2 = [gauss(50, 9) for i in range(1000)]

print(len(rnd))
print(len(uni))
print(len(gauss_1))
print(len(gauss_2))
# rnd
# uni
# gauss_1
# gauss_2

1000
1000
1000
1000


### Задание 5. Удаляем выбросы
Напишите функцию, создающую копию списка с исключенными из него n наибольшими и наименьшими значениями и возвращающую ее в качестве результата. Порядок следования элементов в измененном списке не обязательно должен в точности совпадать с источником.  
Продемонстрируйте работу функции на нескольких списках.


In [None]:
from typing import List
def deleteNLargestAndSmallestValues(lst: List, n : int):
  if(n < 0):
    return []
  elif(n==0):
    return lst.copy()
  l = lst.copy()
  l.sort()
  return l[n:-n]


lst = [1,2,3,4,5,6,7,8,9,10]
newlist = deleteNLargestAndSmallestValues(lst,2)
print(newlist)

lst = [1,2,3,4]
newlist = deleteNLargestAndSmallestValues(lst,1)
print(newlist)

lst = [1,2,3,4,5,6,7,8,9,10]
newlist = deleteNLargestAndSmallestValues(lst,0)
print(newlist)

[3, 4, 5, 6, 7, 8]
[2, 3]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]


### Задание 6. Избавляемся от дубликатов
Прочитать файл `double.txt`. Вывести его содержимое. Затем вывести все уникальные слова.

Файлы ищутся по абсолютному или относительному пути.   Разместите файл в одной папке с файлом ноутбука или скрипта.  
https://docs.python.org/3/library/functions.html#open

In [None]:
with open('/content/drive/MyDrive/Data Mining/double.txt', 'r') as f: #папка content
  text = f.read()
  print(text)
  st = set(text.split())
  print(st)


apple banana orange grape pineapple strawberry blueberry raspberry watermelon melon kiwi mango peach pear cherry plum lemon lime grapefruit apricot apple banana orange grape pineapple strawberry blueberry raspberry watermelon melon kiwi mango peach pear cherry plum lemon lime grapefruit apricot apple banana orange grape pineapple strawberry blueberry raspberry watermelon melon kiwi mango peach pear cherry plum lemon lime grapefruit apricot apple banana orange grape pineapple strawberry blueberry raspberry watermelon melon kiwi mango peach pear cherry plum lemon lime grapefruit apricot apple banana orange grape pineapple strawberry blueberry raspberry watermelon melon kiwi mango peach pear cherry plum lemon lime grapefruit apricot
{'banana', 'apricot', 'orange', 'melon', 'mango', 'raspberry', 'strawberry', 'peach', 'pineapple', 'cherry', 'grape', 'lemon', 'blueberry', 'lime', 'grapefruit', 'pear', 'apple', 'watermelon', 'kiwi', 'plum'}


### Задание 7. Мода
Прочитать файл `mode.txt`. Удалить все знаки препинания. Найти самое "модное" слово.

  

In [None]:
import string

with open("/content/drive/MyDrive/Data Mining/mode.txt", 'r') as f:
    text = f.read().lower()

translator = str.maketrans('', '', string.punctuation)
text_without_punctuation = text.translate(translator)

words = text_without_punctuation.split()

word_count = {}
for word in words:
    if word in word_count:
        word_count[word] += 1
    else:
        word_count[word] = 1

most_common_word = max(word_count, key=word_count.get)
print(f"Самое модное слово: {most_common_word}")

Самое модное слово: и


### Задание 8. Мода-2
В том же файле найти топ-5 самых часто встречаемых слова, кроме предлогов и союзов. Вывести эти слова и их частоту.

In [None]:
import string
from collections import Counter

with open("/content/drive/MyDrive/Data Mining/bad_words.txt", 'r') as f:
    bad_words = set(f.read().split())

with open("/content/drive/MyDrive/Data Mining/bad_words.txt", 'r') as f:
    text = f.read().lower()

translator = str.maketrans('', '', string.punctuation)
text_without_punctuation = text.translate(translator)

lst = text_without_punctuation.split()

summary = [word for word in lst if word not in bad_words]

word_count = Counter(summary)

top_5_words = word_count.most_common(5)

print("Топ-5 самых часто встречаемых слов:")
for word, count in top_5_words:
    print(f"{word}: {count} раз")

Топ-5 самых часто встречаемых слов:
она: 412 раз
алиса: 406 раз
я: 396 раз
это: 263 раз
он: 177 раз


### Задание 9. CSV-файл
Прочитайте "data.csv". Для каждой колонки выведите минимальное, максимальное, среднее значение и дисперсию.
Должна получиться таблица типа следующей:
```
      col_1   col_2  ... col_n
min       0      -3        100
max       1      10        900
avg     0.5       7        641
sig    0.25       3        150
```

In [None]:
import csv
import numpy as np


with open("/content/drive/MyDrive/Data Mining/data.csv", "r") as file:
    reader = csv.reader(file)
    headers = next(reader)
    data = list(reader)

data = np.array(data, dtype=float)

min_values = np.min(data, axis=0)
max_values = np.max(data, axis=0)
avg_values = np.mean(data, axis=0)
var_values = np.var(data, axis=0)


print("      ", end="")
for header in headers:
    print(f"{header:>10}", end="")
print()

print(f"min   ", end="")
for value in min_values:
    print(f"{value:>10.2f}", end="")
print()

print(f"max   ", end="")
for value in max_values:
    print(f"{value:>10.2f}", end="")
print()

print(f"avg   ", end="")
for value in avg_values:
    print(f"{value:>10.2f}", end="")
print()

print(f"sig   ", end="")
for value in var_values:
    print(f"{value:>10.2f}", end="")
print()

         Temp9am   Temp3pm  Rainfall
min         0.10      5.10      0.00
max        24.70     34.50     39.80
avg        12.36     19.23      1.43
sig        31.62     43.97     17.81


### Задание 10. CSV-файл
Создайте csv, содержащий заголовки `rnd`,`uni`,`gauss_1`,`gauss_2` и значения этих списков соответственно.

https://docs.python.org/3/library/csv.html#csv.writer

In [None]:
import csv

with open("/content/drive/MyDrive/Data Mining/output.csv", "w", newline="") as file:
    writer = csv.writer(file)

    writer.writerow(["rnd", "uni", "gauss_1", "gauss_2"])

    for row in zip(rnd, uni, gauss_1, gauss_2):
        writer.writerow(row)

print("CSV-файл успешно создан: output.csv")

CSV-файл успешно создан: output.csv


# ----------------------------

In [None]:
!apt-get moo

                 (__) 
                 (oo) 
           /------\/ 
          / |    ||   
         *  /\---/\ 
            ~~   ~~   
..."Have you mooed today?"...



Запускать команды можно как из терминала, так и из юпитера или колаба (Google Colab), поставив перед командой "!":

In [None]:
!echo "Hello World"
# !pip install numpy<2.0.0

Hello World


### Задание N.
Создайте файл, содержащий заглавные буквы алфавита.

In [None]:
with open("/content/drive/MyDrive/Data Mining/uppercase_letters.txt", "w") as file:
    file.write("ABCDEFGHIJKLMNOPQRSTUVWXYZ")

print("Файл успешно создан: uppercase_letters.txt")

Файл успешно создан: uppercase_letters.txt


In [None]:
with open("/content/drive/MyDrive/Data Mining/uppercase_letters.txt", "r") as file:
  text = file.read()
text

'ABCDEFGHIJKLMNOPQRSTUVWXYZ'