# Введение в программирование на языке Python
## Семинар 7. Повторение

#### Задача 3 (с прошлого занятия)

Предположим, что перед нами стоит задача автоматизировать перекладку таблицы из файла в базу данных (к примеру, PostgreSQL). Для начала таблицу необходимо создать. Для этого нужен примерно такой код:

```
CREATE TABLE distributors (  -- название таблицы
    did integer,  -- название_колонки тип_данных
    name varchar(40)  -- название_колонки тип_данных
);
```

PostgreSQL [располагает](https://www.postgresql.org/docs/current/datatype.html) следующими типами данных (это не все, что есть, но все, что нам сейчас пригодится):

<table>
    <tr>
        <th>Python</th>
        <th>PostgreSQL</th>
    </tr>
    <tr>
        <td>int</td>
        <td>smallint, integer, bigint</td>
    </tr>
    <tr>
        <td>float</td>
        <td>real</td>
    </tr>
    <tr>
        <td>bool</td>
        <td>boolean</td>
    </tr>
    <tr>
        <td>str</td>
        <td>varchar, text</td>
    </tr>
</table>

Реализуйте функцию, которая будет принимать на вход путь к файлу и возвращать sql-код для создания таблицы в БД. Функция должна иметь возможность "угадать" тип данных каждой колонки по содержанию файла.

In [None]:
def parse_file(path: str, sep: str) -> dict:
  with open(path) as file:
    text = file.read()

  text_split = text.strip().split('\n')

  header = text_split[0].split(sep)
  rows_split = []

  for row in text_split[1:]:
    rows_split.append(row.split(';'))

  columns = list(zip(*rows_split))

  data_dict = dict(zip(header, columns))

  return data_dict

def generate_sql(tablename: str, colnames: list, dtypes: list) -> str:
  cols_types = ',\n'.join(['  ' + ' '.join(pair) for pair in zip(colnames, dtypes)])
  sql_script = f'Create table {tablename} (\n{cols_types}\n);'
  return sql_script

def infer_sql(file_path: str, sql_path='create_table.sql', sep=',', tablename=None, colnames=None, dtypes=None) -> str:
  '''
  Description: infer sql code from file
  path:
  sep:
  tablename:
  colnames: list of string or None (in this case we try to infer colnames from file)
  dtypes:

  returns str with sql script
  '''
  if tablename is None:
    tablename = file_path[(file_path.find('/') + 1):file_path.rfind('.')]

  data_dict = parse_file(path=file_path, sep=sep)

  if colnames is None:
    colnames = list(data_dict.keys())

  script = generate_sql(tablename=tablename, colnames=colnames, dtypes=dtypes)
  with open(sql_path, 'w') as file:
    file.write(script)

  return sql_path

In [None]:
file = open('Super.csv', 'r')
text = file.read()
file.close()

In [None]:
with open('Super.csv', 'r') as file:
  text = file.read()

In [None]:
template =''' CREATE TABLE distributors (  -- название таблицы
    did integer,  -- название_колонки тип_данных
    name varchar(40)  -- название_колонки тип_данных
);'''

In [None]:
print(template)

 CREATE TABLE distributors (  -- название таблицы
    did integer,  -- название_колонки тип_данных
    name varchar(40)  -- название_колонки тип_данных
);


In [None]:
pth = '../Семинар 6/countries.tsv'
tname = 'contries'
cname = ['country', 'regoin', 'north_south']
dts = ['text', 'text', 'text']

check = infer_sql(pth, sep='\t')

FileNotFoundError: ignored

In [None]:
pth = '../Семинар 6/countries.tsv'
tname = 'contries'
cname = ['country', 'regoin', 'north_south']
dts = ['text', 'text', 'text']
cds = ',\n'.join(['  ' + ' '.join(pair) for pair in zip(cname, dts)])
sql_script = f'Create table {tname} (\n{cds}\n);'

In [None]:
[i ** 3 for i in range(2, 10, 3)]

[8, 125, 512]

In [None]:
',\n'.join([' '.join(pair) for pair in zip(cname, dts)])

In [None]:
list(zip(cname, dts))

In [None]:
pth.rfind('.'), pth.rfind('/')

In [None]:
pth[(pth.rfind('/') + 1):pth.rfind('.')]

#### Задача 2. Вспомним рекурсию

Надо написать функцию, которая будет считать факториал с помощью рекурсии.

In [None]:
# наш код здесь

**Задача 3** (взята [отсюда](https://pythontutor.ru/lessons/functions/problems/reverse_rec/))

Дана последовательность целых чисел, заканчивающаяся числом 0 (числа вводит пользователь). Выведите эту последовательность в обратном порядке (с помощью `print()`).
При решении этой задачи нельзя пользоваться массивами и прочими динамическими структурами данных. Рекурсия вам поможет.

In [None]:
# наш код здесь

#### Разбор ДЗ2

In [None]:
# наш код здесь

#### Хэш таблицы и сложность алгоритма

In [None]:
# наш код здесь

In [None]:
import random

In [None]:
elems = [random.randint(-1000, 1000) for i in range(100)]

elems_shuffled = elems.copy()
random.shuffle(elems)

array = elems.copy()
sorted_array = sorted(array)

In [None]:
n_buckets = 16

hash_table = [[] for i in range(n_buckets)]

for elem in array:
    bucket_ind = elem.__hash__() % n_buckets
    hash_table[bucket_ind].append(elem)