<h1>Модуль А<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#Подключение-библиотек" data-toc-modified-id="Подключение-библиотек-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>Подключение библиотек</a></span></li><li><span><a href="#Сбор-датасета" data-toc-modified-id="Сбор-датасета-2"><span class="toc-item-num">2&nbsp;&nbsp;</span>Сбор датасета</a></span></li><li><span><a href="#База-данных-и-структура" data-toc-modified-id="База-данных-и-структура-3"><span class="toc-item-num">3&nbsp;&nbsp;</span>База данных и структура</a></span></li></ul></div>

# Подключение библиотек

In [7]:
import pandas as pd
import numpy as np
import tensorflow as tf
import re

from sqlalchemy import create_engine

# Сбор датасета

Изучив примеры карточек, я заметил, что во всех карточках есть:
1. ФИО
2. Место рождения
3. Дата рождения
4. Участие в войнах
5. Награды
6. Воинская честь
***
Эти признаки в карточках встречаются чаще всего, поэтому я их и выбрал. Еще в карточках встречается и год смерти, но такое есть только в единицах.

In [109]:
# примеры визиток

profiles = [{"ФИО": "АКСЁНОВА Вера Васильевна", "Участие": ["Великая Отечественная война"], "Награды": ["Орден Отечественной войны II ст."], "Место рождения": "д. Танина Гора (Передки)", "Дата рождения": "8 июля 1925"},
{"ФИО": "АЛЕКСАНДРОВ Иван Иванович", "Участие": ["Советско-финская война 1939-1940 гг."], "Награды": ["Медаль «За оборону Ленинграда»"], "Место рождения": "д. Мыселка", "Дата рождения": "1909"},
{"ФИО": "АНДРЕЕВ Дмитрий Михайлович", "Участие": ["Великая Отечественная война"], "Награды": ["Медали «За отвагу», «За боевые заслуги», «За оборону Ленинграда»"], "Место рождения": "д. Хадом", "Дата рождения": "1896"}]

# База данных и структура

После сбора данных я буду хранить их в БД PostreSQL. У таблицы будет следующая структура:
1. ФИО - Текстовое поле
2. Место рождения - Текстовое поле
3. Дата рождения - Текстовое поле
4. Награды - список текстовых полей
5. Участие - список текстовых полей

In [154]:
# создание подключения к БД
con = create_engine('postgresql+psycopg2://postgres:345msk00@localhost/telegram_bot')

In [161]:
# загрузка данных

line = []
for row in profiles:
    fio = row['ФИО']
    pob = row['Место рождения']
    dob = row['Дата рождения']
    parts = row['Участие']
    wins = row['Награды']
    line.append([fio, pob, dob, parts, wins])
    
df = pd.DataFrame(line, columns=['fio', 'pob', 'dob', 'parts', 'wins'])
df

Unnamed: 0,fio,pob,dob,parts,wins
0,АКСЁНОВА Вера Васильевна,д. Танина Гора (Передки),8 июля 1925,[Великая Отечественная война],[Орден Отечественной войны II ст.]
1,АЛЕКСАНДРОВ Иван Иванович,д. Мыселка,1909,[Советско-финская война 1939-1940 гг.],[Медаль «За оборону Ленинграда»]
2,АНДРЕЕВ Дмитрий Михайлович,д. Хадом,1896,[Великая Отечественная война],"[Медали «За отвагу», «За боевые заслуги», «За ..."


In [162]:
df.to_sql('visits', con, if_exists='replace', index=False)

3

In [163]:
# чтение всех данных
df = pd.read_sql_query('select * from "visits"', con)
df

Unnamed: 0,fio,pob,dob,parts,wins
0,АКСЁНОВА Вера Васильевна,д. Танина Гора (Передки),8 июля 1925,"{""Великая Отечественная война""}","{""Орден Отечественной войны II ст.""}"
1,АЛЕКСАНДРОВ Иван Иванович,д. Мыселка,1909,"{""Советско-финская война 1939-1940 гг.""}","{""Медаль «За оборону Ленинграда»""}"
2,АНДРЕЕВ Дмитрий Михайлович,д. Хадом,1896,"{""Великая Отечественная война""}","{""Медали «За отвагу», «За боевые заслуги», «За..."


In [178]:
# добавление новых записей

import os
from flask import Flask, jsonify, request
from flask_restful import Api, Resource
from sqlalchemy import create_engine
import pandas as pd
import numpy as np
import re
import os
import json
import pickle as pkl

app = Flask(__name__)
api = Api(app)

# создание подключения к БД
con = create_engine('postgresql+psycopg2://postgres:345msk00@localhost/telegram_bot')


class MakePrediction(Resource):
    @staticmethod
    def post():
        df = pd.read_sql_query('select * from "visits"', con)
        posted_data = request.get_json()
        line = []
        fio = posted_data['ФИО']
        pob = posted_data['Место рождения']
        dob = posted_data['Дата рождения']
        parts = posted_data['Участие']
        wins = posted_data['Награды']
        line.append([fio, pob, dob, parts, wins])
            
        df_2 = pd.DataFrame(line, columns=['fio', 'pob', 'dob', 'parts', 'wins'])
        df = pd.concat([df, df_2])
        df.to_sql('visits', con, if_exists='replace', index=False)

        return {'status_code': 200}
    

class GetAll(Resource):
    @staticmethod
    def post():
        df = pd.read_sql_query('select * from "visits"', con)
        data = {'data': []}

        for row in df.values:
            data['data'].append(list(row))

        k = json.dumps(data, ensure_ascii=False)
        return json.dumps(data, ensure_ascii=False)   
    
api.add_resource(MakePrediction, '/add_row')
api.add_resource(GetAll, '/all')

if __name__ == '__main__':
    app.run(debug=False)

 * Serving Flask app "__main__" (lazy loading)
 * Environment: production
[2m   Use a production WSGI server instead.[0m
 * Debug mode: off


 * Running on http://127.0.0.1:5000/ (Press CTRL+C to quit)
127.0.0.1 - - [16/Aug/2023 21:12:05] "POST /add_row HTTP/1.1" 200 -
127.0.0.1 - - [16/Aug/2023 21:12:09] "POST /all HTTP/1.1" 200 -
