# Практические задания 18
* Лекция 36 - Парсинг веб-страниц
* Лекция 37 - MySQL и Python


1. **Парсинг данных**
> Извлеките данные с первых 10 страниц ресурса https://www.fdic.gov/bank-failures/failed-bank-list. Сохраните их в список строк таблицы. Выведите несколько произвольных строк.

*Пример вывода:*  
```
['The Woodbury Banking Company', 'Woodbury', 'Georgia', '11297', 'United Bank', 'August 19, 2016', '10521']
['First CornerStone Bank', 'King of Prussia', 'Pennsylvania', '35312', 'First-Citizens Bank & Trust Company', 'May 6, 2016', '10520']
['Trust Company Bank', 'Memphis', 'Tennessee', '9956', 'The Bank of Fayette County', 'April 29, 2016', '10519']
['North Milwaukee State Bank', 'Milwaukee', 'Wisconsin', '20364', 'First-Citizens Bank & Trust Company', 'March 11, 2016', '10518']
['Hometown National Bank', 'Longview', 'Washington', '35156', 'Twin City Bank', 'October 2, 2015', '10517']
```

In [9]:
import requests
from bs4 import BeautifulSoup

url = 'https://www.fdic.gov/bank-failures/failed-bank-list'
data = []
for i in range(1,11):
    params = {'page': i}
    response = requests.get(url, params = params) # url+f'?pg={i}'      -> https://www.fdic.gov/bank-failures/failed-bank-list?pg=3

    if response.status_code == 200:
        soup = BeautifulSoup(response.text, 'html.parser')
        table = soup.find('table')
        rows = table.find_all('tr')
        for row in rows[1:]: # rows[1:] Игнорируем пустые строки вначале
            cols = row.find_all('td')
            row_data = [col.text.strip() for col in cols]
            data.append(row_data)
    else:
        print('Ошибка запроса к странице')

for row in data:
    print(row)

['Allied Bank', 'Mulberry', 'Arkansas', '91', "Today's Bank", 'September 23, 2016', '10522']
['The Woodbury Banking Company', 'Woodbury', 'Georgia', '11297', 'United Bank', 'August 19, 2016', '10521']
['First CornerStone Bank', 'King of Prussia', 'Pennsylvania', '35312', 'First-Citizens Bank & Trust Company', 'May 6, 2016', '10520']
['Trust Company Bank', 'Memphis', 'Tennessee', '9956', 'The Bank of Fayette County', 'April 29, 2016', '10519']
['North Milwaukee State Bank', 'Milwaukee', 'Wisconsin', '20364', 'First-Citizens Bank & Trust Company', 'March 11, 2016', '10518']
['Hometown National Bank', 'Longview', 'Washington', '35156', 'Twin City Bank', 'October 2, 2015', '10517']
['The Bank of Georgia', 'Peachtree City', 'Georgia', '35259', 'Fidelity Bank', 'October 2, 2015', '10516']
['Premier Bank', 'Denver', 'Colorado', '34112', 'United Fidelity Bank, fsb', 'July 10, 2015', '10515']
['Edgebrook Bank', 'Chicago', 'Illinois', '57772', 'Republic Bank of Chicago', 'May 8, 2015', '10514']


2. **Создание таблицы БД**
     
Напишите программу, которая:
* создаёт базу данных `banks_<your_group>_<your_full_name>`
* выбирает эту базу через USE 
* создает таблицу banks со структурой, идентичной таблице с сайта предыдущей задачи (но дополнительно нужно добавить первичный ключ - id)
После этого:
* вставьте одну произвольную строку в таблицу
* выполните commit() после вставки
* выведите все строки таблицы
* удалите из таблицы все строки
* убедитесь, что таблица пуста.

*Пример вывода:*  
Строки в таблице после вставки:  
`(3, 'Example Bank', 'Example City', 'Example State', '00000', 'Example Institution', datetime.date(2023, 10, 1), 10000)`  
Строки в таблице после удаления:


In [1]:
# import config_connect_to_db

In [3]:
# config = config_connect_to_db.cnfg

In [10]:
import pymysql

config = {'host': 'ich-edit.edu.itcareerhub.de','user': 'ich1', 'password': 'ich1_password_ilovedbs'}

connection = pymysql.connect(**config)
cursor = connection.cursor()

db_name = 'banks_test'
cursor.execute(f'CREATE DATABASE IF NOT EXISTS {db_name}')
cursor.execute(f'USE {db_name}')

create_table_query = '''
CREATE TABLE IF NOT EXISTS bank (
id INT AUTO_INCREMENT PRIMARY KEY,
bank_name VARCHAR(255),
city VARCHAR(255),
state VARCHAR(255),
cert VARCHAR(10),
acquiring_institution VARCHAR(255),
closing_data DATE,
fund INT
)
'''

cursor.execute(create_table_query)

insert_query = '''
INSERT INTO bank (bank_name, city, state, cert, acquiring_institution, closing_data, fund)
VALUES (%s, %s, %s, %s, %s, %s, %s)
'''

cursor.execute(insert_query, ('Example Bank', 'Example City', 'Example State', '00000', 'Example Institution', '2023-10-01', 10000))
connection.commit()

cursor.execute('SELECT * FROM bank')
for row in cursor:
    print(row)



(253, 'Allied Bank', 'Mulberry', 'Arkansas', '91', "Today's Bank", datetime.date(2016, 9, 23), 10522)
(254, 'The Woodbury Banking Company', 'Woodbury', 'Georgia', '11297', 'United Bank', datetime.date(2016, 8, 19), 10521)
(255, 'First CornerStone Bank', 'King of Prussia', 'Pennsylvania', '35312', 'First-Citizens Bank & Trust Company', datetime.date(2016, 5, 6), 10520)
(256, 'Trust Company Bank', 'Memphis', 'Tennessee', '9956', 'The Bank of Fayette County', datetime.date(2016, 4, 29), 10519)
(257, 'North Milwaukee State Bank', 'Milwaukee', 'Wisconsin', '20364', 'First-Citizens Bank & Trust Company', datetime.date(2016, 3, 11), 10518)
(258, 'Hometown National Bank', 'Longview', 'Washington', '35156', 'Twin City Bank', datetime.date(2015, 10, 2), 10517)
(259, 'The Bank of Georgia', 'Peachtree City', 'Georgia', '35259', 'Fidelity Bank', datetime.date(2015, 10, 2), 10516)
(260, 'Premier Bank', 'Denver', 'Colorado', '34112', 'United Fidelity Bank, fsb', datetime.date(2015, 7, 10), 10515)
(26

In [3]:
cursor.execute('DELETE FROM bank')
connection.commit()

print('таблица после удаления:')
cursor.execute('SELECT * FROM bank')
for row in cursor:
    print(row)

таблица после удаления:


In [None]:
cursor.close()
connection.close()

3. **Заполнение базы данных**  
> Продолжите решение предыдущих задач. Вставьте в созданную базу данных строки, полученные парсингом сайта в первой задаче. Перед вставкой убедитесь, что данные имеют верные типы (числа, даты и т.п.)   
*Пример вывода:*   
Строки в таблице после вставки:
```
(2, 'The First State Bank', 'Barboursville', 'West Virginia', '14361', 'MVB Bank, Inc.', datetime.date(2020, 4, 3), 10536)
(3, 'Ericson State Bank', 'Ericson', 'Nebraska', '18265', 'Farmers and Merchants Bank', datetime.date(2020, 2, 14), 10535)
(4, 'City National Bank of New Jersey', 'Newark', 'New Jersey', '21111', 'Industrial Bank', datetime.date(2019, 11, 1), 10534)
(5, 'Resolute Bank', 'Maumee', 'Ohio', '58317', 'Buckeye State Bank', datetime.date(2019, 10, 25), 10533)
```

In [11]:
data[0]

['Allied Bank',
 'Mulberry',
 'Arkansas',
 '91',
 "Today's Bank",
 'September 23, 2016',
 '10522']

In [12]:
from datetime import datetime

datetime.strptime('September 23, 2016', "%B %d, %Y")

datetime.datetime(2016, 9, 23, 0, 0)

In [13]:
from datetime import datetime

for bd in data:
    bd[5] = datetime.strptime(bd[5], "%B %d, %Y")
    bd[6] = int(bd[6])

with pymysql.connect(**config) as connection:
    with connection.cursor() as cursor:
        cursor.execute(f"USE {db_name}")
	 # Переменные insert_query и bank_data определены в задачах 1 и 2
        cursor.executemany(insert_query, data)
        connection.commit()
        
        # Вывод всех строк таблицы для проверки
        cursor.execute("SELECT * FROM bank")
        print("Строки в таблице после вставки:")
        for row in cursor:
            print(row)

Строки в таблице после вставки:
(506, 'Example Bank', 'Example City', 'Example State', '00000', 'Example Institution', datetime.date(2023, 10, 1), 10000)
(507, 'Allied Bank', 'Mulberry', 'Arkansas', '91', "Today's Bank", datetime.date(2016, 9, 23), 10522)
(508, 'The Woodbury Banking Company', 'Woodbury', 'Georgia', '11297', 'United Bank', datetime.date(2016, 8, 19), 10521)
(509, 'First CornerStone Bank', 'King of Prussia', 'Pennsylvania', '35312', 'First-Citizens Bank & Trust Company', datetime.date(2016, 5, 6), 10520)
(510, 'Trust Company Bank', 'Memphis', 'Tennessee', '9956', 'The Bank of Fayette County', datetime.date(2016, 4, 29), 10519)
(511, 'North Milwaukee State Bank', 'Milwaukee', 'Wisconsin', '20364', 'First-Citizens Bank & Trust Company', datetime.date(2016, 3, 11), 10518)
(512, 'Hometown National Bank', 'Longview', 'Washington', '35156', 'Twin City Bank', datetime.date(2015, 10, 2), 10517)
(513, 'The Bank of Georgia', 'Peachtree City', 'Georgia', '35259', 'Fidelity Bank', d

4. **Запрос к базе данных**  
> Напишите запрос к созданной базе данных, который позволяет вывести количество банков в каждом Штате и их суммарные фонды.

*Пример вывода:*   
Количество банков и суммарные фонды по штатам:  
```
Штат: West Virginia, Количество банков: 1, Суммарные фонды: 10536
Штат: Nebraska, Количество банков: 1, Суммарные фонды: 10535
Штат: New Jersey, Количество банков: 2, Суммарные фонды: 21057
Штат: Ohio, Количество банков: 2, Суммарные фонды: 21032
Штат: Kentucky, Количество банков: 2, Суммарные фонды: 21006
Штат: Texas, Количество банков: 3, Суммарные фонды: 31510
Штат: Illinois, Количество банков: 16, Суммарные фонды: 167855
...
```

In [7]:
query = """
SELECT state, COUNT(*), SUM(fund)
FROM bank
GROUP BY state;
"""

with pymysql.connect(**config) as connection:
    with connection.cursor() as cursor:
        cursor.execute(f"USE {db_name}")
        cursor.execute(query)
        
        print("Количество банков и суммарные фонды по штатам:")
        for row in cursor:
            print(f"Штат: {row[0]}, Количество банков: {row[1]}, Суммарные фонды: {row[2]}")



Количество банков и суммарные фонды по штатам:
Штат: Arkansas, Количество банков: 2, Суммарные фонды: 20844
Штат: Georgia, Количество банков: 51, Суммарные фонды: 529725
Штат: Pennsylvania, Количество банков: 7, Суммарные фонды: 72916
Штат: Tennessee, Количество банков: 6, Суммарные фонды: 62778
Штат: Wisconsin, Количество банков: 8, Суммарные фонды: 83106
Штат: Washington, Количество банков: 9, Суммарные фонды: 93280
Штат: Colorado, Количество банков: 7, Суммарные фонды: 72713
Штат: Illinois, Количество банков: 29, Суммарные фонды: 302042
Штат: Puerto Rico, Количество банков: 1, Суммарные фонды: 10513
Штат: Florida, Количество банков: 36, Суммарные фонды: 374048
Штат: Minnesota, Количество банков: 9, Суммарные фонды: 93797
Штат: California, Количество банков: 12, Суммарные фонды: 124116
Штат: Maryland, Количество банков: 5, Суммарные фонды: 52183
Штат: Oklahoma, Количество банков: 5, Суммарные фонды: 52123
Штат: Ohio, Количество банков: 2, Суммарные фонды: 20787
Штат: South Carolina, 