#### **0. 필요한 라이브러리 로드**

In [1]:
import pymysql
from sqlalchemy import create_engine
# pip install mysqlclient

import os
from abc import ABC, abstractmethod
from typing import *
import re

from prettytable import PrettyTable
import pandas as pd
pd.options.display.float_format = '{:.10f}'.format
import pprint

import binascii
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

---

#### **1. MySQL Server DB와 Python Script를 연동**

In [2]:
# import pymysql
# from abc import ABC, abstractmethod

class PreprocessQuery(ABC):
    """가명처리를 위한 개인정보 추출 목적의 SQL쿼리 추상클래스"""
    @abstractmethod
    def connectDatabase(self):
        """데이터베이스에 연결하기 위해 접속하는 메서드"""
        pass
    
    @abstractmethod
    def executeQuery(self, SQL):
        """SQL쿼리를 실행하는 메서드"""
        pass
    
    @abstractmethod
    def closeConnection(self):
        """데이터베이스와의 연결을 종료하는 메서드"""
        pass

In [3]:
class ConnectMySQLserver:
    def __init__(self, pw):
        self._pw = pw
        self.connection = None
        self.cursor = None
    
    def connectDatabase(self, serverIP: str, port_num: int, user_name: str, database_name: str, kr_encoder: str):
        """MySQL DBMS 데이터베이스에 접속 메서드
        : 서버IP주소, 사용자명, 계정 암호, 데이터베이스명, 한글 인코딩 방식"""
        try:
            self.connection = pymysql.connect(
                host=serverIP, port=port_num,
                user=user_name, password=self._pw,
                db=database_name, charset=kr_encoder
            )
            self.cursor = self.connection.cursor()
        except pymysql.Error as e:
            print(f"Error Connecting to MySQL from Python: {e}")
    
    def closeConnection(self):
        """연결 및 커서 닫기 메서드"""
        if self.cursor:
            self.cursor.close()
        if self.connection:
            self.connection.close()

In [4]:
# from pseudonymizer.encryptionPseudonyms.abstractPreprocessQuery import PreprocessQuery
# from typing import *
# import pymysql
# from prettytable import PrettyTable
# import pandas as pd

class PyMySQLQuery(PreprocessQuery):
    def __init__(self, pw):
        self._pw = pw
        self.connection = None
        self.DBconnection = ConnectMySQLserver(self._pw)
        self.cursor = None
        self.SQL = None
    
    def connectDatabase(self, serverIP: str, port_num: int, user_name: str, database_name: str, kr_encoder: str):
        """MySQL DBMS 데이터베이스에 접속하는 메서드"""
        self.DBconnection.connectDatabase(serverIP, port_num, user_name, database_name, kr_encoder)
    
    def dataQueryLanguage(self, sql):
        """SQL쿼리문 작성 메서드(데이터 추출 쿼리문 캡슐화)"""
        self.SQL = f"{sql}"

    def executeQuery(self):
        """SQL쿼리문 실행 및 예외처리 메서드(데이터베이스로 쿼리를 보내서 실행)"""
        try:
            # 데이터베이스에 연결되어 있지 않은 경우, 연결을 시도
            if self.DBconnection is None:
                raise pymysql.Error
            else:
            # 연결된 데이터베이스의 커서를 사용하여 쿼리를 실행
                self.DBconnection.cursor.execute(self.SQL)
                action_output = self.DBconnection.cursor.fetchall()
                return action_output
        
        except pymysql.Error as e:
            print(f"Error Executing Query: {e}")
        
    def executeQueryAsDataFrame(self):
        """SQL 쿼리를 실행한 결과를 판다스 데이터프레임으로 출력하는 메서드"""
        try:
            action_output = self.DBconnection.cursor.execute(self.SQL)
            records = self.DBconnection.cursor.fetchall()
            attributes = [i[0] for i in self.DBconnection.cursor.description]
            querydata = pd.DataFrame(records, columns = attributes)
            return querydata
        
        except pymysql.Error as e:
            print(f"Executing query error: {e}")

    def useFetchallQuery(self):
        """SQL 쿼리 실행 결과의 cursor.fetchall() 을 사용할 수 있도록 하는 메서드"""
        try:
            action_output = self.DBconnection.cursor.execute(self.SQL)
            records = self.DBconnection.cursor.fetchall()
            return records
        except pymysql.Error as e:
            print(f"Executing query error: {e}")
    
    def commitTransaction(self):
        """실행결과를 확정(트랜잭션을 커밋)하는 메서드"""
        self.DBconnection.connection.commit()
    
    def closeConnection(self):
        """데이터베이스와의 연결을 종료하는 메서드"""
        self.DBconnection.close_connection()

    def executeQueryAsDataFrame(self):
        """SQL 쿼리를 실행한 결과를 판다스 데이터프레임으로 출력하는 메서드"""
        try:
            action_output = self.DBconnection.cursor.execute(self.SQL)
            records = self.DBconnection.cursor.fetchall()
            attributes = [i[0] for i in self.DBconnection.cursor.description]
            querydata = pd.DataFrame(records, columns = attributes)
            return querydata
        
        except pymysql.Error as e:
            print(f"Executing query error: {e}")

___

#### **2. 데이터베이스 스키마.테이블 저장(역할과 책임에 따른 추상화)**

In [5]:
class DBContainer:
    """DB에서 스키마와 테이블 이름을 저장하고 반환하는 추상 클래스"""
    def __init__(self):
        self._schema = None
        self._table = None

    def setSchemaTable(self, schema: str, table: str):
        """스키마명, 테이블명 저장 추상 메서드"""
        self._schema = schema
        self._table = table
        
    def getSchema(self):
        """스키마 이름 반환 추상 메서드"""
        return self._schema
        
    def getTable(self):
        """테이블 이름 반환 추상 메서드"""
        return self._table

In [6]:
class BundleTables(ABC):
    """테이블을 저장하는 추상 클래스"""
    @abstractmethod
    def selectTables(self, data):
        """DBContainer에서 선언한 스키마.테이블 중 목적에 맞는 테이블을 저장하는 추상 메서드"""
        pass
    @abstractmethod
    def getTableList(self):
        """selectTables에서 선택한 데이터를 반환하는 추상 메서드"""
        pass
    @abstractmethod
    def getSchemas(self):
        """selectTables에서 선택한 스키마명 반환하는 추상 메서드"""
        pass
    @abstractmethod
    def getTables(self):
        """selectTables에서 선택한 테이블명 반환하는 추상 메서드"""
        pass    

In [None]:
class BundleMainTable(BundleTables):
    """가명정보 결합대상 원본테이블 저장 상속 클래스"""
    dbtables = None

    def __init__(self):
        self.dbtables = None

    def selectTables(self, tables: DBContainer):
        """가명정보 결합대상 원본테이블 저장하는 클래스"""
        self.dbtables = tables

    def getTableList(self):
        """가명정보 결합대상 원본테이블 반환하는 메서드"""
        return self.dbtables

    def getSchemas(self):
        """스키마명 반환하는 메서드"""
        return list(map(lambda table: table.getSchema(), self.dbtables))

    def getTables(self):
        """테이블명 반환하는 메서드"""
        return list(map(lambda table: table.getTable(), self.dbtables))

In [7]:
class BundleKeyTable(BundleTables):
    """결합키 생성 테이블 저장 상속 클래스"""
    dbtables = None
    key_column = None

    def __init__(self):
        self.key_table = None

    @classmethod
    def addDBTables(cls, tables: DBContainer):
        """DB에서 가명결합을 수행할 원본 테이블 캡슐화하는 메서드"""
        cls.dbtables = tables
    
    @classmethod
    def addKeyColumn(cls, key_column: str):
        """일방향 암호화 수행대상 결합키 컬럼명 설정하는 메서드"""
        cls.key_column = key_column

    def selectTables(self, key_table: DBContainer):
        """결합키 생성에 활용될 테이블 저장하는 클래스"""
        self.key_table = key_table

    def getTableList(self):
        """결합키 생성항목 테이블 반환하는 메서드"""
        return self.key_table

    def getSchemas(self):
        """스키마명 반환하는 메서드"""
        return list(map(lambda table: table.getSchema(), self.key_table))

    def getTables(self):
        """테이블명 반환하는 메서드"""
        return list(map(lambda table: table.getTable(), self.key_table))

    @classmethod
    def reset(cls):
        """클래스 변수 초기화"""
        cls.dbtables = None
        cls.key_column = None


In [8]:
class BundleTargetTable(BundleTables):
    """결합대상 가명정보 테이블 저장 상속 클래스"""
    dbtables = None
    # target_columns = None
    key_column = None

    def __init__(self):
        self.target_table = None

    @classmethod
    def addDBTables(cls, tables: DBContainer):
        """DB에서 가명결합을 수행할 원본 테이블 캡슐화하는 메서드"""
        cls.dbtables = tables

    def selectTables(self, target_table: DBContainer):
        """결합키 생성에 활용될 테이블 저장하는 클래스"""
        self.target_table = target_table

    def getTableList(self):
        """결합키 생성항목 테이블 반환하는 메서드"""
        return self.target_table

    def getSchemas(self):
        """스키마명 반환하는 메서드"""
        return list(map(lambda table: table.getSchema(), self.target_table))

    def getTables(self):
        """테이블명 반환하는 메서드"""
        return list(map(lambda table: table.getTable(), self.target_table))

    @classmethod
    def reset(cls):
        """클래스 변수 초기화"""
        cls.dbtables = None
        cls.target_columns = None


In [9]:
help(BundleTables)

Help on class BundleTables in module __main__:

class BundleTables(abc.ABC)
 |  테이블을 저장하는 추상 클래스
 |  
 |  Method resolution order:
 |      BundleTables
 |      abc.ABC
 |      builtins.object
 |  
 |  Methods defined here:
 |  
 |  getSchemas(self)
 |      selectTables에서 선택한 스키마명 반환하는 추상 메서드
 |  
 |  getTableList(self)
 |      selectTables에서 선택한 데이터를 반환하는 추상 메서드
 |  
 |  getTables(self)
 |      selectTables에서 선택한 테이블명 반환하는 추상 메서드
 |  
 |  selectTables(self, data)
 |      DBContainer에서 선언한 스키마.테이블 중 목적에 맞는 테이블을 저장하는 추상 메서드
 |  
 |  ----------------------------------------------------------------------
 |  Data descriptors defined here:
 |  
 |  __dict__
 |      dictionary for instance variables (if defined)
 |  
 |  __weakref__
 |      list of weak references to the object (if defined)
 |  
 |  ----------------------------------------------------------------------
 |  Data and other attributes defined here:
 |  
 |  __abstractmethods__ = frozenset({'getSchemas', 'getTableList', 'getTab.

---

#### **3. 일련번호 컬럼 생성, 결합키 생성항목 및 결합대상정보 분할, 결합키 암호화**

In [10]:
class UpdateSerialNumColumn(PyMySQLQuery):
    """원본 테이블에 결합키 생성을 위한 일련번호 컬럼을 생성하기 위한 쿼리를 날리는 클래스"""

    def __init__(self, pw: str, serverIP: str, port_num: int, user_name: str, database_name: str, kr_encoder: str):
        super().__init__(pw = pw)
        super().connectDatabase(
            serverIP, port_num, user_name, database_name, kr_encoder)
        self.dbtables = None
    
    @classmethod
    def addDBTables(cls, tables: DBContainer):
        """DB에서 가명결합을 수행할 원본 테이블 캡슐화하는 메서드"""
        cls.dbtables = tables
    
    def addSerialNumColumn(self, serial_column, serial_text, identifier_column):
        """결합키 연계정보(매핑테이블) 생성에 활용될 각 결합신청자의 테이블별 일련번호 생성하는 실행 메서드"""
        if identifier_column is None:
            schema = self.dbtables.getSchema()
            table = self.dbtables.getTable()
                
            # 컬럼명 중복시 해당 컬럼 삭제
            super().dataQueryLanguage(f"ALTER TABLE {schema}.{table} DROP COLUMN {serial_column}_{serial_text}")  
            super().executeQuery()

            # 일련번호 컬럼 생성
            super().dataQueryLanguage(f"ALTER TABLE {schema}.{table} ADD COLUMN {serial_column}_{serial_text} VARCHAR(1000)")
            super().executeQuery()
            
            # 0으로 초기화 후 @counter를 이용하여 1 더하여 일련번호 컬럼에 값 할당
            super().dataQueryLanguage("SET @counter = 0;")
            super().executeQuery()
            super().dataQueryLanguage(f"UPDATE {schema}.{table} SET {serial_column}_{serial_text} = CONCAT('{serial_text}', @counter := @counter + 1);")
            super().executeQuery()
            super().commitTransaction()
        else:
            pass
            # super().dataQueryLanguage(f"ALTER TABLE {schema}.{table} ADD KEY {identifier_column}")
            # super().executeQuery()

In [None]:
# from ./ import BundleMainTable
# from ./ import BundleKeyTable

class InsertKeyintoMainTable(PyMySQLQuery):
    """원본 테이블에서 결합키 생성항목으로 결합키 테이블을 생성하는 클래스"""

    def __init__(self, pw: str, serverIP: str, port_num: int, user_name: str, database_name: str, kr_encoder: str):
        super().__init__(pw = pw)
        super().connectDatabase(
            serverIP, port_num, user_name, database_name, kr_encoder)
        self.dbtables = None
        self.bundleMainTable = BundleMainTable()
        self.bundleKeyTable = BundleKeyTable()
    
    def insertKeyIntoDB(self, tables, key_table, key_column, salt_value, salt_column, serial_column, serial_text):
        """
        결합키를 테이블에 입력하는 실행 메서드
        -----------------------------------
        tables: pd.DataFrame 원본 데이터
        key_table: List 결합키 생성항목 대상 컬럼 조합
        key_column: str 생성할 결합키 컬럼명
        salt_value: str 일방향 암호화 해시값
        salt_column: str 외부에서 입력받을 해시값 컬럼명
        """
        # 원본 테이블 및 결합키 스키마.테이블명 등 로드
        key_schema, key_tablename, main_schema, main_tablename = self.loadTableObject(tables, key_table, key_column)

        # 결합키 컬럼 생성
        key_column = self.joinKeyColumn(key_table)
            # INPUT 결합키 생성 컬럼 -> OUTPUT 결합키 컬럼명
            
        # 데이터베이스 내 결합키 컬럼 기존재 시 삭제 및 삽입 수행 
        super().dataQueryLanguage(f"DROP TABLE IF EXISTS {key_schema}.{key_tablename}")
        super().executeQuery()

        self.addKeyColumn(key_schema, key_tablename, self.key_column, self.key_table)
        self.addSaltColumn(key_schema, key_tablename, salt_value, salt_column)

        sql = f"CREATE TABLE {key_schema}.{key_tablename} AS SELECT {serial_column}_{serial_text}, {key_column} FROM {main_schema}.{main_tablename}"
        super().dataQueryLanguage(sql)
        super().commitTransaction()

    @classmethod
    def loadTableObject(cls, tables, key_table, key_column):
        # 결합키 스키마.테이블명 등 로드
        cls.bundleKeyTable.addDBTables(tables) # 원본 데이터
        cls.bundleKeyTable.selectTables(key_table) # 키 데이터
        cls.bundleKeyTable.addKeyColumn(key_column) # 결합키 컬럼명
        cls.bundleKeyTable.getTableList()
        key_schema = cls.bundleKeyTable.getSchemas(cls.key_table) # 키 테이블 스키마명
        key_tablename = cls.bundleKeyTable.getTables(cls.key_table) # 키 테이블명

        # 원본 스키마.테이블명 로드
        main_schema = cls.bundleMainTable.getSchemas(tables)
        main_tablename = cls.bundleMainTable.getTables(tables)

        return key_schema, key_tablename, main_schema, main_tablename
     
    @classmethod
    def joinKeyColumn(cls, key_column):
        return ", ".join(key_column)

    @classmethod
    def addKeyColumn(cls, key_schema, key_result, join_key, join_columns):
        """결합키 컬럼 만드는 클래스 메서드"""
        super().dataQueryLanguage(f"ALTER TABLE {key_schema}.{key_result} ADD COLUMN {join_key} VARCHAR(1000)")
        super().executeQuery()

        super().dataQueryLanguage(f"UPDATE {key_schema}.{key_result} SET {join_key} = CONCAT({join_columns})")
        super().executeQuery()

    @classmethod
    def addSaltColumn(cls, key_schema, key_result, salt_value, salt_column):
        """SALT값 컬럼 만드는 클래스 메서드"""
        super().dataQueryLanguage(f"ALTER TABLE {key_schema}.{key_result} ADD COLUMN {salt_column} VARCHAR(1000)")
        super().executeQuery()

        super().dataQueryLanguage(f"UPDATE {key_schema}.{key_result} SET SALT = '{salt_value}'")
        super().executeQuery()

In [None]:
# from ./ import BundleMainTable
# from ./ import BundleTargetTable

class InsertTargetintoMainTable(PyMySQLQuery):
    """원본 테이블에서 결합대상 가명정보를 복사하여 테이블을 생성하는 클래스"""

    def __init__(self, pw: str, serverIP: str, port_num: int, user_name: str, database_name: str, kr_encoder: str):
        super().__init__(pw = pw)
        super().connectDatabase(
            serverIP, port_num, user_name, database_name, kr_encoder)
        self.dbtables = None
        self.bundleMainTable = BundleMainTable()
        self.bundleTargetTable = BundleTargetTable()
    
    def insertTargetIntoDB(self, tables, key_table):
        """
        결합키를 테이블에 입력하는 실행 메서드
        -----------------------------------

        tables: pd.DataFrame 원본 데이터
        key_table: List 결합키 생성항목 대상 컬럼 조합        

        """
        # 원본 테이블 및 결합키 스키마.테이블명 등 로드
        target_schema, target_tablename, main_schema, main_tablename = self.loadTableObject(tables, key_table)

        # 데이터베이스 내 결합키 컬럼 기존재 시 삭제 및 삽입 수행 
        super().dataQueryLanguage(f"DROP TABLE IF EXISTS {target_schema}.{target_tablename}")
        super().executeQuery()

        sql = f"CREATE TABLE {target_schema}.{target_tablename} AS SELECT * FROM {main_schema}.{main_tablename}"
        super().dataQueryLanguage(sql)
        super().commitTransaction()

        self.dropKeyColumn(target_schema, target_tablename, key_table)
        super().commitTransaction()

    @classmethod
    def loadTableObject(cls, tables, target_table):
        # 결합대상정보 등 스키마.테이블명 등 로드
        cls.bundleTargetTable.addDBTables(tables) # 원본 데이터
        cls.bundleTargetTable.selectTables(target_table) # 타겟 데이터
        cls.bundleTargetTable.getTableList()
        target_schema = cls.bundleTargetTable.getSchemas(cls.target_table) # 타겟 테이블 스키마명
        target_tablename = cls.bundleTargetTable.getTables(cls.target_table) # 타겟 테이블명

        # 원본 스키마.테이블명 로드
        main_schema = cls.bundleMainTable.getSchemas(tables)
        main_tablename = cls.bundleMainTable.getTables(tables)

        return target_schema, target_tablename, main_schema, main_tablename
     
    @classmethod
    def dropKeyColumn(cls, target_schema: str, target_tablename: str, key_table: list):
        """결합키 생성항목 원본 테이블에서 제거"""
        for column in key_table:
            drop_sql = f"ALTER TABLE {target_schema}.{target_tablename} DROP COLUMN {column}"
            super().dataQueryLanguage(drop_sql)
            super().executeQuery()

---

#### **4. 결합키 암호화, 매핑테이블 생성, 가명정보 테이블 결합**

In [None]:
# from ./ import BundleKeyTable

class EncryptoKeyColumn(PyMySQLQuery):
    """결합키 일방향 암호화 클래스"""
    def __init__(self, pw: str, serverIP: str, port_num: int, user_name: str, database_name: str, kr_encoder: str):
        super().__init__(pw = pw)
        super().connectDatabase(
            serverIP, port_num, user_name, database_name, kr_encoder)
        self.dbtables = None
        self.bundleKeyTable = BundleKeyTable()

    def encrypKeyColumn(self, key_table, key_column, salt_column, hash_byte_type):
        """결합키 테이블의 키값과 일련번호 컬럼을 입력받는 SQL쿼리를 날리고 암호화하는 실행 메서드"""
        pass

    @classmethod
    def loadTableObject(cls, key_table):
        # 결합키 스키마.테이블명 등 로드
        cls.bundleKeyTable.selectTables(key_table)
        key_schema = cls.bundleKeyTable.getSchemas() # 키 테이블 스키마명
        key_tablename = cls.bundleKeyTable.getTables() # 키 테이블명

        return key_schema, key_tablename
    
    @classmethod
    def encryptKeytoHashvalue(cls, hash_byte_type, schema, table, key_column, salt_column):
        """SHA256 혹은 SHA512를 통해 결합키 컬럼값을 해시값으로 일방향 암호화하는 메서드"""
        if hash_byte_type == 256:
            sql = f"UPDATE {schema}.{table} SET {key_column} = SHA2( CONCAT({key_column}, {salt_column}), hash_byte_standard )"
        elif hash_byte_type == 512:
            sql = f"UPDATE {schema}.{table} SET {key_column} = SHA2( CONCAT({key_column}, {salt_column}), hash_byte_standard )"
        else: 
            raise ValueError(f"일방향 암호화 단위로 {hash_byte_type}bit를 256bit와 512bit 중 하나를 입력해야 합니다.")
        
        super().dataQueryLanguage(sql)
        super().executeQuery()
        super().commitTransaction()
