In [None]:
import pandas as pd 
import pymysql 
import os 
from dotenv import load_dotenv

In [None]:
# 환경 변수 설정 
load_dotenv()

In [None]:
# mysql 서버에 접속 
_db = pymysql.connect(
    host = os.getenv('host'), 
    port = int(os.getenv('port')), 
    user = os.getenv('user'), 
    password = os.getenv('pwd'), 
    db = os.getenv('db_name')
)

In [None]:
# 커서 생성 
cursor = _db.cursor(pymysql.cursors.DictCursor)

In [None]:
select_sql = """
    SELECT 
    *
    FROM 
    `sales records`
    WHERE 
    `Sales Channel` = 'Online'
"""
cursor.execute(select_sql)

In [None]:
cursor.fetchall()

In [None]:
select_sql2 = """
    SELECT 
    * 
    FROM 
    `sales records`
    WHERE `Sales Channel` = %s
"""
values = ['Online', 'Offline']

cursor.execute(select_sql2, values)

In [None]:
def select_query(
        _sql, 
        *_val
):
    # _sql : query문이 입력
    # _val : query에서 사용될 변수들의 모음(tuple)
    # 커서에 query문을 보낸다. 
    cursor.execute(_sql, _val)
    # query에 대한 응답을 가져온다. 
    cursor_data = cursor.fetchall()
    # cursor_data를 데이터프레임으로 변환 
    df = pd.DataFrame(cursor_data)
    # 데이터프레임을 되돌려준다. 
    return df

In [None]:
query1 = """
    SELECT 
    * 
    FROM 
    `sales records` 
    WHERE `Country` in (%s, %s)
"""
select_query(query1, 'South Korea', 'North Korea')

In [None]:
# emp table 에서 특정 조건에 맞는 데이터를 출력 
# SAL 필드에서 1500이상인 사원 정보를 출력
sql_query2 = """
    SELECT 
    * 
    FROM 
    `emp`
    WHERE `SAL` >= 1500
"""
select_query(sql_query2)


In [None]:
sql_query = """
    SELECT 
    * 
    FROM 
    `emp`
"""
df = select_query(sql_query)
df

In [None]:
# df에서 SAL 컬럼의 데이터가 1500이상인 데이터를 출력하시오
flag = df['SAL'] >= 1500
df.loc[flag]

In [None]:
# sql 
# SAL 이 1500이상이고(and) 3000이하인 사원의 이름을 출력 
select_query3 = """
    SELECT 
    `ENAME`
    FROM 
    `emp`
    WHERE 
    `SAL` >= 1500 AND `SAL` <= 3000
"""
select_query(select_query3)

In [None]:
sql_query3 = """
    SELECT
    `ENAME`
    FROM 
    `emp`
    WHERE `SAL` BETWEEN 1500 AND 3000
"""
select_query(sql_query3)

- pandas에서 데이터프레임 필터 
- df[조건식]
- df[컬럼명]
- loc[]
    - 인덱스의 조건식, 컬럼의 조건식
- iloc[]
    - 인덱스의 위치, 컬럼의 위치

In [None]:
flag = df['SAL'] >= 1500
flag2 = df['SAL'] <= 3000

df[flag & flag2][['ENAME']]
df.loc[flag & flag2, ['ENAME']]

In [None]:
# sql
# 사원의 이름이 S 시작하는 사원의 정보를 확인
sql_query4 = """
    SELECT 
    * 
    FROM 
    `emp`
    WHERE `ENAME` LIKE 'S%%'
"""
select_query(sql_query4)

In [None]:
# pandas 
# 조건식 : ENAME 컬럼의 데이터가 S로 시작하는가?
# 문자형 내장함수 : startswith()
# 스리즈 형태 데이터에서 문자형 내장함수 사용 : series.str.함수명()
flag = df['ENAME'].str.startswith('S')

df.loc[flag]

In [None]:
# ENAME에 데이터를 하나씩 뽑아서 앞의 단어가 S 인가?
word = 'S'

# map() 함수 
# series.map( 함수(일반함수, lambda함수) )
flag = df['ENAME'].map(
    # lambda x 의 x는 ENAME 값들이 하나씩 대입
    # if문을 한줄로 표현 : "참일경우 값" if 조건식 else "거짓일경우 값값"
    lambda x : True if x[ : len(word)] == word else False
)
df.loc[flag]

In [None]:
word = 'S'
flag = []
for i in df['ENAME']:
    # i : ENAME의 값들이 하나씩 대입 
    flag.append(i[ : len(word)] == word)
df.loc[flag]

In [None]:
flag = df['ENAME'].str.contains('S')
df.loc[flag]

In [None]:
word = 'S'
flag = df['ENAME'].map(
    lambda x : word in x 
)
df.loc[flag]

In [None]:
# join 
# 두개의 테이블을 결합하는 방식 중 하나 
# 특정한 조건에 맞춰서 테이블의 열을 결합하는 방식 
# pandas에서 merge()와 같은 기능
# emp table과 dept table을 결합 
sql_query5 = """
    SELECT 
    *
    FROM 
    `dept`
"""
dept = select_query(sql_query5)
dept

In [None]:
df

In [None]:
# emp, dept table join 결합 
# left join
join_query = """
    SELECT 
    a.`ENAME`, a.`JOB`, a.`SAL`, b.`DNAME`, b.`LOC`
    FROM 
    `emp` a
    LEFT JOIN 
    `dept` b
    ON a.`DEPTNO` = b.`DEPTNO`
"""
select_query(join_query)

In [None]:
# pandas 
# pandas에서 merge(데이터프레임, 데이터프레임, on = 조건, how = 방식)
pd.merge(df, dept, on='DEPTNO', how = 'left')\
    [ ['ENAME', 'JOB', "SAL", 'DNAME', 'LOC'] ]
# Dataframe에서 merge(데이터프레임, on = 조건, how = 방식)
df.merge(dept, on='DEPTNO', how='left')\
    [ ['ENAME', 'JOB', "SAL", 'DNAME', 'LOC'] ]

In [68]:
# 외부의 데이터베이스에 접속 
_db2 = pymysql.connect(
    host = '172.30.1.56', 
    port = 3306, 
    user = 'ubion', 
    password = '1234', 
    db = 'ubion'
)

In [69]:
# 커서 생성
cursor2 = _db2.cursor(pymysql.cursors.DictCursor)

In [70]:
sql_query = """
    SELECT 
    * 
    FROM
    `tran_1`
"""

In [None]:
cursor.execute(sql_query)

In [72]:
cursor2.execute(sql_query)

5000

In [74]:
# union 결합 
# 2개의 table을 단순하게 행으로 결합 
# pandas에서는 concat() 같은 기능
union_query = """
    SELECT 
    * 
    FROM 
    `tran_1` 
    UNION 
    SELECT 
    *
    FROM 
    `tran_2`
"""
cursor2.execute(union_query)

6786

In [None]:
pd.DataFrame(cursor2.fetchall())

In [76]:
_db.close()
_db2.close()

In [107]:
# Database에 접속하여 query문을 보내는 함수까지 결합하여 Class 생성

# class 키워드를 통해서 class 선언


class MyDB:
    # 독립적으로 저장이 되는 변수를 생성 
    # class가 생성되는 과정에서 바로 호출이 되는 함수 : 생성자 함수 
    # 변수 : 서버의 주소, 포트번호, 유저명, 비밀번호, 데이터베이스명
    # 변수들의 기본값을 설정 ( 로컬 피씨씨 ) 
    def __init__(self, 
                 host = "127.0.0.1", 
                 port = 3306, 
                 user = 'root', 
                 pwd = '1234', 
                 db = 'ubion'):
        self.host = host
        self.port = port
        self.user = user
        self.pwd = pwd
        self.db = db
    
    # 서버와 연결하고 커서를 생성하는 함수 
    def connect_sql(self):
        # 서버와 연결 
        self.server = pymysql.connect(
            host = self.host, 
            port = self.port, 
            user = self.user, 
            password = self.pwd, 
            db = self.db
        )
        # 커서를 생성 (독립적)
        self.cursor = self.server.cursor(pymysql.cursors.DictCursor)
    # 서버와 연결을 종료하는 함수 
    def close_sql(self):
        self.server.close()

    # 쿼리문을 실행하는 함수 
    def execute_query(self, sql_query, *values, inplace = False):
        # 서버와 연결
        self.connect_sql()
        # 커서에 sql_query를 보낸다. 
        self.cursor.execute(sql_query, values)
        # sql_query가 select문이라면?
        # if sql_query.upper().lstrip().startswith('SELECT'):
        if sql_query.upper().split()[0] == 'SELECT':
            # 커서에서 데이터를 가져온다. 
            sql_data = self.cursor.fetchall()
            # 데이터프레임으로 변환
            result = pd.DataFrame(sql_data)
        else:
            # insert, update, delete인 경우
            # inplace True인 경우
            if inplace:
                self.server.commit()
            result = "Query OK"
        
        # 서버와의 연결을 종료
        self.close_sql()
        
        return result

In [None]:
# class 생성 
db1 = MyDB()
# class 생성 -> class 안에 __init__ 함수가 호출 
# 로컬 피씨의 데이터베이스서버에 연결하는 class

In [108]:
db2 = MyDB(
    host = '172.30.1.56', 
    port = 3306,
    user = 'ubion', 
    pwd = '1234', 
    db = 'ubion'
)

In [82]:
# db1, db2 두 class 모두 서버와 연결하는 함수를 호출 
db1.connect_sql()
db2.connect_sql()

In [109]:
# 4개 테이블을 결합 
# tran_1, tran_2 union 결합
# tran_d1, tran_d2 union 결합 
# union 결합 후 join 결합

query_1 = """
    SELECT * FROM 
    (SELECT * FROM `tran_1` 
    UNION 
    SELECT * FROM `tran_2`) as a
    LEFT JOIN 
    (SELECT * FROM `tran_d_1`
    UNION 
    SELECT * FROM `tran_d_2`) as b
    ON a.`transaction_id` = b.`transaction_id`
"""
db2.execute_query(query_1)

Unnamed: 0,transaction_id,price,payment_date,customer_id,detail_id,b.transaction_id,item_id,quantity
0,T0000000113,210000,2019-02-01 01:36:57,PL563502,0,T0000000113,S005,1
1,T0000000114,50000,2019-02-01 01:37:23,HD678019,1,T0000000114,S001,1
2,T0000000115,120000,2019-02-01 02:34:19,HD298120,2,T0000000115,S003,1
3,T0000000116,210000,2019-02-01 02:47:23,IK452215,3,T0000000116,S005,1
4,T0000000117,170000,2019-02-01 04:33:46,PL542865,4,T0000000117,S002,2
...,...,...,...,...,...,...,...,...
7139,T0000006887,210000,2019-07-31 19:43:42,AS961301,7132,T0000006887,S005,1
7140,T0000006888,210000,2019-07-31 20:05:45,GD025393,7133,T0000006888,S005,1
7141,T0000006891,50000,2019-07-31 20:28:20,HI337854,7136,T0000006891,S001,1
7142,T0000006894,180000,2019-07-31 21:20:44,HI400734,7139,T0000006894,S004,1


In [102]:
values = 'tran_1'
query_2 = f"""SELECT * FROM `{values}`"""
tran_1 = db2.execute_query(query_2)
tran_1

Unnamed: 0,transaction_id,price,payment_date,customer_id
0,T0000000113,210000,2019-02-01 01:36:57,PL563502
1,T0000000114,50000,2019-02-01 01:37:23,HD678019
2,T0000000115,120000,2019-02-01 02:34:19,HD298120
3,T0000000116,210000,2019-02-01 02:47:23,IK452215
4,T0000000117,170000,2019-02-01 04:33:46,PL542865
...,...,...,...,...
4995,T0000005108,210000,2019-06-15 02:42:41,HD315748
4996,T0000005109,150000,2019-06-15 03:36:16,HI215420
4997,T0000005110,50000,2019-06-15 03:44:06,IK880102
4998,T0000005111,210000,2019-06-15 04:14:06,IK074758


In [91]:
values = 'tran_2'
query_2 = f"SELECT * FROM `{values}`"
tran_2 = db2.execute_query(query_2)

In [93]:
table_list = ['tran_1', 'tran_2', 'tran_d_1', 'tran_d_2']

for i in table_list:
    query_3 = f"SELECT * FROM `{i}`"
    globals()[i] = db2.execute_query(query_3)

In [96]:
# tran_1, tran_2 concat() 결합 
tran = pd.concat( [tran_1, tran_2], axis='rows', ignore_index=True )
tran_d = pd.concat( [tran_d_1, tran_d_2], axis = 0, ignore_index=True )

In [97]:
# tran, tran_d merge를 이용하여 결합 
df = pd.merge(tran, tran_d, on = 'transaction_id', how='left')
df.head()

Unnamed: 0,transaction_id,price,payment_date,customer_id,detail_id,item_id,quantity
0,T0000000113,210000,2019-02-01 01:36:57,PL563502,0,S005,1
1,T0000000114,50000,2019-02-01 01:37:23,HD678019,1,S001,1
2,T0000000115,120000,2019-02-01 02:34:19,HD298120,2,S003,1
3,T0000000116,210000,2019-02-01 02:47:23,IK452215,3,S005,1
4,T0000000117,170000,2019-02-01 04:33:46,PL542865,4,S002,2


In [110]:
# 생성한 모듈을 로드 
import database

In [111]:
# 모듈 안에 존재하는 MyDB class를 생성
mod_db = database.MyDB()

In [112]:
import sys

In [113]:
sys.path

['c:\\ubion_2025\\python\\250318',
 'C:\\pyCode\\packages',
 'C:\\pyCode\\modules',
 'c:\\Users\\moons\\AppData\\Local\\Programs\\Python\\Python311\\python311.zip',
 'c:\\Users\\moons\\AppData\\Local\\Programs\\Python\\Python311\\Lib',
 'c:\\Users\\moons\\AppData\\Local\\Programs\\Python\\Python311\\DLLs',
 '',
 'C:\\Users\\moons\\AppData\\Roaming\\Python\\Python311\\site-packages',
 'C:\\Users\\moons\\AppData\\Roaming\\Python\\Python311\\site-packages\\win32',
 'C:\\Users\\moons\\AppData\\Roaming\\Python\\Python311\\site-packages\\win32\\lib',
 'C:\\Users\\moons\\AppData\\Roaming\\Python\\Python311\\site-packages\\Pythonwin',
 'c:\\Users\\moons\\AppData\\Local\\Programs\\Python\\Python311',
 'c:\\Users\\moons\\AppData\\Local\\Programs\\Python\\Python311\\Lib\\site-packages']