# 資料庫

- 資料庫是結構化的資訊以電子化的方式井然有序地儲存在電腦系統的集合。資料庫通常由資料庫管理系統 （DBMS） 控制。
- 資料和 DBMS 以及與之關聯的應用程式統稱為資料庫系統，通常簡稱為資料庫。
- 資料庫通常儲存於硬碟或外部的儲存裝置中，資料不會因為程式結束而消失。


# 資料庫管理系統（DBMS）

## 定義
資料庫管理系統（DBMS）是用來建立、管理和操作資料庫的軟體。它提供了系統化的方法來處理數據，使使用者能夠有效率地存取和處理資訊。

## 功能
DBMS 的主要功能包括：
- **資料儲存**: 提供方法持久化儲存資料。
- **資料檢索**: 允許使用者進行查詢，以檢索特定資料。
- **資料操作**: 支援資料的新增、更新、刪除和修改。
- **資料安全**: 確保資料的安全性和隱私保護。
- **資料備份與恢復**: 提供資料備份和災難恢復的機制。

## 種類
DBMS 種類有許多種形式，其中包含：
- **關聯式資料庫管理系統 (RDBMS)**: 如 MySQL、PostgreSQL、SQLite。使用表格儲存資料，支援 SQL 語言進行資料操作。
- **非關聯式資料庫管理系統 (NoSQL)**: 如 MongoDB、Cassandra。適合非結構化資料，提供更靈活的資料模型。
- **雲端資料庫(cloud database)**: 透過雲端技術，利用網頁瀏覽器或是 API 操作存放於雲端環境中的資料庫。

## 關聯式資料庫（RDBMS）

- 以一系列表（table）中的 行（column）與 列（row）建構，以提高處理和資料查詢的效率
- 可以輕鬆地存取、管理、修改、更新、控制和組織資料
- 有許多知名的資料庫管理系統，像是 Oracle, MySQL, Microsoft SQL Server,PostgreSQL, and SQLite 等
- 大多使用結構化查詢語言 (SQL) 來編寫和查詢資料

![ROWandCol](table.png)


## SQLite and SQLite Browser
- SQLite 是一個輕型且將資料庫檔案存放於本機硬碟中的開源資料庫管理系統
- 有許多應用程式將 SQLite 做為程式內部的儲存裝置
- 也可作為應用於大型資料庫的原型
- Python 中使用 sqlite3 模組為 SQL 介面與 SQLite 溝通
- SQLite Browser 為方便我們瀏覽 SQLite 內容的瀏覽工具 
![SQL](SQLandBrowser.png)


# 基礎 SQL 語法介紹

SQL（Structured Query Language）是一種用於管理關聯式資料庫的標準編程語言。它用於存取、更新和管理資料。以下是一些基本的 SQL 語法：

## 創建資料庫
```sql
CREATE DATABASE database_name;
```
這個指令用於創建一個新的資料庫。

## 創建表格
```sql
CREATE TABLE table_name (
    column1 datatype,
    column2 datatype,
    column3 datatype,
   ....
);
```
此指令用於在資料庫中創建新表格。`datatype` 指定列的數據類型，例如 `INT`, `VARCHAR`, `DATE` 等。

## 插入數據
```sql
INSERT INTO table_name (column1, column2, column3, ...)
VALUES (value1, value2, value3, ...);
```
此指令用於向表中插入新的數據行。

## 查詢數據
```sql
SELECT column1, column2, ...
FROM table_name;
```
這個指令用於從表格中選擇數據。使用 `*` 可以選擇所有列。

## 更新數據
```sql
UPDATE table_name
SET column1 = value1, column2 = value2, ...
WHERE condition;
```
此指令用於更新表中的數據。`WHERE` 子句用於指定應更新哪些行。

## 刪除數據
```sql
DELETE FROM table_name WHERE condition;
```
此指令用於從表中刪除數據。`WHERE` 子句用於指定應刪除哪些行。

## WHERE 子句
```sql
SELECT column1, column2, ...
FROM table_name
WHERE condition;
```
`WHERE` 子句用於過濾記錄。

## JOIN 聯接
```sql
SELECT column_name(s)
FROM table1
JOIN table2
ON table1.column_name = table2.column_name;
```
`JOIN` 語句用於結合兩個或多個表中的行。

以上是 SQL 的一些基本語法。SQL 是非常強大且靈活的，適用於各種數據處理和查詢的需求。
```



In [1]:
import sqlite3
import csv

In [15]:
conn = sqlite3.connect("hahow202311.sqlite")

In [16]:
cur = conn.cursor()

In [None]:
cur.execute("DROP TABLE IF EXISTS Stocks")

In [18]:
with open("/Users/lzrong/Downloads/MI_INDEX_24_20231025.csv", encoding="big5") as f:
    next(f)
    next(f)
    data = csv.DictReader(f)
    data_list = list(data)

In [21]:
col_name = list(data_list[0].keys())
col_name

['證券代號',
 '證券名稱',
 '成交股數',
 '成交筆數',
 '成交金額',
 '開盤價',
 '最高價',
 '最低價',
 '收盤價',
 '漲跌(+/-)',
 '漲跌價差',
 '最後揭示買價',
 '最後揭示買量',
 '最後揭示賣價',
 '最後揭示賣量',
 '本益比',
 '']

In [36]:
cur.execute("DROP TABLE IF EXISTS Stocks")
cur.execute(f"CREATE TABLE Stocks ({col_name[1]} TEXT, {col_name[8]} FLOAT )")

for row in data_list:
    if row[col_name[1]] == None or row[col_name[1]] == "":
        continue
    cur.execute(f"INSERT INTO Stocks ({col_name[1]}, {col_name[8]}) VALUES (?, ?)", (row[col_name[1]], row[col_name[8]]))
conn.commit()      

In [37]:
row = cur.execute("SELECT * FROM Stocks")
for r in row:
    print(r)

('麗正', 18.75)
('聯電', 49.05)
('華泰', 42.5)
('台積電', 544.0)
('旺宏', 29.65)
('光罩', 71.1)
('台亞', 49.5)
('茂矽', 34.8)
('華邦電', 25.8)
('順德', 115.0)
('矽統', 53.0)
('菱生', 23.25)
('瑞昱', 401.5)
('威盛', 124.0)
('凌陽', 32.5)
('南亞科', 68.0)
('統懋', 33.15)
('偉詮電', 70.6)
('超豐', 58.4)
('京元電子', 82.0)
('創見', 74.8)
('聯發科', 822.0)
('義隆', 144.5)
('強茂', 62.9)
('晶豪科', 91.0)
('聯陽', 169.0)
('嘉晶', 58.3)
('聯詠', 435.5)
('智原', 325.0)
('揚智', 27.35)
('聯傑', 37.4)
('景碩', 97.7)
('虹冠電', 71.1)
('京鼎', 188.0)
('創意', '1,490.00')
('聯鈞', 61.1)
('晶相光', 92.1)
('台勝科', 154.0)
('敦泰', 81.1)
('辛耘', 198.0)
('通嘉', 71.4)
('瑞鼎', 363.5)
('世芯-KY', '2,620.00')
('達能', 13.2)
('日月光投控', 114.0)
('新唐', 129.0)
('凌通', 51.7)
('天鈺', 258.5)
('十銓', 74.6)
('立積', 127.0)
('全訊', 166.5)
('祥碩', '1,325.00')
('界霖', 74.0)
('松翰', 49.15)
('盛群', 65.2)
('力成', 106.0)
('迅杰', 53.5)
('矽格', 62.0)
('同欣電', 147.5)
('矽力*-KY', 293.0)
('訊芯-KY', 145.0)
('穎崴', 673.0)
('捷敏-KY', 65.6)
('達發', 422.0)
('愛普*', 382.5)
('晶心科', 412.0)
('易華電', 38.05)
('虹揚-KY', 15.1)
('芯鼎', 47.8)
('力智', 251.0)
('威

In [39]:
cur.execute(f"DELETE FROM Stocks where {col_name[8]} < 40")
conn.commit()

In [40]:
row = cur.execute("SELECT * FROM Stocks")
for r in row:
    print(r)

('聯電', 49.05)
('華泰', 42.5)
('台積電', 544.0)
('光罩', 71.1)
('台亞', 49.5)
('順德', 115.0)
('矽統', 53.0)
('瑞昱', 401.5)
('威盛', 124.0)
('南亞科', 68.0)
('偉詮電', 70.6)
('超豐', 58.4)
('京元電子', 82.0)
('創見', 74.8)
('聯發科', 822.0)
('義隆', 144.5)
('強茂', 62.9)
('晶豪科', 91.0)
('聯陽', 169.0)
('嘉晶', 58.3)
('聯詠', 435.5)
('智原', 325.0)
('景碩', 97.7)
('虹冠電', 71.1)
('京鼎', 188.0)
('創意', '1,490.00')
('聯鈞', 61.1)
('晶相光', 92.1)
('台勝科', 154.0)
('敦泰', 81.1)
('辛耘', 198.0)
('通嘉', 71.4)
('瑞鼎', 363.5)
('世芯-KY', '2,620.00')
('日月光投控', 114.0)
('新唐', 129.0)
('凌通', 51.7)
('天鈺', 258.5)
('十銓', 74.6)
('立積', 127.0)
('全訊', 166.5)
('祥碩', '1,325.00')
('界霖', 74.0)
('松翰', 49.15)
('盛群', 65.2)
('力成', 106.0)
('迅杰', 53.5)
('矽格', 62.0)
('同欣電', 147.5)
('矽力*-KY', 293.0)
('訊芯-KY', 145.0)
('穎崴', 673.0)
('捷敏-KY', 65.6)
('達發', 422.0)
('愛普*', 382.5)
('晶心科', 412.0)
('芯鼎', 47.8)
('力智', 251.0)
('威鋒電子', 211.5)
('采鈺', 225.5)
('來頡', 128.0)
('錼創科技-KY創', 88.0)
('矽創', 275.5)
('昇陽半導體', 51.2)
('致新', 256.0)
('南茂', 42.0)
('富鼎', 86.9)
('宇瞻', 57.6)


In [65]:
with open("/Users/lzrong/Downloads/t51sb01_20231116_221849533.csv", encoding="big5") as f:
    data = csv.DictReader(f)
    data_list = list(data)
col_name = list(data_list[0].keys())

In [68]:
print(col_name)
print(data_list)

['公司代號', '公司名稱', '公司簡稱', '產業類別', '外國企業註冊地國', '住址', '營利事業統一編號', '董事長', '總經理', '發言人', '發言人職稱', '代理發言人', '總機電話', '成立日期', '上市日期', '普通股每股面額', '實收資本額(元)', '已發行普通股數或TDR原發行股數', '私募普通股(股)', '特別股(股)', '編製財務報告類型', '普通股盈餘分派或虧損撥補頻率', '普通股年度(含第4季或後半年度)現金股息及紅利決議層級', '股票過戶機構', '過戶電話', '過戶地址', '簽證會計師事務所', '簽證會計師1', '簽證會計師2', '英文簡稱', '英文通訊地址', '傳真機號碼', '電子郵件信箱', '公司網址', '投資人關係聯絡人', '投資人關係聯絡人職稱', '投資人關係聯絡電話', '投資人關係聯絡電子郵件', '公司網站內利害關係人專區網址']
[{'公司代號': '2302', '公司名稱': '麗正國際科技股份有限公司', '公司簡稱': '麗正', '產業類別': '半導體業', '外國企業註冊地國': '－', '住址': '新北市土城區中山路71號', '營利事業統一編號': '\t04982433', '董事長': '林怡岑', '總經理': '林怡岑', '發言人': '林瑞萍', '發言人職稱': '總管理處副總經理', '代理發言人': '王作慈', '總機電話': '02-28801122', '成立日期': '1976/01/23', '上市日期': '1985/01/15', '普通股每股面額': '新台幣                 10.0000元', '實收資本額(元)': '1663028810', '已發行普通股數或TDR原發行股數': '166302881', '私募普通股(股)': '0', '特別股(股)': '0', '編製財務報告類型': '合併', '普通股盈餘分派或虧損撥補頻率': '每年', '普通股年度(含第4季或後半年度)現金股息及紅利決議層級': '股東會', '股票過戶機構': '國票綜合證券(股)公司股務代理部', '過戶電話': '02-25288988', '過戶地址': '台北市松山區南京東路五段18

In [51]:
ticker = col_name[0]
name = col_name[1]
stock_name = col_name[2]
stock_type = col_name[3]

In [47]:
# cur.execute("DROP TABLE IF EXISTS Stocks")
# conn.commit()

In [56]:
cur.execute("DROP TABLE IF EXISTS Stocks")
cur.execute(f"""CREATE TABLE Stocks (
                    ticker VARCHER(10) PRIMARY KEY, 
                    name VARCHER(100),
                    stock_name VARCHER(10),
                    stock_type VARCHER(20))""")

for row in data_list:
#     if row[col_name[1]] == None or row[col_name[1]] == "":
#         continue
    cur.execute(f"""INSERT INTO Stocks (ticker, name, stock_name, stock_type) 
                    VALUES (?, ?, ?, ?)"""
                , (row[ticker], row[name], row[stock_name], row[stock_type]))
conn.commit()   

In [57]:
row = cur.execute("SELECT * FROM stocks")
for r in row:
    print(r)

(2302, '麗正國際科技股份有限公司', '麗正', '半導體業')
(2303, '聯華電子股份有限公司', '聯電', '半導體業')
(2329, '華泰電子股份有限公司', '華泰', '半導體業')
(2330, '台灣積體電路製造股份有限公司', '台積電', '半導體業')
(2337, '旺宏電子股份有限公司', '旺宏', '半導體業')
(2338, '台灣光罩股份有限公司', '光罩', '半導體業')
(2340, '台亞半導體股份有限公司', '台亞', '半導體業')
(2342, '台灣茂矽電子股份有限公司', '茂矽', '半導體業')
(2344, '華邦電子股份有限公司', '華邦電', '半導體業')
(2351, '順德工業股份有限公司', '順德', '半導體業')
(2363, '矽統科技股份有限公司', '矽統', '半導體業')
(2369, '菱生精密工業股份有限公司', '菱生', '半導體業')
(2379, '瑞昱半導體股份有限公司', '瑞昱', '半導體業')
(2388, '威盛電子股份有限公司', '威盛', '半導體業')
(2401, '凌陽科技股份有限公司', '凌陽', '半導體業')
(2408, '南亞科技股份有限公司', '南亞科', '半導體業')
(2434, '統懋半導體股份有限公司', '統懋', '半導體業')
(2436, '偉詮電子股份有限公司', '偉詮電', '半導體業')
(2441, '超豐電子股份有限公司', '超豐', '半導體業')
(2449, '京元電子股份有限公司', '京元電子', '半導體業')
(2451, '創見資訊股份有限公司', '創見', '半導體業')
(2454, '聯發科技股份有限公司', '聯發科', '半導體業')
(2458, '義隆電子股份有限公司', '義隆', '半導體業')
(2481, '強茂股份有限公司', '強茂', '半導體業')
(3006, '晶豪科技股份有限公司', '晶豪科', '半導體業')
(3014, '聯陽半導體股份有限公司', '聯陽', '半導體業')
(3016, '嘉晶電子股份有限公司', '嘉晶', '半導體業')
(3034, '聯詠科技股份有限公司', '聯詠', '半導體業')


In [76]:
with open("/Users/lzrong/Downloads/MI_INDEX_24_20231025.csv", encoding="big5") as f:
    next(f)
    next(f)
    data = csv.DictReader(f)
    data_list = list(data)
col_name = list(data_list[0].keys())
cur.execute("DROP TABLE IF EXISTS trades")
cur.execute(f"""CREATE TABLE trades (
                ticker_id VARCHER(10) PRIMARY KEY,
                open FLOAT,
                high FLOAT,
                low FLOAT,
                close FLOAT,
                date DATE)""")

for row in data_list:
    if row[col_name[1]] == None or row[col_name[1]] == "":
        continue
    cur.execute(f"""INSERT INTO trades (ticker_id, open, high, low, close, date) 
                    VALUES (?, ?, ?, ?, ?, ?)""",
                (row[col_name[0]], row[col_name[5]], row[col_name[6]], row[col_name[7]], row[col_name[8]], "2023-10-25"))
conn.commit()      

In [81]:
row = cur.execute("""SELECT ticker, stock_name, close FROM stocks 
                     JOIN trades ON stocks.ticker = trades.ticker_id 
                     WHERE date = '2023-10-25' AND close > 100""")

for r in row:
    print(r)

(2330, '台積電', 544.0)
(2351, '順德', 115.0)
(2379, '瑞昱', 401.5)
(2388, '威盛', 124.0)
(2454, '聯發科', 822.0)
(2458, '義隆', 144.5)
(3014, '聯陽', 169.0)
(3034, '聯詠', 435.5)
(3035, '智原', 325.0)
(3413, '京鼎', 188.0)
(3443, '創意', '1,490.00')
(3532, '台勝科', 154.0)
(3583, '辛耘', 198.0)
(3592, '瑞鼎', 363.5)
(3661, '世芯-KY', '2,620.00')
(3711, '日月光投控', 114.0)
(4919, '新唐', 129.0)
(4961, '天鈺', 258.5)
(4968, '立積', 127.0)
(5222, '全訊', 166.5)
(5269, '祥碩', '1,325.00')
(6239, '力成', 106.0)
(6271, '同欣電', 147.5)
(6415, '矽力*-KY', 293.0)
(6451, '訊芯-KY', 145.0)
(6515, '穎崴', 673.0)
(6526, '達發', 422.0)
(6531, '愛普*', 382.5)
(6533, '晶心科', 412.0)
(6719, '力智', 251.0)
(6756, '威鋒電子', 211.5)
(6789, '采鈺', 225.5)
(6799, '來頡', 128.0)
(8016, '矽創', 275.5)
(8081, '致新', 256.0)
