# Making Database
sqlite서버와 연결 후 Demo Database는 같은 디렉토리에 있는 Northwind.db로 합니다.

## base Variables and functions

In [None]:
import sqlite3

In [None]:
!pwd
!rm Northwind.db
!cp Northwind_Ori.db Northwind.db
!ls

In [None]:
#database = 'my.db'
database = 'Northwind.db'
def sendQuery(sql):
    try:
        with sqlite3.connect(database) as conn:
            cursor = conn.cursor()
            cursor.execute(sql)
            conn.commit()
            return cursor.fetchall()
        
    except sqlite3.Error as e:
        print(e)

def sendQueryWithData(sql, data):
    try:
        with sqlite3.connect(database) as conn:
            cursor = conn.cursor()
            for date in data:
                cursor.execute(sql, date)
            conn.commit()
            return cursor.fetchall()
        
    except sqlite3.Error as e:
        print(e)
    

# main tutorials

## SELECT
SELECT는 원하는 테이블에서 원하는 Column에 해당하는 데이터를 반환하는 쿼리문이다.

In [None]:
sql = "SELECT * FROM Customers;"
sendQuery(sql)

In [None]:
sql = "SELECT CustomerName, City FROM Customers;"
sendQuery(sql)

In [None]:
sql = "SELECT DISTINCT Country FROM Customers;"
sendQuery(sql)

In [None]:
sql = "SELECT Country FROM Customers;"
sendQuery(sql)

DISTINCT는 처음본다. 실행해보면 중복되는 데이터는 지우고 준다는 것을 알 수 있다.

## WHERE
조건을 거는 구문이다.

In [None]:
sql = "SELECT * FROM Customers WHERE Country='Mexico';"
sendQuery(sql)

In [None]:
sql = """SELECT * FROM Customers
         WHERE CustomerID=1;"""
sendQuery(sql)

In [None]:
sql = """SELECT * FROM Customers
         WHERE CustomerID > 80;"""
sendQuery(sql)

WHERE과 쓰일 수 있는 연산자는 =, >, <, >=, <=, <>, BETWEEN, LIKE, IN이 있다.

## ORDER BY
ORDER BY는 데이터를 정렬해주는 쿼리문이다.

In [None]:
sql = "SELECT * FROM Products ORDER BY Price;"
sendQuery(sql)

In [None]:
sql = "SELECT * FROM Products ORDER BY Price DESC;"
sendQuery(sql)

In [None]:
sql = "SELECT * FROM Customers ORDER BY Country, CustomerName;"
sendQuery(sql)

In [None]:
sql = "SELECT * FROM Customers ORDER BY Country ASC, CustomerName DESC;"
sendQuery(sql)

특징으로는 ASC, DESC를 뒤에 써줄 수 있다. 숫자뿐만 아니라 알파벳 문자열에도 사용 가능하며, 여러 column을 붙이면 맨 처음 입력한 칼럼부터 우선순위를 가지고 정렬한다. 

## AND / OR / NOT
논리 연산자이다. AND, OR는 각 논리식을 연결하는데 사용된다. NOT은 이미 논리연산을 한 조건을 뒤집을 때 사용한다.

In [None]:
sql = """ SELECT *
          FROM Customers
          WHERE Country = 'Spain' AND CustomerName Like 'G%'; """
sendQuery(sql)

In [None]:
sql = """ SELECT *
          FROM Customers
          WHERE Country = 'Spain' OR Country = 'Germany'; """
sendQuery(sql)

In [None]:
sql = """ SELECT DISTINCT Country FROM Customers
          WHERE NOT Country = 'Spain';"""
sendQuery(sql)

AND OR NOT을 섞어 쓸 수 있다. 연산자 우선순위는 AND가 OR보다 높다. NOT은 대부분의 경우에 연산자로 대체가 가능하다. 또, LIKE, BETWEEN, IN 앞에도 쓸 수 있다

## INSERT INTO
Table에 row를 추가하는 구문이다.

In [None]:
sql = """ INSERT INTO Customers (CustomerName, ContactName, Address, City, PostalCode, Country)
VALUES ('Cardinal', 'Tom B. Erichsen', 'Skagen 21', 'Stavanger', '4006', 'Norway'); """
sendQuery(sql)

In [None]:
sql = "SELECT * FROM Customers WHERE CustomerName='Cardinal';"
sendQuery(sql)

Cardinal씨가 리스트에 잘 추가되었다.

## NUlL, IS NULL, IS NOT NULL
NULL 값은 아무 것도 입력이 안된 값이다.

In [None]:
sql = """SELECT CustomerName, ContactName, Address
         FROM Customers
         WHERE Address IS NULL;"""
sendQuery(sql)

In [None]:
sql = """SELECT CustomerName, ContactName, Address
         FROM Customers
         WHERE Address IS NOT NULL;"""
sendQuery(sql)

Customer 테이블에 주소가 등록되지 않은 사람은 아무도 없는 모양이다.

## UPDATE
데이터 값을 바꾸는(갱신하는) 쿼리문이다.

In [None]:
sql = """UPDATE Customers
         SET ContactName = 'Alfred Schmidt', City= 'Frankfurt'
         WHERE CustomerID = 1;"""
sendQuery(sql)

In [None]:
sql = """SELECT *
         FROM Customers
         WHERE CustomerID = 1;"""
sendQuery(sql)

알프레드씨의 정보가 잘 업데이트 되었다. UPDATE를 쓸 때는 WHERE로 조건을 꼭 걸어주자. 그렇지 않으면 모든 데이터가 업데이트 될 수 있다.

## DELETE, DROP
무언가를 삭제하는 쿼리문이다. 이하는 예문이다. 이하는 실행하지 않는 것을 추천한다. 다음에도 계속해서 Customer를 사용한다.

In [None]:
#sql = "DELETE FROM Customers WHERE CustomerName='Alfreds Futterkiste';"
sendQuery(sql)

In [None]:
#sql = "SELECT CustomerName FROM Customers;"
sendQuery(sql)

In [None]:
#sql = "DELETE FROM Customers;"
sendQuery(sql)

In [None]:
#sql = "DROP TABLE Customers;"
sendQuery(sql)

WHERE 조건문을 꼭 달자. 안그럼 테이블 전체가 다 지워진다.

## TOP, LIMIT, FETCH FIRST, ROWNUM
맨 위의 몇개의 row만 가져오게 제한을 거는 구문이다


In [None]:
#sql = "SELECT TOP 3 * FROM Customers;"
sql = "SELECT * FROM Customers LIMIT 3;"
#sql = "SELECT * FROM Customers FETCH FIRST 3 ONLY;"
sendQuery(sql)

sql = "SELECT TOP 3 * FROM Customers;"
sql = "SELECT * FROM Customers LIMIT 3;"
sql = "SELECT * FROM Customers FETCH FIRST 3;"
다 같은 내용의 쿼리문이지만 두번째 LIMIT만 작동을 한다. 추측해보건데 PERCENT를 막기 위해 이렇게 된것이 아닐까 싶다.

In [None]:
sql = """SELECT * FROM Customers LIMIT 3
         ORDER BY CustomerName DESC;"""
sendQuery(sql)

In [None]:
sql = """SELECT * FROM Customers
         ORDER BY CustomerName DESC
         LIMIT 3;"""
sendQuery(sql)

sql = "SELECT * FROM Customers LIMIT 3 ORDER BY CustomerName DESC;"가 되지 않았다. LIMIT로 조금 받아온 데이터를 정렬하고 싶으면 어떻게 해야 하는가? 라는 질문이 생긴다.

## Aggregate Functions

### MIN, MAX (AS, GROUP BY)
지정한 Column의 최대, 최소를 반환한다.

In [None]:
sql = "SELECT MIN(Price) FROM Products"
sendQuery(sql)

In [None]:
sql = "SELECT MAX(Price) FROM Products"
sendQuery(sql)

In [None]:
sendQuery("""SELECT MIN(Price) AS SmallestPrice, CategoryID
             FROM Products;
             GROUP BY CategoryID;""")

AS와 GROUP BY가 등장했다. AS는 TABLE의 칼럼 레이블을 원하는 다른 이름으로 바꿔서 SELECT의 결과로 보내주는 역할을 한다. 또한 Group by는 pandas의 그것과 같이 같은 값을 가진 row끼리 모아서 연산시키는 함수이다.

### COUNT
엑셀의 count 함수처럼 개수를 세준다

In [None]:
sql = "SELECT COUNT(*) FROM Products"
sendQuery(sql)

where함수와 적절이 섞어 쓰면 엑셀의 countif함수처럼 사용할 수 있다.

### SUM

In [None]:
sql = "SELECT SUM(Quantity) FROM OrderDetails;"
sendQuery(sql)

In [None]:
sql = "SELECT OrderID, SUM(Quantity) AS [Total Quantity] FROM OrderDetails GROUP BY OrderID;"
sendQuery(sql)

In [None]:
sql = """SELECT SUM(Price * Quantity)
FROM OrderDetails
LEFT JOIN Products ON OrderDetails.ProductID = Products.ProductID;"""
sendQuery(sql)

Where을 섞어 쓰면 sumif함수를 엑셀에서 쓰듯이 쓸 수 있고, GROUP BY를 이용하면 같은 값에 대한 다른 칼럼의 합을 구할 수 있다.

### AVG
말 그대로 평균을 구하는 함수이다.

In [None]:
sql = "SELECT AVG(Price) FROM Products;"
sendQuery(sql)

In [None]:
sql = "SELECT * FROM Products WHERE price > (SELECT AVG(price) FROM Products);"
sendQuery(sql)

sum과 마찬가지로 where과 같이 쓰면 조건에 부합하는 데이터의 평균이 구해지고, group by를 쓰면 해당 값과 동일한 값끼리 평균을 구하는 연산을 하게 된다. 특이한 쓰임세로는 where문 내부에 avg를 넣어서 평균보다 높은/낮은 값을 갖는 데이터를 불러올수도 있다.

## LIKE, wild card
정규 표현문을 사용하듯이 쓸 수 있는 키워드이다


In [None]:
sql = "SELECT * FROM Customers WHERE CustomerName LIKE 'a%';"
sendQuery(sql)

이 키워드를 잘 쓰기 위해선 와일드카드를 잘 알아야 한다. 

* _는 해당 위치에 아무 문자나 와도 된다는 의미이다.
* %는 해당 위치에는 임의 길이를 갖는 문자열이 들어가도 된다는 의미이다.

## IN
WHERE과 함께 쓰여서 복수의 조건을 한번에 나타내기 위해 쓰인다.

In [None]:
sql = "SELECT * FROM Customers WHERE Country IN ('Germany', 'France', 'UK');"
sendQuery(sql)

In [None]:
sql = "SELECT * FROM Customers WHERE CustomerID IN (SELECT CustomerID FROM Orders);"
sendQuery(sql)

NOT과 함께 쓰여서 부정을 취할수도 있고 내부 조건으로 다른 SELECT의 결과를 줄 수도 있다.

## BETWEEN
범위를 결정하는 키워드이다. 숫자뿐 아니라 문자열 날짜에도 사용가능하다.

In [None]:
sql = "SELECT * FROM Products WHERE Price BETWEEN 10 AND 20;"
sendQuery(sql)

In [None]:
sql = """SELECT * FROM Products
         WHERE ProductName BETWEEN 'Carnarvon Tigers' AND 'Mozzarella di Giovanni'
         ORDER BY ProductName;"""
sendQuery(sql)

In [None]:
sql = "SELECT * FROM Orders WHERE OrderDate BETWEEN '1996-07-01' AND '1996-07-31';"
sendQuery(sql)

## AS (Aliases)
테이블에서 불러오고자 하는 데이터의 column과 내가 다루고자 하는 데이터의 column이 다를 때 요긴하게 쓰인다. 쓰고자 하는 데이터 명에 스페이스 바, 공백문자가 들어가면 대괄호로 쳐서 해결하던가, 큰ㅈ따오포를 쳐서 해결해야 한다.

In [185]:
sql = "SELECT CustomerID AS ID, CustomerName AS Customer FROM Customers;"
sendQuery(sql)

[(1, 'Alfreds Futterkiste'),
 (2, 'Ana Trujillo Emparedados y helados'),
 (3, 'Antonio Moreno Taquería'),
 (4, 'Around the Horn'),
 (5, 'Berglunds snabbköp'),
 (6, 'Blauer See Delikatessen'),
 (7, 'Blondel père et fils'),
 (8, 'Bólido Comidas preparadas'),
 (9, "Bon app''"),
 (10, 'Bottom-Dollar Marketse'),
 (11, "B''s Beverages"),
 (12, 'Cactus Comidas para llevar'),
 (13, 'Centro comercial Moctezuma'),
 (14, 'Chop-suey Chinese'),
 (15, 'Comércio Mineiro'),
 (16, 'Consolidated Holdings'),
 (17, 'Drachenblut Delikatessend'),
 (18, 'Du monde entier'),
 (19, 'Eastern Connection'),
 (20, 'Ernst Handel'),
 (21, 'Familia Arquibaldo'),
 (22, 'FISSA Fabrica Inter. Salchichas S.A.'),
 (23, 'Folies gourmandes'),
 (24, 'Folk och fä HB'),
 (25, 'Frankenversand'),
 (26, 'France restauration'),
 (27, 'Franchi S.p.A.'),
 (28, 'Furia Bacalhau e Frutos do Mar'),
 (29, 'Galería del gastrónomo'),
 (30, 'Godos Cocina Típica'),
 (31, 'Gourmet Lanchonetes'),
 (32, 'Great Lakes Food Market'),
 (33, 'GROSELL

In [187]:
#sql ="SELECT ProductName AS [My Great Products] FROM Products;"
sql ="SELECT ProductName AS "My Great Products" FROM Products;"
sendQuery(sql)

[('Chais',),
 ('Chang',),
 ('Aniseed Syrup',),
 ("Chef Anton's Cajun Seasoning",),
 ("Chef Anton's Gumbo Mix",),
 ("Grandma's Boysenberry Spread",),
 ("Uncle Bob's Organic Dried Pears",),
 ('Northwoods Cranberry Sauce',),
 ('Mishi Kobe Niku',),
 ('Ikura',),
 ('Queso Cabrales',),
 ('Queso Manchego La Pastora',),
 ('Konbu',),
 ('Tofu',),
 ('Genen Shouyu',),
 ('Pavlova',),
 ('Alice Mutton',),
 ('Carnarvon Tigers',),
 ('Teatime Chocolate Biscuits',),
 ("Sir Rodney's Marmalade",),
 ("Sir Rodney's Scones",),
 ("Gustaf's Knäckebröd",),
 ('Tunnbröd',),
 ('Guaraná Fantástica',),
 ('NuNuCa Nuß-Nougat-Creme',),
 ('Gumbär Gummibärchen',),
 ('Schoggi Schokolade',),
 ('Rössle Sauerkraut',),
 ('Thüringer Rostbratwurst',),
 ('Nord-Ost Matjeshering',),
 ('Gorgonzola Telino',),
 ('Mascarpone Fabioli',),
 ('Geitost',),
 ('Sasquatch Ale',),
 ('Steeleye Stout',),
 ('Inlagd Sill',),
 ('Gravad lax',),
 ('Côte de Blaye',),
 ('Chartreuse verte',),
 ('Boston Crab Meat',),
 ("Jack's New England Clam Chowder",),


Table에도 가능하다.

In [190]:
sql = "SELECT * FROM Customers AS Persons;"
sendQuery(sql)

[(1,
  'Alfreds Futterkiste',
  'Maria Anders',
  'Obere Str. 57',
  'Berlin',
  '12209',
  'Germany'),
 (2,
  'Ana Trujillo Emparedados y helados',
  'Ana Trujillo',
  'Avda. de la Constitución 2222',
  'México D.F.',
  '5021',
  'Mexico'),
 (3,
  'Antonio Moreno Taquería',
  'Antonio Moreno',
  'Mataderos 2312',
  'México D.F.',
  '5023',
  'Mexico'),
 (4,
  'Around the Horn',
  'Thomas Hardy',
  '120 Hanover Sq.',
  'London',
  'WA1 1DP',
  'UK'),
 (5,
  'Berglunds snabbköp',
  'Christina Berglund',
  'Berguvsvägen 8',
  'Luleå',
  'S-958 22',
  'Sweden'),
 (6,
  'Blauer See Delikatessen',
  'Hanna Moos',
  'Forsterstr. 57',
  'Mannheim',
  '68306',
  'Germany'),
 (7,
  'Blondel père et fils',
  'Frédérique Citeaux',
  '24, place Kléber',
  'Strasbourg',
  '67000',
  'France'),
 (8,
  'Bólido Comidas preparadas',
  'Martín Sommer',
  'C/ Araquil, 67',
  'Madrid',
  '28023',
  'Spain'),
 (9,
  "Bon app''",
  'Laurence Lebihans',
  '12, rue des Bouchers',
  'Marseille',
  '13008',
  '

In [192]:
sql = "SELECT CustomerName, (Address || ', ' || PostalCode || ' ' || City || ', ' || Country) AS Address FROM Customers;"
sendQuery(sql)

[('Alfreds Futterkiste', 'Obere Str. 57, 12209 Berlin, Germany'),
 ('Ana Trujillo Emparedados y helados',
  'Avda. de la Constitución 2222, 5021 México D.F., Mexico'),
 ('Antonio Moreno Taquería', 'Mataderos 2312, 5023 México D.F., Mexico'),
 ('Around the Horn', '120 Hanover Sq., WA1 1DP London, UK'),
 ('Berglunds snabbköp', 'Berguvsvägen 8, S-958 22 Luleå, Sweden'),
 ('Blauer See Delikatessen', 'Forsterstr. 57, 68306 Mannheim, Germany'),
 ('Blondel père et fils', '24, place Kléber, 67000 Strasbourg, France'),
 ('Bólido Comidas preparadas', 'C/ Araquil, 67, 28023 Madrid, Spain'),
 ("Bon app''", '12, rue des Bouchers, 13008 Marseille, France'),
 ('Bottom-Dollar Marketse', '23 Tsawassen Blvd., T2F 8M4 Tsawassen, Canada'),
 ("B''s Beverages", 'Fauntleroy Circus, EC2 5NT London, UK'),
 ('Cactus Comidas para llevar', 'Cerrito 333, 1010 Buenos Aires, Argentina'),
 ('Centro comercial Moctezuma',
  'Sierras de Granada 9993, 5022 México D.F., Mexico'),
 ('Chop-suey Chinese', 'Hauptstr. 29, 3012

## JOIN

In [195]:
sql = """SELECT Orders.OrderID, Customers.CustomerName, Orders.OrderDate
         FROM Orders
         INNER JOIN Customers ON Orders.CustomerID=Customers.CustomerID;"""
sendQuery(sql)

[(10248, 'Wilman Kala', '1996-07-04'),
 (10249, 'Tradição Hipermercados', '1996-07-05'),
 (10250, 'Hanari Carnes', '1996-07-08'),
 (10251, 'Victuailles en stock', '1996-07-08'),
 (10252, 'Suprêmes délices', '1996-07-09'),
 (10253, 'Hanari Carnes', '1996-07-10'),
 (10254, 'Chop-suey Chinese', '1996-07-11'),
 (10255, 'Richter Supermarkt', '1996-07-12'),
 (10256, 'Wellington Importadora', '1996-07-15'),
 (10257, 'HILARIÓN-Abastos', '1996-07-16'),
 (10258, 'Ernst Handel', '1996-07-17'),
 (10259, 'Centro comercial Moctezuma', '1996-07-18'),
 (10260, 'Old World Delicatessen', '1996-07-19'),
 (10261, 'Que Delícia', '1996-07-19'),
 (10262, 'Rattlesnake Canyon Grocery', '1996-07-22'),
 (10263, 'Ernst Handel', '1996-07-23'),
 (10264, 'Folk och fä HB', '1996-07-24'),
 (10265, 'Blondel père et fils', '1996-07-25'),
 (10266, 'Wartian Herkku', '1996-07-26'),
 (10267, 'Frankenversand', '1996-07-29'),
 (10268, 'GROSELLA-Restaurante', '1996-07-30'),
 (10269, 'White Clover Markets', '1996-07-31'),
 (102