# ETL作業第三階段

拆字

In [1]:
# 功能:
# 從目前工作資料夾的資料庫中取出網址以及內容
# 然後新建一個資料庫
# 分析完內容有哪些程式語言後
# 將結果以布林值儲存在新建的資料庫裡

# 使用者只需修改source, source_table以及db_name
# 確認db_name與資料夾裡的其他檔案名稱沒有重複
# 就可以按Kernel -> Restart & Run All執行

# 請先將job104p1, p2, p3, job518或job1111.sqlite放到目前資料下
# 為來源(source)的資料庫以及表格命名

source = "job104p1.sqlite"
source_table = "job104"

# 儲存結果的資料庫的名稱
# 可自訂

db_name = source.replace(".sqlite","") + "_result.sqlite"

In [2]:
# 準備工作

# 引用所有會用到的套件

from bs4 import BeautifulSoup
import requests
import bs4
import time
import re
import sqlite3
import sys
import copy

In [3]:
# 建立程式語言字典

lang_dict = {
"csharp" : ["c#", "visual c#", "c sharp", "net c#", "cs", "csharp"],
"cpp" : ["visual c++", "c++", "cpp"],
"vb" : ["visual basic", "vb", "visualbasic"],
"vba" : ["visual basic application", "vba"],
"vbnet" : ["vb.net", "visual basic.net"],
"aspnet" : ["asp.net", "asp c#.net ", "asp vb.net", "aspnet", "asp .net"],
"c" : ["c"],
"java" : ["java", "jsp", "severlet", "j2se", "j2ee", "jse"],
"fsharp" : ["f#", "f sharp", "fsharp"],
"objective_c" : ["objective-c"],
"swift" : ["swift"],
"php" : ["php"],
"python" : ["python"],
"perl" : ["perl"],
"ruby" : ["ruby", "ruby on rails", "rubyonrails", "ruby-on-rails"],
"go" : ["go"],
"vbscript" : ["vbscript", "vb script"],
"typescript" : ["typescript"],
"coffeescript" : ["coffeescript"],
"scala" : ["scala"],
"r" : ["r"],
"applescript" : ["applescript"],
"pascal" : ["pascal"],
"cobol" : ["cobol"],
"html" : ["html", "css", "javascript", "js", "jquery", "rwd"],
"matlab" : ["matlab"],
"sql" : ["sql", "Oracle", "ssms", "db2", "rdb", "relational database"],
"kaskell" : ["kaskell"],
"nodejs" : ["nodejs", "node.js", "node js"],
"angular" : ["angular", "angular.js", "angular js"],
"asp" : ["asp"],
"assembly" : ["assembly"],
"delphi" : ["delphi"]
}

# 先將lang_dict的value轉為小寫

for key in lang_dict:
    lang_dict.update({key: [x.lower() for x in lang_dict[key]]})

# 把lang_dict的key另外存成list
    
lang_dict_keys = list(lang_dict.keys())


# 建立lang_list與lang_dict_inv
# lang_list結合所有的程式語言名稱
# 而lang_dict_inv紀錄某個名字所指的是哪個程式語言

lang_list = []
lang_dict_inv = {}

for key in list(lang_dict):
    for each in lang_dict[key]:
        lang_list.append(each)
        lang_dict_inv.update({each:key})

        
# 由字串長度將lang_list的內容最長排到最短
# (這步很重要)

lang_list.sort(key = lambda s: -len(s))


# lang_list_nospace
# 無空格版的lang_list

lang_list_nospace = [x.replace(" ","") for x in lang_list]

In [4]:
# 從source取得href以及info

with sqlite3.connect(source) as conn:
    c = conn.cursor()
    c.execute("SELECT href, info from " + source_table + ";")
    input_pairs = c.fetchall()

In [5]:
# 建立儲存資料用的sqlite資料庫

# 產出指令

columns = ""
for each in lang_dict_keys:
    columns += ", " + each + " BOOLEAN NOT NULL DEFAULT 0 "

# 建立

with sqlite3.connect(db_name) as conn:
    c = conn.cursor()
    c.execute("CREATE TABLE result(href TEXT NOT NULL UNIQUE " + columns + ");")


In [6]:
# 定義lang_parse方法

# 尋找某個語言是否有在一個字串中被提到
# 以刪除法排除沒有的字串 剩下的就是有被提到的

def lang_parse(info):
    
    # 階段1

    # 轉成小寫
    info_lower = info.lower()

    # 移除info_lower中的空白
    info_nospace = info_lower.replace(" ","")

    # 階段2

    # 複製出一個消耗性的lang_list_copy
    # 依序尋找語言名稱
    # 看該語言在不在lang_list_nospace_copy裡面
    # 如果在就找info_copy的下一個語言名稱
    # 不在的話就將該語言名稱從info_copy
    # 跟info_nospace_copy中刪除
    # 然後將該名稱從info_nospace刪除
    # 以避免有子字串摻雜的現象

    # 因為上面在做準備工作的時候有將lang_list_nospace
    # 依照字串長度從常到短排序
    # 所以不會有誤刪母字串的情形發生

    lang_list_copy = list(lang_list)
    lang_list_nospace_copy = list(lang_list_nospace)

    i = 0
    while i < len(lang_list_nospace_copy) and len(info_nospace) > 0:
        exists = lang_list_nospace_copy[i] in info_nospace
        info_nospace = info_nospace.replace(lang_list_nospace_copy[i],"")
        if exists:
            i += 1
        else:
            del lang_list_nospace_copy[i] # 這個要做才能避免無限迴圈
            del lang_list_copy[i]  # 讓lang_list_copy同步

    # 階段3

    # 再回頭來看info_lower
    # 用正規表示法尋找語言名稱
    # 但如果lang_list_copy已經全軍覆沒就略過不做
    
    if(len(lang_list_copy) > 0):
        i = 0
        while i < len(lang_list_copy):
            lang_name = lang_list_copy[i]
            if " " not in lang_name:
                lang_name = lang_name.replace("+","\+")  # 跳脫符號
                lang_name = "(^|[^a-zA-Z])" + lang_name +"($|[^a-zA-Z])" # 正規表示法
                query = re.compile(lang_name)
                exists = not (query.search(info_lower) == None )
                if exists:
                    i += 1
                else:
                    del lang_list_copy[i]
            else:
                i += 1
    
    # 階段4

    # 建立集合lang_exists
    # 用來紀錄那些語言存在
    # (順序不重要)

    lang_exists = set()
    
    # 將找到的結果利用lang_dict_inv
    # 紀錄到lang_exists裡
    # 但如果lang_list_copy已經全軍覆沒就略過不做
    
    if(len(lang_list_copy) > 0):
        for each in lang_list_copy:
            lang = lang_dict_inv[each]
            lang_exists.add(lang)  
    
    # 傳回lang_exists
            
    return lang_exists

In [7]:
# 定義insert_parse方法
# 將lang_parse的結果儲存到資料庫上

def insert_parse(href, lang_exists):
    
    cols = ""
    vals = ""
    
    if(len(lang_exists) > 0):
        for each in lang_exists:
            cols += "," + each
            vals += ", 1"      
    
    command = "INSERT INTO result (href" + cols + ") \
        values('" + href + "'" + vals + ");"
    
    with sqlite3.connect(db_name) as conn:
        c = conn.cursor() 
        c.execute(command)

In [8]:
# 開始跑

for each in input_pairs:
    
    # 重設href跟lang_exists以避免迴圈重作
    
    href = ""
    lang_exists = set()
    
    try:
        href = each[0]
        lang_exists = lang_parse(each[1])
        insert_parse(href,lang_exists)
        print(lang_exists)
    except:
        print("錯誤於" + href + ": ", sys.exc_info()[1])
        

set()
set()
{'java', 'scala', 'nodejs', 'c', 'cpp'}
{'sql'}
{'sql'}
{'html', 'php', 'java', 'c', 'cpp'}
{'html', 'php', 'java', 'c', 'cpp'}
{'nodejs'}
set()
{'html', 'angular', 'java'}
{'java'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'cobol'}
set()
{'java'}
{'html', 'vbscript', 'aspnet', 'sql', 'asp'}
set()
{'java'}
{'csharp'}
{'assembly', 'c'}
{'c'}
set()
set()
{'sql'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
set()
set()
set()
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'cpp', 'c'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
set()
{'html', 'csharp', 'java'}
{'java', 'c', 'cpp'}
{'java', 'sql'}
set()
set()
{'java'}
{'cpp', 'r', 'c'}
set()
{'perl', 'python', 'c', 'cpp'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fs

set()
{'html', 'php', 'swift'}
set()
set()
set()
{'java'}
set()
{'html'}
{'csharp', 'java', 'c', 'aspnet', 'html', 'angular', 'sql'}
{'java', 'php'}
{'java', 'csharp', 'c', 'python', 'perl', 'php'}
set()
set()
{'sql'}
{'perl', 'python', 'c', 'cpp'}
{'r'}
set()
{'cpp', 'csharp', 'sql', 'vb', 'c'}
set()
{'perl', 'c'}
{'java', 'python', 'c', 'cpp'}
set()
{'html', 'angular', 'nodejs'}
{'java', 'objective_c', 'c', 'cpp'}
{'c'}
{'assembly', 'csharp', 'java', 'c', 'cpp'}
{'csharp'}
{'cpp', 'c'}
{'java'}
{'cpp', 'c'}
set()
{'html', 'aspnet', 'csharp', 'c', 'cpp'}
{'sql'}
{'c'}
{'sql'}
{'c'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'cpp', 'c'}
{'c'}
{'java', 'c', 'aspnet', 'go', 'html', 'php', 'sql', 'cpp'}
{'java', 'c', 'assembly', 'aspnet', 'html', 'cpp', 'php', 'sql', 'matlab'}
{'cpp', 'c'}
{'assembly', 'vb', 'c', 'cpp

{'cpp', 'csharp', 'r', 'c'}
{'cpp', 'c'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
set()
set()
set()
{'java', 'csharp', 'sql', 'c', 'cpp'}
{'vbnet', 'vb'}
{'csharp', 'aspnet', 'sql', 'c'}
{'java'}
set()
{'r'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'c'}
set()
set()
set()
set()
{'c'}
{'c'}
set()
{'java', 'ruby', 'c', 'python', 'perl', 'html', 'cpp'}
{'r', 'sql'}
{'r', 'sql'}
set()
set()
{'python', 'php', 'sql', 'vba'}
set()
{'html', 'sql', 'java'}
{'java', 'csharp', 'c', 'python', 'cpp', 'sql'}
set()
{'cpp', 'c'}
{'c'}
set()
{'csharp', 'aspnet', 'sql'}
{'c'}
{'sql'}
{'perl', 'python'}
set()
set()
{'html', 'csharp', 'sql', 'java'}
{'c'}
set()
{'java'}
{'java', 'aspnet', 'python', 'html', 'php', 'sql'}
set()
set()
{'c'}
set()
set()
{'sql'}
set()
set()
{'sql'}
set()
{'html', 'csharp', 'asp', 'sql', 'c'}
{'assembly', 'c', 'cpp'}
{'cpp', 'vbnet', 'vb', 'cshar

set()
{'html', 'csharp', 'java', 'c', 'cpp'}
set()
set()
set()
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
set()
set()
set()
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'python', 'c'}
{'java', 'objective_c', 'c', 'cpp'}
{'html', 'java'}
{'cpp', 'c'}
{'html', 'aspnet', 'csharp'}
set()
set()
set()
{'html'}
{'java', 'aspnet', 'c', 'cpp'}
{'c'}
set()
{'cpp', 'c'}
{'csharp', 'sql', 'c'}
{'csharp', 'aspnet', 'sql'}
set()
{'java', 'sql', 'c'}
set()
{'r'}
{'c'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'java', 'csharp', 'c', 'aspnet', 'cpp', 'php', 'sql'}
set()
set()
set()
{'java', 'csharp', 'c', 'html', 'angular', 'cpp'}
{'java', 'c'}
{'csharp', 'aspnet', 'sql'}
set()
{'java'}
{'java', 'asp', '

{'java', 'aspnet', 'sql', 'csharp', 'c'}
set()
{'html', 'csharp', 'java', 'c', 'cpp'}
{'java', 'delphi'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'html'}
{'c'}
{'cpp', 'c'}
{'sql'}
{'csharp', 'aspnet', 'c'}
{'sql'}
{'java', 'csharp', 'c', 'aspnet', 'html', 'vbnet', 'sql'}
{'java', 'c', 'cpp'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'html', 'sql', 'java'}
{'cpp', 'perl', 'php', 'csharp', 'c'}
set()
{'html', 'java'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
set()
set()
{'perl', 'python', 'c', 'cpp'}
{'c'}
{'csharp', 'sql', 'c'}
set()
set()
set()
set()
{'html', 'sql', 'java'}
set()
{'cpp', 'c'}
{'cpp', 'csharp', 'c'}
set()
{'java', 'c', 'cpp'}
{'html', 'java'}
{'html', 'aspnet', 'sql', 'csharp', 'c'}
{'sql'}
{'html', 'sql', 'java'}
{'java', 'c', 'cpp'}
{'cpp', 'c'}
set()
{'java', 'sql', 'c

set()
{'sql'}
{'csharp', 'aspnet', 'c'}
{'cpp', 'python', 'c', 'go'}
{'java'}
{'html', 'java', 'ruby'}
{'sql'}
set()
{'c'}
{'csharp', 'aspnet', 'sql', 'c'}
{'html', 'python', 'r', 'csharp'}
{'cpp', 'c'}
{'java', 'angular', 'sql', 'csharp', 'c'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'sql'}
{'html', 'angular', 'php', 'java', 'python'}
set()
set()
set()
set()
{'vb', 'sql', 'vba'}
set()
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
set()
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'java'}
set()
set()
{'cpp', 'c'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'csharp', 'c'}
{'assembly', 'csharp', 'c'}
{'java', 'c'}
set()
set()
set()
set()
{'cpp', 'csharp', 'c'}
{'sql'}
set()
set()
{'html'}
{'perl', 'python', 'csharp'}
{'perl', 'python

set()
{'cpp', 'c'}
{'cpp', 'c'}
set()
{'cpp', 'csharp', 'c'}
set()
set()
{'java', 'python', 'php', 'sql', 'c'}
set()
{'java', 'c', 'cpp'}
{'c'}
{'cpp', 'c'}
set()
{'python'}
{'html', 'java', 'sql'}
set()
set()
{'java', 'c', 'nodejs', 'html', 'angular', 'php'}
set()
{'java', 'sql'}
{'java', 'c', 'python', 'perl', 'cpp', 'r', 'sql'}
{'cpp', 'csharp'}
{'html', 'angular'}
{'html', 'csharp', 'php', 'sql'}
{'java', 'python', 'nodejs', 'scala', 'html', 'php', 'sql'}
{'java', 'csharp', 'c'}
{'ruby', 'html'}
{'ruby', 'java', 'python', 'html', 'angular', 'php'}
{'cpp'}
{'html', 'java', 'sql'}
{'html', 'aspnet', 'sql', 'csharp', 'c'}
set()
{'java'}
{'objective_c', 'swift', 'c'}
{'java', 'aspnet', 'csharp', 'c'}
{'csharp', 'aspnet', 'sql'}
set()
{'html', 'php', 'sql'}
{'python', 'php'}
{'python', 'php'}
set()
{'html'}
{'java'}
{'swift'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
set()
{'csharp', 'sql', 'vba'}
{'csharp'}
{'html', 'csh

{'html', 'java', 'swift', 'c', 'cpp'}
{'sql'}
set()
set()
{'c'}
{'csharp', 'c'}
{'csharp', 'c', 'aspnet', 'typescript', 'html', 'angular', 'sql'}
{'html', 'objective_c', 'c'}
{'html', 'php'}
{'html', 'php'}
set()
set()
{'ruby', 'python', 'sql'}
{'csharp', 'sql', 'delphi'}
{'cpp', 'r', 'c'}
set()
{'html', 'swift', 'c'}
{'csharp', 'vb', 'c', 'aspnet', 'html', 'sql'}
set()
{'html', 'sql', 'java', 'c'}
{'assembly', 'c'}
{'java'}
set()
{'html', 'php'}
{'html', 'php'}
set()
{'html', 'r'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'java', 'c'}
{'ruby', 'python', 'sql'}
set()
{'java', 'sql'}
set()
set()
{'csharp', 'aspnet', 'sql', 'c'}
{'html', 'java'}
set()
set()
{'sql'}
set()
set()
set()
set()
{'cpp', 'r', 'c'}
set()
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
set()
set()
{'sql'}
{'python', 'c'}
set()
{'csharp', 'sql', 'c'}
set()
{'csharp', 'aspnet', 'vb', 'c'}
{'

set()
set()
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
set()
{'html', 'php', 'java', 'ruby'}
{'java', 'csharp', 'c', 'html', 'vbnet', 'sql'}
set()
{'java'}
set()
{'nodejs'}
set()
{'python', 'scala'}
set()
set()
{'sql'}
{'csharp', 'aspnet', 'vb', 'sql', 'c'}
set()
{'java', 'c'}
set()
{'html', 'php'}
set()
set()
{'html', 'python', 'php', 'sql', 'java'}
set()
set()
set()
{'csharp', 'sql'}
set()
{'html'}
set()
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'cpp', 'csharp', 'c'}
set()
set()
{'html', 'java'}
{'php'}
set()
{'html', 'c', 'cpp'}
{'cpp', 'c'}
set()
{'html', 'java'}
{'java', 'c', 'cpp'}
{'csharp', 'aspnet', 'sql', 'c'}
set()
{'java', 'sql', 'c', 'cpp'}
set()
{'html', 'php'}
{'cpp', 'c'}
{'vb', 'c', 'vba', 'aspnet', 'vbnet', 'sql'}
set()
{'java', 'php'}
{'html', 'php'}
set()
{'csharp', 'c'}
{'cpp', 'c'}
set()
set()
{'csharp', 'sql', 'c'}
set()
{'java', 'cp

set()
{'java'}
{'sql'}
{'html', 'vbnet', 'vb'}
set()
{'cpp', 'c'}
{'java', 'c'}
set()
{'html', 'java', 'c'}
{'cpp', 'c'}
{'ruby', 'java', 'c', 'perl', 'html', 'sql', 'cpp'}
{'java', 'php', 'c', 'cpp'}
{'html', 'aspnet', 'sql', 'csharp', 'c'}
{'java', 'aspnet', 'sql', 'csharp', 'c'}
set()
{'html', 'python', 'php', 'java', 'nodejs'}
{'java', 'c', 'perl', 'html', 'sql', 'cpp'}
{'cpp', 'c'}
{'c'}
{'assembly', 'c', 'java', 'html', 'cpp'}
{'java'}
{'objective_c', 'c'}
{'java', 'php', 'c', 'cpp'}
{'cpp', 'c'}
set()
set()
{'html', 'aspnet', 'java', 'sql', 'csharp'}
{'html', 'sql', 'java'}
{'html', 'aspnet', 'sql', 'csharp', 'c'}
{'cpp', 'csharp', 'c'}
{'java', 'objective_c', 'c', 'cpp'}
{'cpp', 'c'}
{'java', 'csharp', 'c', 'cpp'}
{'cpp', 'csharp', 'r', 'c'}
{'cpp', 'c'}
{'cpp', 'c'}
{'cpp', 'csharp', 'c'}
{'cpp', 'c'}
{'java'}
set()
{'java', 'c', 'cpp'}
{'java', 'csharp', 'c'}
{'java', 'c'}
set()
set()
{'cpp', 'python', 'c'}
{'vb'}
{'c'}
{'java', 'csharp', 'vb', 'c', 'python', 'cpp'}
{'sql'}
{

{'assembly', 'java', 'c', 'cpp'}
{'cpp', 'c'}
{'cpp', 'c'}
set()
{'cpp', 'c'}
{'php'}
{'html', 'java', 'c', 'cpp'}
set()
{'java'}
{'cpp', 'c'}
{'csharp'}
{'cpp', 'c'}
{'html', 'angular'}
{'html', 'angular', 'sql', 'nodejs'}
{'html', 'aspnet', 'sql', 'csharp', 'c'}
{'java', 'c', 'cpp'}
set()
{'cpp', 'c'}
{'c'}
{'cpp', 'objective_c', 'c'}
set()
{'swift', 'c'}
set()
{'java', 'objective_c', 'delphi', 'c', 'cpp'}
set()
set()
{'cpp', 'c'}
{'cpp', 'c'}
set()
set()
{'c', 'objective_c', 'swift', 'sql'}
{'html', 'php'}
{'cpp', 'c'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'csharp', 'aspnet', 'sql', 'c'}
set()
set()
{'html', 'python', 'java'}
{'java', 'c'}
{'csharp', 'c', 'aspnet', 'html', 'vbnet', 'sql'}
set()
{'cpp', 'c'}
{'objective_c', 'swift', 'c'}
{'cpp'}
{'java'}
{'java', 'csharp', 'c'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'sql'}
{'java', 'swift'}
{'ja

{'cpp', 'objective_c', 'java', 'c'}
{'java', 'c', 'cpp'}
{'java'}
{'csharp', 'sql', 'vb', 'c'}
{'r'}
{'java', 'c'}
set()
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'html', 'java'}
{'cpp', 'c'}
set()
{'java', 'python', 'sql'}
{'cpp', 'csharp', 'c'}
{'html', 'objective_c', 'sql', 'c'}
set()
{'html', 'objective_c', 'swift', 'java', 'c'}
set()
{'c'}
{'csharp', 'vbscript', 'java', 'aspnet', 'html', 'sql'}
{'objective_c', 'swift', 'c'}
{'java'}
set()
{'cpp', 'c', 'objective_c', 'java', 'html'}
set()
set()
{'cpp', 'vb', 'c'}
{'cpp', 'c'}
{'assembly', 'c', 'cpp'}
{'c'}
{'c'}
{'cpp', 'vb', 'c'}
{'cpp', 'csharp', 'c'}
{'cpp', 'c'}
{'cpp', 'c'}
set()
set()
set()
set()
{'java', 'swift', 'c'}
{'php'}
{'java', 'objective_c', 'c'}
{'cpp', 'c'}
{'cpp', 'c'}
{'csharp', 'asp', 'c', 'html', 'sql', 'cpp'}
set()
set()
{'python'}
{'objective_c'}
{'objective_c'}
{'html', 'nodejs'}
set()
{'csharp'}
{'html', 'php', 'ruby', 'objective_c', 'swift'

set()
{'assembly', 'c'}
{'cpp', 'c'}
{'cpp', 'matlab', 'c'}
set()
set()
{'cpp', 'c'}
set()
{'java', 'c', 'cpp'}
set()
set()
{'cpp', 'assembly', 'c'}
{'c'}
{'cpp', 'c'}
{'assembly', 'c', 'cpp'}
{'cpp', 'c'}
{'cpp', 'c'}
set()
{'cpp', 'c'}
{'cpp', 'perl', 'c'}
{'cpp', 'perl', 'c'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'cpp', 'c'}
set()
set()
set()
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'python'}
{'cpp', 'c'}
set()
set()
{'cpp', 'c'}
set()
{'cpp', 'c'}
{'cpp', 'objective_c', 'c'}
set()
{'c'}
{'cpp', 'csharp', 'c'}
{'c'}
{'cpp', 'c'}
{'ruby', 'csharp', 'vbscript', 'vb', 'vba', 'aspnet', 'fsharp', 'nodejs', 'angular', 'cpp', 'vbnet', 'sql'}
{'assembly'}
set()
{'assembly', 'c'}
{'cpp', 'c'}
{'cpp', 'c'}
set()
set()
set()
{'cpp', 'c'}
{'cpp', 'c'}
{'java', 'c', 'cpp'}
set()
{'cpp', 'matlab', 'c'}
set()
set()
{'r', 'c'}
{'r', 'sql'}
{'cpp', 'c'}
{'c'}
{'c

{'cpp', 'c'}
{'cpp', 'c'}
{'java', 'cpp'}
{'c'}
set()
set()
{'cpp', 'csharp', 'c'}
{'cpp', 'c'}
set()
{'cpp', 'c'}
{'cpp', 'c'}
{'cpp', 'c'}
{'cpp', 'c'}
{'c'}
{'assembly', 'python', 'c', 'cpp'}
{'cpp', 'c'}
{'cpp', 'c'}
{'java', 'c', 'cpp'}
{'assembly', 'c', 'cpp'}
set()
set()
{'java', 'c', 'cpp'}
{'cpp', 'csharp', 'c'}
set()
{'assembly', 'c', 'cpp'}
set()
{'c'}
set()
{'html', 'aspnet', 'sql', 'csharp', 'c'}
{'html', 'aspnet', 'sql', 'csharp', 'c'}
set()
set()
{'assembly', 'c', 'cpp'}
{'html', 'aspnet', 'sql', 'csharp', 'c'}
{'java', 'c', 'html', 'cpp'}
set()
{'csharp', 'r', 'matlab', 'c'}
set()
{'csharp', 'c'}
{'cpp', 'c'}
{'cpp', 'c'}
{'c'}
set()
{'java', 'csharp', 'vb', 'c', 'aspnet', 'sql'}
{'cpp', 'c'}
{'cpp', 'aspnet', 'csharp', 'c'}
set()
{'cpp', 'c'}
{'c'}
{'php', 'sql'}
{'cpp', 'python', 'c'}
{'cpp', 'c'}
{'cpp', 'c'}
{'c'}
{'c'}
set()
set()
{'cpp', 'c'}
{'cpp', 'sql', 'c'}
{'java'}
{'c'}
set()
set()
{'cpp', 'python', 'c'}
{'c'}
{'java', 'c', 'cpp'}
{'cpp', 'c'}
set()
{'cpp',

{'html', 'csharp', 'php', 'c'}
{'csharp', 'python', 'java', 'c', 'cpp'}
{'java', 'r', 'c', 'cpp'}
{'java', 'c', 'html', 'cpp'}
{'cpp', 'c'}
{'java', 'swift', 'c', 'cpp'}
set()
{'c'}
{'cpp', 'c'}
{'cpp', 'c'}
set()
{'cpp', 'c'}
{'c'}
set()
set()
{'assembly', 'c'}
{'cpp', 'c'}
set()
{'assembly', 'c', 'cpp'}
set()
set()
{'cpp', 'c'}
{'r', 'c'}
{'csharp', 'c'}
{'matlab', 'c'}
set()
set()
set()
{'cpp', 'c'}
set()
{'java', 'aspnet', 'sql', 'csharp'}
{'r'}
{'html', 'php', 'c', 'cpp'}
{'c'}
{'java', 'csharp', 'c', 'html', 'cpp'}
{'c'}
{'cpp', 'c'}
{'cpp', 'c'}
{'cpp', 'c'}
{'html', 'c', 'cpp'}
{'cpp', 'assembly', 'c'}
{'cpp', 'c'}
set()
{'cpp', 'c'}
{'cpp', 'c'}
{'cpp', 'c'}
{'cpp', 'csharp', 'c'}
{'assembly', 'c', 'cpp'}
set()
{'assembly', 'c', 'cpp'}
{'assembly', 'c', 'cpp'}
set()
{'cpp', 'c'}
set()
{'c'}
{'java', 'go', 'c', 'cpp'}
{'csharp', 'c', 'python', 'nodejs', 'go', 'html', 'angular', 'cpp'}
{'vb'}
{'html', 'c'}
{'c'}
{'cpp', 'c'}
set()
{'c'}
{'cpp', 'c'}
set()
set()
{'cpp', 'python',

In [9]:
# 檢查部份結果

with sqlite3.connect(db_name) as conn:
        c = conn.cursor() 
        c.execute("select count(*) from result;")
        output = c.fetchall()
print(output)

[(6300,)]
