In [79]:
import os, sys
from ckip_transformers.nlp import CkipWordSegmenter, CkipPosTagger, CkipNerChunker
import pickle
import logging
import mysql.connector
import time
import spacy
parent_dir = os.path.dirname(os.getcwd())
sys.path.append(parent_dir)

from db_func import query_from_db

# Initialize drivers
ws_driver  = CkipWordSegmenter(level=3)
pos_driver = CkipPosTagger(level=3)
ner_driver = CkipNerChunker(level=3)


nlp = spacy.load("zh_core_web_trf")
os.environ['KMP_DUPLICATE_LIB_OK']= 'True'

### 1-1 Insert Developing Note

In [41]:

start = time.time()

logging.basicConfig(format='%(asctime)s: %(levelname)s: %(message)s')
logging.root.setLevel(level=logging.INFO)

with open(os.path.join(parent_dir, 'configs', 'loc2server.config'), 'rb') as f:
    configs = pickle.load(f)

mydb = mysql.connector.connect(
    host = configs['host'],
    user = configs['user'],
    passwd = configs['passwd'],
    database = configs['database'])

def insert_sentlevel_info(word_sentence: list, pos_sentence:list , news_sent_id, ws_approach, dep_sentence = ''):
    assert len(word_sentence) == len(pos_sentence)
    if ws_approach == 'ckip-transformer':
        for word_index, (word, word_pos) in enumerate(zip(word_sentence, pos_sentence)):
            word_cursor = mydb.cursor()
            try:
                word_cursor.execute("INSERT INTO news_db.news_words (news_sent_id, word_index, word, word_pos, ws_approach) VALUES (%s, %s, %s, %s, %s)", (news_sent_id, word_index, word, word_pos, ws_approach))
                #print("INSERT INTO news_db.news_words (news_sent_id, word_index, word, word_pos, ws_approach) VALUES ({}, {}, {}, {}, {})".format(news_sent_id, word_index, word, word_pos, ws_approach))

            except Exception as e:
                logging.error('Insert word pos error: {}\n News Sent ID: {}'.format(e, news_sent_id))
                print('Insert word pos error: {}\nNews Sent ID: {}\nWs_approach: {}'.format(e, news_sent_id, ws_approach))
                mydb.rollback()
            else:
                #print("else")
                mydb.commit()
            word_cursor.close()
    elif ws_approach == 'spacy-transformer':
        for word_index, (word, word_pos, word_dep) in enumerate(zip(word_sentence, pos_sentence, dep_sentence)):
            word_cursor = mydb.cursor()
            try:
                word_cursor.execute("INSERT INTO news_db.news_words (news_sent_id, word_index, word, word_pos, word_dep, ws_approach) VALUES (%s, %s, %s, %s, %s, %s)", (news_sent_id, word_index, word, word_pos, word_dep, ws_approach))
                #print("INSERT INTO news_db.news_words (news_sent_id, word_index, word, word_pos, word_dep, ws_approach) VALUES ({}, {}, {}, {}, {}, {})".format(news_sent_id, word_index, word, word_pos, word_dep, ws_approach))

            except Exception as e:
                logging.error('Insert word pos error: {}\n News Sent ID: {}'.format(e, news_sent_id))
                print('Insert word pos error: {}\nNews Sent ID: {}\nWs_approach: {}'.format(e, news_sent_id, ws_approach))
                mydb.rollback()
            else:
                mydb.commit()
            word_cursor.close()
    else:
        logging.error("Error ws_approach")
        sys.exit(0)

def insert_ner_info(entity_sent_list, news_sent_id, ner_approach):
    for ent_id, (ent_text, ent_type, ent_index) in enumerate(sorted(entity_sent_list, key = lambda x:x[2][0])):
        ner_cursor = mydb.cursor()
        try:
            ner_cursor.execute("INSERT INTO news_db.news_ners (news_sent_id, start_index, end_index, ent_type, ent_text, ner_approach) VALUES (%s, %s, %s, %s, %s, %s)", (news_sent_id, ent_index[0], ent_index[1], ent_type, ent_text, ner_approach))
            #print("INSERT INTO news_db.news_ners (news_sent_id, start_index, end_index, ent_type, ent_text, ner_approach) VALUES ({}, {}, {}, {}, {}, {})".format(news_sent_id, ent_index[0], ent_index[1], ent_type, ent_text, ner_approach))
        
        except Exception as e:
            logging.error('Insert NER error: {}\n News Sent ID: {}'.format(e, news_sent_id))
            print('Insert NER error: {}\n News Sent ID: {}'.format(e, news_sent_id))
            mydb.rollback()
        else:
            mydb.commit()
        ner_cursor.close()
        
def insert_process_flag(news_sent_id, process_name):
    process_cursor = mydb.cursor()
    try:
        process_cursor.execute("INSERT INTO news_db.sent_processes (news_sent_id, process_name) VALUES (%s, %s)", (news_sent_id, process_name))
        #print("INSERT INTO news_db.nlp_processes (news_sent_id, process_name) VALUES ({}, {})".format(news_sent_id, process_name))
    except Exception as e:
        logging.error('Process Insert Error: {}\nNews sent ID: {}'.format(e, news_sent_id))
        #print('Process Insert Error: {}\nNews sent ID: {}'.format(e, news_sent_id))
        mydb.rollback()
    else:
        mydb.commit()
    process_cursor.close()

def sent_level_analysis(raw_df):
    for index, (content_sent_id, sent) in raw_df.iterrows():
        insert_process_flag(content_sent_id, 'sent-analysis')
        try:
            word_sentence_list  = ws_driver(text, use_delim=False)
            entity_sentence_list = ner_driver(text, use_delim=False)
            pos_sentence_list = pos_driver(word_sentence_list, use_delim=False)
            spacy_doc = nlp(sent)
            word_sent_list_spacy, word_pos_list_spacy, word_dep_list_spacy = zip(*[(token.text, token.tag_, token.dep_) for token in spacy_doc])
            entity_sent_list_spacy = [(ent.text, ent.label_, (ent.start_char, ent.end_char)) for ent in spacy_doc.ents]
        except Exception as e:
            logging.error('NLP process Error: {}\n Content ID: {}'.format(e, content_sent_id))
            print('NLP process Error: {}\n Content ID: {}'.format(e, content_sent_id))
        
        
        insert_sentlevel_info(word_sentence_list[0],  pos_sentence_list[0], content_sent_id, 'ckip-transformer')
        insert_sentlevel_info(word_sent_list_spacy, word_pos_list_spacy, content_sent_id, 'spacy-transformer', word_dep_list_spacy)
        insert_ner_info(entity_sentence_list[0], content_sent_id, 'ckip-transformer')
        insert_ner_info(entity_sent_list_spacy, content_sent_id, 'spacy-transformer')
     

raw_df = query_from_db("SELECT nns.news_sent_id, nns.sent FROM news_db.news_sents nns WHERE not exists (SELECT 1 FROM news_db.sent_processes sp WHERE sp.process_name = \'sent-analysis\' and sp.news_sent_id = nns.news_sent_id) LIMIT 100")
sent_level_analysis(raw_df)
mydb.close()
logging.error('Finish process {} examples in {} seconds'.format(len(raw_df), time.time() - start))
print('Finish process {} examples in {} seconds'.format(len(raw_df), time.time() - start))

Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1584.55it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.90it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2505.56it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.44it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1876.65it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.51it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1069.43it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.52it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2624.72it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.58it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1170.94it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.55it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 4271.19it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.13it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2025.26it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.56it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00,

Finish process 100 examples in 523.4921119213104 seconds


### Bulk insert developing 

In [106]:
raw_df = query_from_db("SELECT * FROM news_db.financial_sent_view LIMIT 16;")

In [99]:
[1, 2, 3][:5]

[1, 2, 3]

In [118]:
def sent_generator(id_lst, sent_lst, batch_size):
    current_idx = 0
    max_len = len(sent_lst)
    while True:
        yield  id_lst[current_idx:current_idx + batch_size], sent_lst[current_idx:current_idx + batch_size]
        current_idx += batch_size
        if current_idx >= max_len:
            break
"INSERT INTO news_db.news_words (news_sent_id, word_index, word, word_pos, word_dep, ws_approach) VALUES (%s, %s, %s, %s, %s, %s)"
"INSERT INTO news_db.news_ners (news_sent_id, start_index, end_index, ent_type, ent_text, ner_approach) VALUES (%s, %s, %s, %s, %s, %s)"
news_words_res = []
news_ners_res = []
for sent_ids, sents in sent_generator(raw_df['news_sent_id'].tolist(), raw_df['sent'].tolist(), 4):
    word_sentence_list  = ws_driver(sents, use_delim=False)
    entity_sentence_list = ner_driver(sents, use_delim=False)
    pos_sentence_list = pos_driver(word_sentence_list, use_delim=False)
    for sent_id, word_res, pos_res in zip(sent_ids, word_sentence_list, pos_sentence_list):
        for index, (word, word_pos) in enumerate(zip(word_res, pos_res)):
            news_words_res.append((sent_id, index, word, word_pos, None, 'ckip-transformer'))
    for sent_id, entities in zip(sent_ids, entity_sentence_list):
        for ent_text, ent_type, ent_index in sorted(entities, key = lambda x:x[2][0]):
            news_ners_res.append((sent_id, ent_index[0], ent_index[1], ent_type, ent_text, 'ckip-transformer'))

Tokenization: 100%|██████████| 4/4 [00:00<00:00, 394.52it/s]
Inference: 100%|██████████| 1/1 [00:02<00:00,  2.03s/it]
Tokenization: 100%|██████████| 4/4 [00:00<00:00, 2054.52it/s]
Inference: 100%|██████████| 1/1 [00:01<00:00,  1.78s/it]
Tokenization: 100%|██████████| 4/4 [00:00<00:00, 2152.03it/s]
Inference: 100%|██████████| 1/1 [00:01<00:00,  1.88s/it]
Tokenization: 100%|██████████| 4/4 [00:00<00:00, 4107.03it/s]
Inference: 100%|██████████| 1/1 [00:01<00:00,  1.83s/it]
Tokenization: 100%|██████████| 4/4 [00:00<00:00, 4641.00it/s]
Inference: 100%|██████████| 1/1 [00:02<00:00,  2.46s/it]
Tokenization: 100%|██████████| 4/4 [00:00<00:00, 1766.02it/s]
Inference: 100%|██████████| 1/1 [00:01<00:00,  1.84s/it]
Tokenization: 100%|██████████| 4/4 [00:00<00:00, 3294.17it/s]
Inference: 100%|██████████| 1/1 [00:02<00:00,  2.45s/it]
Tokenization: 100%|██████████| 4/4 [00:00<00:00, 1358.37it/s]
Inference: 100%|██████████| 1/1 [00:02<00:00,  2.51s/it]
Tokenization: 100%|██████████| 4/4 [00:00<00:00, 

In [119]:
news_words_res

[(262697, 0, '拜登', 'Nc', None, 'ckip-transformer'),
 (262697, 1, '政府', 'Na', None, 'ckip-transformer'),
 (262697, 2, '官員', 'Na', None, 'ckip-transformer'),
 (262697, 3, '承認', 'VE', None, 'ckip-transformer'),
 (262697, 4, '，', 'COMMACATEGORY', None, 'ckip-transformer'),
 (262697, 5, '眼前', 'Nc', None, 'ckip-transformer'),
 (262697, 6, '有', 'V_2', None, 'ckip-transformer'),
 (262697, 7, '許多', 'Neqa', None, 'ckip-transformer'),
 (262697, 8, '硬仗', 'Na', None, 'ckip-transformer'),
 (262697, 9, '要', 'D', None, 'ckip-transformer'),
 (262697, 10, '打', 'VC', None, 'ckip-transformer'),
 (262697, 11, '。', 'PERIODCATEGORY', None, 'ckip-transformer'),
 (262697, 12, '應變', 'VA', None, 'ckip-transformer'),
 (262697, 13, '之', 'DE', None, 'ckip-transformer'),
 (262697, 14, '道', 'Na', None, 'ckip-transformer'),
 (262697, 15, '之', 'DE', None, 'ckip-transformer'),
 (262697, 16, '一', 'Neu', None, 'ckip-transformer'),
 (262697, 17, '是', 'SHI', None, 'ckip-transformer'),
 (262697, 18, '透過', 'P', None, 'ckip-tr

In [None]:
# Initialize drivers
ws_driver  = CkipWordSegmenter(level=3)
pos_driver = CkipPosTagger(level=3)
ner_driver = CkipNerChunker(level=3)

In [1]:
text = ["""中國大陸23日共新增80例2019冠狀病毒疾病（COVID-19）確診，其中65例為本土病例。首都北京和經濟大城上海仍不斷有疫情，各新增2例、3例本土確診。"""]

In [None]:
ner

In [4]:
import logging
import os, sys
import time
import re
import pickle
parent_dir = os.path.dirname(os.getcwd())
sys.path.append(parent_dir)

from db_func import query_from_db

In [5]:
raw_df = query_from_db("""SELECT nns.news_sent_id, nns.sent FROM news_db.news_sents nns 
WHERE NOT EXISTS (SELECT 1 FROM news_db.sent_processes sp WHERE sp.process_name = 'sent-analysis' and sp.news_sent_id = nns.news_sent_id) LIMIT 100""")

In [6]:
import logging
logging.basicConfig(format='%(asctime)s: %(levelname)s: %(message)s')
logging.root.setLevel(level=logging.INFO)


In [5]:
import os

os.environ['KMP_DUPLICATE_LIB_OK']= 'True'

from ckip_transformers.nlp import CkipWordSegmenter, CkipPosTagger, CkipNerChunker
# Initialize drivers
ws_driver  = CkipWordSegmenter(level=3)
pos_driver = CkipPosTagger(level=3)
ner_driver = CkipNerChunker(level=3)

In [7]:
for index, (sent_id, sent) in raw_df.iterrows():
    # Enable sentence segmentation
    ws  = ws_driver([sent], use_delim=False)
    ner = ner_driver([sent], use_delim=False)

    # Disable sentence segmentation
    pos = pos_driver(ws, use_delim=False)
    print('Sent: ', sent)
    print(ws, pos, ner)

Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1510.37it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.03it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1366.22it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.28it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 832.04it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.29it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2045.00it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  文化部長李永得日前要求審查陸書，讓出版業相當不滿，而事後李永得也找來業者開會尋求配套，不過有業者不滿李永得疑似玩兩面手法，因為開會當下李永得是允諾形式審查，不過事後接受專訪卻又說「反對審查的業者，根本是在台灣，幫中國強權維護他們的威權」，對於質疑，李永得回應是外界抹黑！
[['文化部長', '李永得', '日前', '要求', '審查', '陸書', '，', '讓', '出版業', '相當', '不滿', '，', '而', '事', '後', '李永得', '也', '找來', '業者', '開會', '尋求', '配套', '，', '不過', '有', '業者', '不滿', '李永得', '疑似', '玩', '兩', '面', '手法', '，', '因為', '開會', '當下', '李永得', '是', '允諾', '形式', '審查', '，', '不過', '事', '後', '接受', '專訪', '卻', '又', '說', '「', '反對', '審查', '的', '業者', '，', '根本', '是', '在', '台灣', '，', '幫', '中國', '強權', '維護', '他們', '的', '威權', '」', '，', '對於', '質疑', '，', '李永得', '回應', '是', '外界', '抹黑', '！']] [['Na', 'Nb', 'Nd', 'VF', 'VC', 'Na', 'COMMACATEGORY', 'VL', 'Na', 'Dfa', 'VK', 'COMMACATEGORY', 'Cbb', 'Na', 'Ng', 'Nb', 'D', 'VC', 'Na', 'VA', 'VC', 'VA', 'COMMACATEGORY', 'Cbb', 'V_2', 'Na', 'VK', 'Nb', 'VG', 'VC', 'Neu', 'Na', 'Na', 'COMMACATEGORY', 'Cbb', 'VA', 'D', 'Nb', 'SHI', 'VE', 'Na', 'VC', 'COMMACATEGORY', 'Cbb', 'Na', 'Ng', 'VC', 'VC', 'D', 'D', 'VE', 'PARENTHESISCATEGORY', 'VE', 'VC

Inference: 100%|██████████| 1/1 [00:00<00:00,  3.24it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1927.53it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.11it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 318.45it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.52it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2906.66it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  台灣文學基地開幕，部長李永得碰上文資團體來陳情，只是部長允諾好好處理的同時，出版業的聲音，是否也能比照辦理，因為李永得要求審查陸書，讓出版業覺得言論自由，被限制！
[['台灣', '文學', '基地', '開幕', '，', '部長', '李永得', '碰上', '文資', '團體', '來', '陳情', '，', '只是', '部長', '允諾', '好好', '處理', '的', '同時', '，', '出版業', '的', '聲音', '，', '是否', '也', '能', '比照', '辦理', '，', '因為', '李永得', '要求', '審查', '陸書', '，', '讓', '出版業', '覺得', '言論', '自由', '，', '被', '限制', '！']] [['Nc', 'Na', 'Nc', 'VH', 'COMMACATEGORY', 'Na', 'Nb', 'VC', 'Na', 'Na', 'D', 'VF', 'COMMACATEGORY', 'Cbb', 'Na', 'VE', 'D', 'VC', 'DE', 'Nd', 'COMMACATEGORY', 'Na', 'DE', 'Na', 'COMMACATEGORY', 'D', 'D', 'D', 'P', 'VC', 'COMMACATEGORY', 'Cbb', 'Nb', 'VF', 'VC', 'Na', 'COMMACATEGORY', 'VL', 'Na', 'VK', 'Na', 'VH', 'COMMACATEGORY', 'P', 'VE', 'EXCLAMATIONCATEGORY']] [[NerToken(word='台灣文學基地', ner='FAC', idx=(0, 6)), NerToken(word='李永得', ner='PERSON', idx=(11, 14)), NerToken(word='李永得', ner='PERSON', idx=(56, 59))]]


Inference: 100%|██████████| 1/1 [00:00<00:00,  4.12it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1709.87it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.16it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 124.86it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.46it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 788.70it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  文化部長李永得：「(審陸書)本身的法源啊，就在兩岸關係人民條例的，第37條但一直都沒有執行嘛，過去30年(都沒執行)。」
[['文化部長', '李永得', '：', '「', '(', '審陸書', ')', '本身', '的', '法源', '啊', '，', '就', '在', '兩岸', '關係', '人民', '條例', '的', '，', '第37', '條', '但', '一直', '都', '沒有', '執行', '嘛', '，', '過去', '30', '年', '(', '都', '沒', '執行', ')', '。', '」']] [['Na', 'Nb', 'COLONCATEGORY', 'PARENTHESISCATEGORY', 'PARENTHESISCATEGORY', 'VC', 'PARENTHESISCATEGORY', 'Nh', 'DE', 'Na', 'T', 'COMMACATEGORY', 'D', 'P', 'Nc', 'Na', 'Na', 'Na', 'T', 'COMMACATEGORY', 'Neu', 'Nf', 'Cbb', 'D', 'D', 'D', 'VC', 'T', 'COMMACATEGORY', 'Nd', 'Neu', 'Nf', 'PARENTHESISCATEGORY', 'D', 'D', 'VC', 'PARENTHESISCATEGORY', 'PERIODCATEGORY', 'PARENTHESISCATEGORY']] [[NerToken(word='文化部長', ner='ORG', idx=(0, 4)), NerToken(word='李永得', ner='PERSON', idx=(4, 7)), NerToken(word='兩岸關係人民條例', ner='LAW', idx=(23, 31)), NerToken(word='第37', ner='ORDINAL', idx=(33, 36)), NerToken(word='過去30年', ner='DATE', idx=(47, 52))]]


Inference: 100%|██████████| 1/1 [00:00<00:00,  1.47it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1237.99it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  1.54it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 197.31it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  1.66it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2105.57it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  李永得指的，正是這一條，根據民國82年制定兩岸人民關係條例，明確規定大陸地區出版品等，經「主管機關許可，得進入臺灣地區，發行、銷售，但這些年因涉及言論自由，幾乎無人執行，也難怪李永得想力行，出版業大反彈，更質疑原本只說要形式審查的李永得，接受專訪時卻提到，反對審查的業者，根本是在台灣，幫中國強權維護他們的威權，且為何禁止中國出版品會違憲？若大法官會議解釋違憲，那「我下台」，根本是在玩兩面手法！
[['李永得', '指', '的', '，', '正', '是', '這', '一', '條', '，', '根據', '民國', '82年', '制定', '兩岸', '人民', '關係', '條例', '，', '明確', '規定', '大陸', '地區', '出版品', '等', '，', '經', '「', '主管', '機關', '許可', '，', '得', '進入', '臺灣', '地區', '，', '發行', '、', '銷售', '，', '但', '這些', '年', '因', '涉及', '言論', '自由', '，', '幾乎', '無', '人', '執行', '，', '也', '難怪', '李永得', '想', '力行', '，', '出版業', '大', '反彈', '，', '更', '質疑', '原本', '只', '說', '要', '形式', '審查', '的', '李永得', '，', '接受', '專訪', '時', '卻', '提到', '，', '反對', '審查', '的', '業者', '，', '根本', '是', '在', '台灣', '，', '幫', '中國', '強權', '維護', '他們', '的', '威權', '，', '且', '為何', '禁止', '中國', '出版品', '會', '違憲', '？', '若', '大法官', '會議', '解釋', '違憲', '，', '那', '「', '我', '下台', '」', '，', '根本', '是', '在', '玩', '兩', '面', '手法', '！']] [['Nb', 'VG', 'DE', 'COMMACATEGORY', 'D', 'SHI', 'Nep', 'Neu', 'Nf', 'COMMACATEGORY',

Inference: 100%|██████████| 1/1 [00:00<00:00,  3.80it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 711.74it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  4.20it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2082.57it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.09it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 5468.45it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  時報周刊董事長趙振岷：「大家放了吧，如果我擱置爭議，維持現狀，如果說大家就維持過去，22年的做法，大家22年來都這樣嘛，相安無事。」
[['時報周刊', '董事長', '趙振岷', '：', '「', '大家', '放', '了', '吧', '，', '如果', '我', '擱置', '爭議', '，', '維持', '現狀', '，', '如果說', '大家', '就', '維持', '過去', '，', '22', '年', '的', '做法', '，', '大家', '22', '年', '來', '都', '這樣', '嘛', '，', '相安無事', '。', '」']] [['Nb', 'Na', 'Nb', 'COLONCATEGORY', 'PARENTHESISCATEGORY', 'Nh', 'VC', 'Di', 'T', 'COMMACATEGORY', 'Cbb', 'Nh', 'VC', 'Na', 'COMMACATEGORY', 'VJ', 'Na', 'COMMACATEGORY', 'Cbb', 'Nh', 'D', 'VJ', 'Nd', 'COMMACATEGORY', 'Neu', 'Nf', 'DE', 'Na', 'COMMACATEGORY', 'Nh', 'Neu', 'Nf', 'Ng', 'D', 'VH', 'T', 'COMMACATEGORY', 'VH', 'PERIODCATEGORY', 'PARENTHESISCATEGORY']] [[NerToken(word='時報周刊', ner='WORK_OF_ART', idx=(0, 4)), NerToken(word='趙振岷', ner='PERSON', idx=(7, 10)), NerToken(word='22年', ner='DATE', idx=(42, 45)), NerToken(word='22年', ner='DATE', idx=(51, 54))]]


Inference: 100%|██████████| 1/1 [00:00<00:00,  4.38it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1471.17it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  4.38it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2087.76it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  4.30it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 4655.17it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  文化部長李永得：「(說兩面手法)就是抹黑嘛，我其實鼓勵台灣成為世界華文出版中心，因為台灣是全世界最自由的出版處。」
[['文化部長', '李永得', '：', '「', '(', '說', '兩', '面', '手法', ')', '就是', '抹黑', '嘛', '，', '我', '其實', '鼓勵', '台灣', '成為', '世界', '華文', '出版', '中心', '，', '因為', '台灣', '是', '全', '世界', '最', '自由', '的', '出版處', '。', '」']] [['Na', 'Nb', 'COLONCATEGORY', 'PARENTHESISCATEGORY', 'PARENTHESISCATEGORY', 'VE', 'Neu', 'Na', 'Na', 'PARENTHESISCATEGORY', 'D', 'VC', 'T', 'COMMACATEGORY', 'Nh', 'D', 'VF', 'Nc', 'VG', 'Nc', 'Na', 'VC', 'Nc', 'COMMACATEGORY', 'Cbb', 'Nc', 'SHI', 'Neqa', 'Nc', 'Dfa', 'VH', 'DE', 'Nc', 'PERIODCATEGORY', 'PARENTHESISCATEGORY']] [[NerToken(word='文化部長', ner='ORG', idx=(0, 4)), NerToken(word='李永得', ner='PERSON', idx=(4, 7)), NerToken(word='兩', ner='CARDINAL', idx=(11, 12)), NerToken(word='台灣', ner='GPE', idx=(27, 29)), NerToken(word='華文', ner='LANGUAGE', idx=(33, 35)), NerToken(word='台灣', ner='GPE', idx=(42, 44))]]


Inference: 100%|██████████| 1/1 [00:00<00:00,  2.98it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 550.36it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.91it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1524.65it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.73it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1757.88it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  不認自己給出版業扣上紅帽子，但李永得也坦言，現行規定確實該修，畢竟文化部也沒這麼多人力，實質審查，倒是出版業認為，李永得重申法令，有警惕作用！
[['不', '認', '自己', '給', '出版業', '扣上', '紅帽子', '，', '但', '李永得', '也', '坦言', '，', '現行', '規定', '確實', '該', '修', '，', '畢竟', '文化部', '也', '沒', '這麼多', '人力', '，', '實質', '審查', '，', '倒是', '出版業', '認為', '，', '李永得', '重申', '法令', '，', '有', '警惕', '作用', '！']] [['D', 'VC', 'Nh', 'P', 'Na', 'VC', 'Na', 'COMMACATEGORY', 'Cbb', 'Nb', 'D', 'VE', 'COMMACATEGORY', 'A', 'Na', 'D', 'D', 'VC', 'COMMACATEGORY', 'D', 'Nc', 'D', 'VJ', 'Neqa', 'Na', 'COMMACATEGORY', 'D', 'VC', 'COMMACATEGORY', 'D', 'Na', 'VE', 'COMMACATEGORY', 'Nb', 'VE', 'Na', 'COMMACATEGORY', 'V_2', 'Na', 'Na', 'EXCLAMATIONCATEGORY']] [[NerToken(word='李永得', ner='PERSON', idx=(15, 18)), NerToken(word='文化部', ner='ORG', idx=(33, 36)), NerToken(word='李永得', ner='PERSON', idx=(57, 60))]]


Inference: 100%|██████████| 1/1 [00:00<00:00,  3.54it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1078.50it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  4.58it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1821.23it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  4.41it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 8630.26it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  8.25it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2695.57it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  時報出版董事長趙振岷：「就是我們的出版業者，我們的讀者，我們都知道什麼該出，什麼不能出，什麼能買，什麼不能買。」
[['時報', '出版', '董事長', '趙振岷', '：', '「', '就是', '我們', '的', '出版', '業者', '，', '我們', '的', '讀者', '，', '我們', '都', '知道', '什麼', '該', '出', '，', '什麼', '不能', '出', '，', '什麼', '能', '買', '，', '什麼', '不能', '買', '。', '」']] [['Nb', 'Nv', 'Na', 'Nb', 'COLONCATEGORY', 'PARENTHESISCATEGORY', 'D', 'Nh', 'DE', 'Nv', 'Na', 'COMMACATEGORY', 'Nh', 'DE', 'Na', 'COMMACATEGORY', 'Nh', 'D', 'VK', 'Nep', 'D', 'VC', 'COMMACATEGORY', 'Nep', 'D', 'VC', 'COMMACATEGORY', 'Nep', 'D', 'VC', 'COMMACATEGORY', 'Nep', 'D', 'VC', 'PERIODCATEGORY', 'PARENTHESISCATEGORY']] [[NerToken(word='時報出版', ner='ORG', idx=(0, 4)), NerToken(word='趙振岷', ner='PERSON', idx=(7, 10))]]


Inference: 100%|██████████| 1/1 [00:00<00:00,  8.28it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2811.20it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  9.08it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1101.16it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  言論自由跟法規的拉扯下，其平衡點難解！
[['言論', '自由', '跟', '法規', '的', '拉扯', '下', '，', '其', '平衡點', '難解', '！']] [['Na', 'Na', 'Caa', 'Na', 'DE', 'Nv', 'Ng', 'COMMACATEGORY', 'Nep', 'Na', 'VH', 'EXCLAMATIONCATEGORY']] [[]]


Inference: 100%|██████████| 1/1 [00:00<00:00,  2.97it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1113.73it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.98it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2247.75it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.96it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1446.31it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  針對近日台灣青年民主協會在進行「學生禦寒衣物調查」時發現，有公立學校教官喝令學生「若要依照教育部的規定，請去教育部上課！」的爭議言論，目前是大學生、之前是行政院兒童及少年福利與權益推動小組委員謝有朋感到很痛心！
[['針對', '近日', '台灣', '青年', '民主', '協會', '在', '進行', '「', '學生', '禦寒', '衣物', '調查', '」', '時', '發現', '，', '有', '公立', '學校', '教官', '喝令', '學生', '「', '若要', '依照', '教育部', '的', '規定', '，', '請', '去', '教育部', '上課', '！', '」', '的', '爭議', '言論', '，', '目前', '是', '大學生', '、', '之前', '是', '行政院', '兒童', '及', '少年', '福利', '與', '權益', '推動', '小組', '委員', '謝有朋', '感到', '很', '痛心', '！']] [['P', 'Nd', 'Nc', 'Na', 'Na', 'Nc', 'P', 'VC', 'PARENTHESISCATEGORY', 'Na', 'VH', 'Na', 'Na', 'PARENTHESISCATEGORY', 'Ng', 'VE', 'COMMACATEGORY', 'V_2', 'A', 'Nc', 'Na', 'VE', 'Na', 'PARENTHESISCATEGORY', 'Cbb', 'P', 'Nc', 'DE', 'Na', 'COMMACATEGORY', 'VF', 'VCL', 'Nc', 'VA', 'EXCLAMATIONCATEGORY', 'PARENTHESISCATEGORY', 'DE', 'Na', 'Na', 'COMMACATEGORY', 'Nd', 'SHI', 'Na', 'PAUSECATEGORY', 'Nd', 'SHI', 'Nc', 'Na', 'Caa', 'Na', 'Na', 'Caa', 'Na', 'VC', 'Na', 'Na', 'Nb', 'VK', 'Dfa', 'VK', 'EXCLAMATIONCATEGORY']] [[NerToken(word=

Inference: 100%|██████████| 1/1 [00:00<00:00,  1.65it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2985.27it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  1.64it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 260.69it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  1.87it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1565.04it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  謝有朋說，事發至今，雖然有不少學校已經順應教育部去年的新規，不再對學生的服裝儀容違規約束。不過他還是很感慨：「透過此次的事件，顯示學生為了在校穿著禦寒衣物免受限制是如此得來不易，事件至今已有很多學校逐漸開放學生可以穿著禦寒衣物上學，對此我不知道該感到開心還是難過，痛心的地方在於原來只是想在求學過程當中穿的保暖而已是那麼的困難，那麼的奢侈。」
[['謝有朋', '說', '，', '事發', '至今', '，', '雖然', '有', '不少', '學校', '已經', '順應', '教育部', '去年', '的', '新', '規', '，', '不再', '對', '學生', '的', '服裝', '儀容', '違規', '約束', '。', '不過', '他', '還是', '很', '感慨', '：', '「', '透過', '此', '次', '的', '事件', '，', '顯示', '學生', '為了', '在', '校', '穿著', '禦寒', '衣物', '免', '受', '限制', '是', '如此', '得來', '不易', '，', '事件', '至今', '已', '有', '很多', '學校', '逐漸', '開放', '學生', '可以', '穿著', '禦寒', '衣物', '上學', '，', '對', '此', '我', '不', '知道', '該', '感到', '開心', '還是', '難過', '，', '痛心', '的', '地方', '在於', '原來', '只是', '想', '在', '求學', '過程', '當中', '穿', '的', '保暖', '而已', '是', '那麼', '的', '困難', '，', '那麼', '的', '奢侈', '。', '」']] [['Nb', 'VE', 'COMMACATEGORY', 'VH', 'D', 'COMMACATEGORY', 'Cbb', 'V_2', 'Neqa', 'Nc', 'D', 'VJ', 'Nc', 'Nd', 'DE', 'Na', 'Na', 'COMMACATEGORY', 'D', 'P', 'Na', 'DE', 'Na', 'Na', 'VA', 'VC', 'PERIODCATEGORY', 'Cbb', 'Nh

Inference: 100%|██████████| 1/1 [00:00<00:00,  1.37it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 755.32it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  1.48it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1062.66it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  1.57it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1608.25it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  謝有朋指出，自己去年12月22日前往行政院參加兒童及少年福利與權益推動小組第四屆第1次會議討論學生服裝儀容管理列管事項時，自己就曾要求教育部，應該對於落實新頒服儀規定原則確實督導，將受申訴學校納入加強查核對象，並研議具體有效罰則，例如處罰涉案人員、減班減招等，才能對不法學校具一定程度之約束力。謝有朋說，教育部應該督導違法之學校就不法之規章進行形式上及實質上的改正，要求該校將相關資料提報教育主管機關並由機關主動審查，絕不可備而不查。
[['謝有朋', '指出', '，', '自己', '去年', '12月', '22日', '前往', '行政院', '參加', '兒童', '及', '少年', '福利', '與', '權益', '推動', '小組', '第四', '屆', '第1', '次', '會議', '討論', '學生', '服裝', '儀容', '管理', '列管', '事項', '時', '，', '自己', '就', '曾', '要求', '教育部', '，', '應該', '對於', '落實', '新', '頒', '服儀', '規定', '原則', '確實', '督導', '，', '將', '受', '申訴', '學校', '納入', '加強', '查核', '對象', '，', '並', '研議', '具體', '有效', '罰則', '，', '例如', '處罰', '涉案', '人員', '、', '減班', '減招', '等', '，', '才', '能', '對', '不法', '學校', '具', '一定', '程度', '之', '約束力', '。', '謝有朋', '說', '，', '教育部', '應該', '督導', '違法', '之', '學校', '就', '不法', '之', '規章', '進行', '形式', '上', '及', '實質', '上', '的', '改正', '，', '要求', '該', '校', '將', '相關', '資料', '提報', '教育', '主管', '機關', '並', '由', '機關', '主動', '審查', '，', '絕不', '可', '備而不查', '。']] [['Nb', 'VE', 'COMMACATEGORY', 'Nh', 'Nd', 'Neu', '

Inference: 100%|██████████| 1/1 [00:00<00:00,  2.42it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1414.13it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.38it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1251.66it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.35it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1558.06it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  至於那些仍然堅持一意孤行的不法學校，兒少委員謝有朋也說：「期待他們（不法學校）回頭是岸，也請社會大眾特別是學生可以勇敢舉發，或許改變並不是一蹴可幾，但我知道如果此刻我們不勇敢，這一切就不會有所改變，在學生權益保障的議題上，我們沒有人是局外人，期待校園人權走向黎明的那日。」
[['至於', '那些', '仍然', '堅持', '一意孤行', '的', '不法', '學校', '，', '兒少', '委員', '謝有朋', '也', '說', '：', '「', '期待', '他們', '（', '不法', '學校', '）', '回頭是岸', '，', '也', '請', '社會', '大眾', '特別', '是', '學生', '可以', '勇敢', '舉發', '，', '或許', '改變', '並', '不', '是', '一蹴可幾', '，', '但', '我', '知道', '如果', '此刻', '我們', '不', '勇敢', '，', '這', '一切', '就', '不會', '有所', '改變', '，', '在', '學生', '權益', '保障', '的', '議題', '上', '，', '我們', '沒有', '人', '是', '局外人', '，', '期待', '校園', '人權', '走向', '黎明', '的', '那', '日', '。', '」']] [['P', 'Neqa', 'D', 'VK', 'VA', 'DE', 'A', 'Nc', 'COMMACATEGORY', 'Na', 'Na', 'Nb', 'D', 'VE', 'COLONCATEGORY', 'PARENTHESISCATEGORY', 'VK', 'Nh', 'PARENTHESISCATEGORY', 'A', 'Nc', 'PARENTHESISCATEGORY', 'VH', 'COMMACATEGORY', 'D', 'VF', 'Na', 'Nh', 'VH', 'SHI', 'Na', 'D', 'VH', 'VC', 'COMMACATEGORY', 'D', 'VC', 'D', 'D', 'SHI', 'VH', 'COMMACATEGORY', 'Cbb', 'Nh', 'VK', 'Cbb', 'Nd', 'Nh

Inference: 100%|██████████| 1/1 [00:00<00:00,  3.81it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 654.44it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.33it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 5178.15it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.84it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 613.11it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  上述對於教育部所提服裝儀容管理列管事項報告建議，已經在今（18日）於行政院官網中公布，當時教育部曾經允諾將持續督導各縣市精進，並於下次會議報告落實情形。
[['上述', '對於', '教育部', '所', '提', '服裝', '儀容', '管理', '列管', '事項', '報告', '建議', '，', '已經', '在', '今', '（', '18日', '）', '於', '行政院', '官網', '中', '公布', '，', '當時', '教育部', '曾經', '允諾', '將', '持續', '督導', '各', '縣市', '精進', '，', '並', '於', '下', '次', '會議', '報告', '落實', '情形', '。']] [['Na', 'P', 'Nc', 'D', 'VE', 'Na', 'Na', 'VC', 'VB', 'Na', 'Na', 'VE', 'COMMACATEGORY', 'D', 'P', 'Nd', 'PARENTHESISCATEGORY', 'Neu', 'PARENTHESISCATEGORY', 'P', 'Nc', 'Na', 'Ng', 'VE', 'COMMACATEGORY', 'Nd', 'Nc', 'D', 'VE', 'D', 'VL', 'VC', 'Nes', 'Nc', 'VH', 'COMMACATEGORY', 'Cbb', 'P', 'Nes', 'Nf', 'Na', 'Na', 'VHC', 'Na', 'PERIODCATEGORY']] [[NerToken(word='教育部', ner='ORG', idx=(4, 7)), NerToken(word='今（18日', ner='DATE', idx=(27, 32)), NerToken(word='行政院', ner='ORG', idx=(34, 37)), NerToken(word='教育部', ner='ORG', idx=(45, 48))]]


Inference: 100%|██████████| 1/1 [00:00<00:00,  2.17it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1246.82it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  1.95it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1073.26it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.25it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 459.35it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  新北市本來想向中央申請前瞻預算興建4座停車場，沒想到卻卡關，因為10億元的經費撥給桃園和台南，就這麼巧剛好都是綠營執政縣市，就有立委質疑難道是政治考量嗎？公路總局則澄清，預算都是經過審議小組討論，而且如果加上前一次，新北市是目前全台拿最多的！
[['新北市', '本來', '想', '向', '中央', '申請', '前瞻', '預算', '興建', '4', '座', '停車場', '，', '沒想到', '卻', '卡關', '，', '因為', '10億', '元', '的', '經費', '撥給', '桃園', '和', '台南', '，', '就', '這麼', '巧', '剛好', '都', '是', '綠營', '執政', '縣市', '，', '就', '有', '立委', '質疑', '難道', '是', '政治', '考量', '嗎', '？', '公路總局', '則', '澄清', '，', '預算', '都', '是', '經過', '審議', '小組', '討論', '，', '而且', '如果', '加上', '前', '一', '次', '，', '新北市', '是', '目前', '全', '台', '拿', '最多', '的', '！']] [['VH', 'D', 'VE', 'P', 'Nc', 'VF', 'VC', 'Na', 'VC', 'Neu', 'Nf', 'Nc', 'COMMACATEGORY', 'D', 'D', 'VA', 'COMMACATEGORY', 'Cbb', 'Neu', 'Nf', 'DE', 'Na', 'VD', 'Nc', 'Caa', 'Nc', 'COMMACATEGORY', 'D', 'Dfa', 'VH', 'Da', 'D', 'SHI', 'Nb', 'VA', 'Nc', 'COMMACATEGORY', 'D', 'V_2', 'Na', 'VE', 'D', 'SHI', 'Na', 'VE', 'T', 'QUESTIONCATEGORY', 'Na', 'D', 'VE', 'COMMACATEGORY', 'Na', 'D', 'SHI', 'VCL', 'VC', 'Na', 'VE', 'COMMACATEGORY', 'Cbb', 'Cbb'

Inference: 100%|██████████| 1/1 [00:00<00:00,  3.24it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 3223.91it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.50it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 475.28it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  4.15it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2242.94it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  新北市長侯友宜，親自勉勵第一線醫護人員，不過自家市政恐怕有讓他更頭疼的，因為向中央申請前瞻2.0預算，想興建4個停車場可能卡關！
[['新北', '市長', '侯友宜', '，', '親自', '勉勵', '第一線', '醫護', '人員', '，', '不過', '自家', '市政', '恐怕', '有', '讓', '他', '更', '頭疼', '的', '，', '因為', '向', '中央', '申請', '前瞻', '2.0', '預算', '，', '想', '興建', '4', '個', '停車場', '可能', '卡關', '！']] [['Na', 'Na', 'Nb', 'COMMACATEGORY', 'D', 'VC', 'Nc', 'A', 'Na', 'COMMACATEGORY', 'Cbb', 'Nc', 'Na', 'D', 'V_2', 'VL', 'Nh', 'Dfa', 'VH', 'T', 'COMMACATEGORY', 'Cbb', 'P', 'Nc', 'VF', 'VC', 'Neu', 'Na', 'COMMACATEGORY', 'VE', 'VC', 'Neu', 'Nf', 'Nc', 'D', 'VA', 'EXCLAMATIONCATEGORY']] [[NerToken(word='新北', ner='GPE', idx=(0, 2)), NerToken(word='侯友宜', ner='PERSON', idx=(4, 7)), NerToken(word='第一', ner='ORDINAL', idx=(12, 14)), NerToken(word='4', ner='CARDINAL', idx=(54, 55))]]


Inference: 100%|██████████| 1/1 [00:00<00:00,  4.88it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2487.72it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  4.88it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2880.70it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  5.85it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2113.00it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  5.44it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1432.48it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  新北市長侯友宜：「政府如果多給我們新北市，給我們加油打氣，給我們一點資源我都非常感恩。」
[['新北', '市長', '侯友宜', '：', '「', '政府', '如果', '多', '給', '我們', '新北市', '，', '給', '我們', '加油', '打氣', '，', '給', '我們', '一點', '資源', '我', '都', '非常', '感恩', '。', '」']] [['Nc', 'Na', 'Nb', 'COLONCATEGORY', 'PARENTHESISCATEGORY', 'Na', 'Cbb', 'D', 'VD', 'Nh', 'Nc', 'COMMACATEGORY', 'VD', 'Nh', 'VB', 'VB', 'COMMACATEGORY', 'VD', 'Nh', 'Neqa', 'Na', 'Nh', 'D', 'Dfa', 'VI', 'PERIODCATEGORY', 'PARENTHESISCATEGORY']] [[NerToken(word='新北', ner='GPE', idx=(0, 2)), NerToken(word='侯友宜', ner='PERSON', idx=(4, 7)), NerToken(word='新北市', ner='GPE', idx=(17, 20))]]


Inference: 100%|██████████| 1/1 [00:00<00:00,  5.51it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2054.02it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  5.27it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1412.22it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  喊話中央，畢竟錢如果討無，就得靠自己自立自強，只是就這麼巧，這回拿到補助款的都是綠營執政縣市。
[['喊話', '中央', '，', '畢竟', '錢', '如果', '討', '無', '，', '就', '得', '靠', '自己', '自立自強', '，', '只是', '就', '這麼', '巧', '，', '這', '回', '拿到', '補助款', '的', '都', '是', '綠營', '執政', '縣市', '。']] [['VA', 'Nc', 'COMMACATEGORY', 'D', 'Na', 'Cbb', 'VD', 'VJ', 'COMMACATEGORY', 'D', 'D', 'P', 'Nh', 'VH', 'COMMACATEGORY', 'Cbb', 'D', 'Dfa', 'VH', 'COMMACATEGORY', 'Nep', 'Nf', 'VC', 'Na', 'DE', 'D', 'SHI', 'Nb', 'VA', 'Nc', 'PERIODCATEGORY']] [[NerToken(word='中央', ner='ORG', idx=(2, 4))]]


Inference: 100%|██████████| 1/1 [00:00<00:00,  3.82it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1369.79it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.82it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1791.67it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  3.80it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1402.31it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  記者李作珩：「像是我現在在的三重玫瑰停車場，原本要改成立體式，可以容納更多的車輛，不過現在因為中央預算關係卡關，而拿到補助的分別是桃園和台南。」
[['記者', '李作珩', '：', '「', '像是', '我', '現在', '在', '的', '三重', '玫瑰', '停車場', '，', '原本', '要', '改成', '立體式', '，', '可以', '容納', '更多', '的', '車輛', '，', '不過', '現在', '因為', '中央', '預算', '關係', '卡關', '，', '而', '拿到', '補助', '的', '分別', '是', '桃園', '和', '台南', '。', '」']] [['Na', 'Nb', 'COLONCATEGORY', 'PARENTHESISCATEGORY', 'P', 'Nh', 'Nd', 'VCL', 'DE', 'Nc', 'Na', 'Nc', 'COMMACATEGORY', 'D', 'D', 'VG', 'A', 'COMMACATEGORY', 'D', 'VJ', 'Neqa', 'DE', 'Na', 'COMMACATEGORY', 'Cbb', 'Nd', 'Cbb', 'Nc', 'Na', 'Na', 'VA', 'COMMACATEGORY', 'Cbb', 'VC', 'VD', 'DE', 'D', 'SHI', 'Nc', 'Caa', 'Nc', 'PERIODCATEGORY', 'PARENTHESISCATEGORY']] [[NerToken(word='李作珩', ner='PERSON', idx=(2, 5)), NerToken(word='三重玫瑰停車場', ner='FAC', idx=(14, 21)), NerToken(word='中央', ner='ORG', idx=(47, 49)), NerToken(word='桃園', ner='GPE', idx=(65, 67)), NerToken(word='台南', ner='GPE', idx=(68, 70))]]


Inference: 100%|██████████| 1/1 [00:00<00:00,  2.52it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1233.26it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.53it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1811.79it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.44it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2090.88it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  前瞻2.0經費約10億元，補助對象分別是桃園中正公園、台南永康、台南北區以及桃園區文化局，這樣算下來10億元用得差不多，新北的永平國小、板橋海山高中、永平立體、三重玫瑰停車場，順列排在第5、6、7、9但明明這幾個地方也有不少人居住，究竟核發標準是甚麼？
[['前瞻', '2.0', '經費', '約', '10億', '元', '，', '補助', '對象', '分別', '是', '桃園', '中正', '公園', '、', '台南', '永康', '、', '台南', '北區', '以及', '桃園區', '文化局', '，', '這樣', '算下來', '10億', '元', '用', '得', '差不多', '，', '新北', '的', '永平', '國小', '、', '板橋', '海山', '高中', '、', '永平', '立體', '、', '三重', '玫瑰', '停車場', '，', '順列', '排', '在', '第5', '、', '6', '、', '7', '、', '9', '但', '明明', '這', '幾', '個', '地方', '也', '有', '不少', '人', '居住', '，', '究竟', '核發', '標準', '是', '甚麼', '？']] [['VC', 'Neu', 'Na', 'Da', 'Neu', 'Nf', 'COMMACATEGORY', 'VD', 'Na', 'D', 'SHI', 'Nc', 'Nb', 'Nc', 'PAUSECATEGORY', 'Nc', 'Nc', 'PAUSECATEGORY', 'Nc', 'Nc', 'Caa', 'Nc', 'Nc', 'COMMACATEGORY', 'VH', 'VG', 'Neu', 'Nf', 'VC', 'DE', 'VH', 'COMMACATEGORY', 'Nc', 'DE', 'Nc', 'Nc', 'PAUSECATEGORY', 'Nc', 'Nc', 'Nc', 'PAUSECATEGORY', 'Nc', 'VH', 'PAUSECATEGORY', 'Nc', 'Na', 'Nc', 'COMMACATEGORY', 'D', 'VG', 'P', 'Neu', 'PAUSECATEGORY', 

Inference: 100%|██████████| 1/1 [00:00<00:00,  2.66it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1242.76it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.42it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 859.14it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.98it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2410.52it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]

Sent:  立委(國)洪孟楷：「新北市是403萬人口，也是人口數最多的一個直轄市，卻被排在5、6、7、8(9)名，這難免會讓大家覺得說，奇怪這個分配上面是不是有所不均。」
[['立委', '(', '國', ')', '洪孟楷', '：', '「', '新北市', '是', '403萬', '人口', '，', '也', '是', '人口數', '最多', '的', '一', '個', '直轄市', '，', '卻', '被', '排', '在', '5', '、', '6', '、', '7', '、', '8', '(', '9)', '名', '，', '這', '難免', '會', '讓', '大家', '覺得', '說', '，', '奇怪', '這', '個', '分配', '上面', '是', '不', '是', '有所', '不均', '。', '」']] [['Na', 'PARENTHESISCATEGORY', 'Nc', 'PARENTHESISCATEGORY', 'Nb', 'COLONCATEGORY', 'PARENTHESISCATEGORY', 'Nc', 'SHI', 'Neu', 'Na', 'COMMACATEGORY', 'D', 'SHI', 'Na', 'VH', 'DE', 'Neu', 'Nf', 'Na', 'COMMACATEGORY', 'D', 'P', 'VC', 'P', 'Neu', 'PAUSECATEGORY', 'Neu', 'PAUSECATEGORY', 'Neu', 'PAUSECATEGORY', 'Neu', 'PARENTHESISCATEGORY', 'Neu', 'Nf', 'COMMACATEGORY', 'Nep', 'D', 'D', 'VL', 'Nh', 'VK', 'VE', 'COMMACATEGORY', 'VK', 'Nep', 'Nf', 'VD', 'Ncd', 'SHI', 'D', 'SHI', 'VJ', 'VH', 'PERIODCATEGORY', 'PARENTHESISCATEGORY']] [[NerToken(word='洪孟楷', ner='PERSON', idx=(5, 8)), NerToken(word='新北市', ner='

Inference: 100%|██████████| 1/1 [00:00<00:00,  2.94it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 2036.07it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.97it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 739.74it/s]
Inference:   0%|          | 0/1 [00:00<?, ?it/s]


KeyboardInterrupt: 

In [6]:
ws  = ws_driver(text, use_delim=False)
ner = ner_driver(text, use_delim=False)

# Disable sentence segmentation
pos = pos_driver(ws, use_delim=False)

Tokenization: 100%|██████████| 1/1 [00:00<00:00, 352.85it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  1.98it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 1062.66it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.83it/s]
Tokenization: 100%|██████████| 1/1 [00:00<00:00, 387.00it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.60it/s]


In [21]:
for word, ner[0])

[NerToken(word='中國大陸', ner='GPE', idx=(0, 4)), NerToken(word='23日', ner='DATE', idx=(4, 7)), NerToken(word='80', ner='CARDINAL', idx=(10, 12)), NerToken(word='2019冠狀病毒疾病', ner='EVENT', idx=(13, 23)), NerToken(word='65', ner='CARDINAL', idx=(38, 40)), NerToken(word='北京', ner='GPE', idx=(49, 51)), NerToken(word='上海', ner='GPE', idx=(56, 58)), NerToken(word='2', ner='CARDINAL', idx=(68, 69)), NerToken(word='3', ner='CARDINAL', idx=(71, 72))]


In [3]:
ws_driver(text, use_delim=False)

Tokenization: 100%|██████████| 1/1 [00:00<00:00, 145.96it/s]
Inference: 100%|██████████| 1/1 [00:00<00:00,  2.71it/s]


[['中國',
  '大陸',
  '23日',
  '共',
  '新增',
  '80',
  '例',
  '2019',
  '冠狀病毒',
  '疾病',
  '（',
  'COVID-19',
  '）',
  '確診',
  '，',
  '其中',
  '65',
  '例',
  '為',
  '本土',
  '病例',
  '。',
  '首都',
  '北京',
  '和',
  '經濟',
  '大城',
  '上海',
  '仍',
  '不斷',
  '有',
  '疫情',
  '，',
  '各',
  '新增',
  '2',
  '例',
  '、',
  '3',
  '例',
  '本土',
  '確診',
  '。']]

In [2]:
import os

os.environ['KMP_DUPLICATE_LIB_OK']='True'
import spacy
nlp = spacy.load("zh_core_web_trf")

In [31]:
for ent in nlp(text[0]).ents:
    print(ent.text, ent.label_)

中國大陸 GPE
23日 DATE
80 CARDINAL
2019冠狀病毒疾病 EVENT
65 CARDINAL
北京 GPE
上海 GPE
2例 CARDINAL
3例 CARDINAL


In [33]:
for token in nlp(text[0]):
    print(token, token.dep_, token.tag_)

中國 nmod:assmod NR
大陸 nsubj NN
23日 nmod:tmod NT
共 advmod AD
新增 ROOT VV
80 nummod CD
例 mark:clf M
2019 compound:nn NT
冠狀 compound:nn NN
病毒 compound:nn NN
疾病 dep NN
（ punct PU
COVID parataxis:prnmod PU
- dobj NR
19 parataxis:prnmod NT
） punct PU
確診 ccomp VV
， punct PU
其中 dep NN
65 dep CD
例為 cop M
本土 compound:nn NN
病例 conj NN
。 punct PU
首都 appos NN
北京 conj NR
和 cc CC
經濟 compound:nn NN
大城 appos NN
上海 nsubj NR
仍 advmod AD
不 advmod AD
斷 advmod AD
有 ROOT VE
疫情 dobj NN
， punct PU
各 advmod AD
新增 conj VV
2例 dep M
、 punct PU
3例 mark:clf M
本土 dep NN
確診 dobj VV
。 punct PU


In [46]:
source_list = """
'ETtoday','財經新聞'
'PCHOME','財經'
'Yahoo奇摩新聞','財經新聞'
'Yahoo奇摩新聞','運動新聞'
'Yahoo奇摩股市','台股動態'
'Yahoo奇摩股市','國際財經'
'Yahoo奇摩股市','基金動態'
'Yahoo奇摩股市','專家專欄'
'Yahoo奇摩股市','小資理財'
'Yahoo奇摩股市','最新股市'
'Yahoo奇摩股市','研究報導'
'中央社即時新聞','財經新聞'
'台視新聞','財經'
'新浪台灣新聞中心','財經'
'新頭殼要聞','財經'
'民報 Taiwan People News','財經新聞'
'經濟日報','2021全球名家瞭望'
'經濟日報','2021投資前瞻'
'經濟日報','2021新春財經特輯'
'經濟日報','ECFA十周年'
'經濟日報','ESG'
'經濟日報','Fintech'
'經濟日報','Focus |防疫國家隊'
'經濟日報','ICT趨勢'
'經濟日報','K型復甦'
'經濟日報','一分鐘看世界'
'經濟日報','上市櫃公司熱門股排行'
'經濟日報','五金新訊'
'經濟日報','企業CEO'
'經濟日報','個人理財'
'經濟日報','健康元氣'
'經濟日報','光電半導體'
'經濟日報','兩岸快遞'
'經濟日報','兩岸焦點'
'經濟日報','公司治理'
'經濟日報','創業之星'
'經濟日報','化工科技'
'經濟日報','十四五突圍'
'經濟日報','台中韓大戰'
'經濟日報','品味生活'
'經濟日報','國內共同基金淨值'
'經濟日報','國際期貨'
'經濟日報','國際焦點'
'經濟日報','國際現場'
'經濟日報','基金天地'
'經濟日報','外匯市場'
'經濟日報','大數字'
'經濟日報','就市論勢'
'經濟日報','工具機'
'經濟日報','市場焦點'
'經濟日報','幸福城市大調查'
'經濟日報','建材新訊'
'經濟日報','建案開箱'
'經濟日報','房市情報'
'經濟日報','房市焦點'
'經濟日報','房市點線面'
'經濟日報','房產投資'
'經濟日報','投行看大陸'
'經濟日報','投資報告'
'經濟日報','指標焦點股'
'經濟日報','政經焦點'
'經濟日報','新冠肺炎防疫'
'經濟日報','新南向專題'
'經濟日報','日經中文網'
'經濟日報','時尚生活'
'經濟日報','智慧製造'
'經濟日報','智能股市'
'經濟日報','期貨商論壇'
'經濟日報','期貨市場'
'經濟日報','樂活旅遊'
'經濟日報','櫃買市場'
'經濟日報','權證特區'
'經濟日報','消費生活'
'經濟日報','熱門亮點'
'經濟日報','熱門話題'
'經濟日報','理財部落客'
'經濟日報','生技醫藥'
'經濟日報','產學研訓'
'經濟日報','產業動態'
'經濟日報','產業熱點'
'經濟日報','產業達人'
'經濟日報','社論'
'經濟日報','科技新視野'
'經濟日報','稅務法規'
'經濟日報','精品時尚'
'經濟日報','經濟周報'
'經濟日報','經營管理'
'經濟日報','綠色產業'
'經濟日報','總經趨勢'
'經濟日報','總編推薦'
'經濟日報','美中貿易戰'
'經濟日報','美國總統大選'
'經濟日報','職場風向'
'經濟日報','自動化產業'
'經濟日報','英語大進化'
'經濟日報','論壇'
'經濟日報','財富管理'
'經濟日報','責任投資／企業永續'
'經濟日報','資訊圖表'
'經濟日報','退休理財'
'經濟日報','運動休旅'
'經濟日報','醫藥生技'
'經濟日報','金融脈動'
'經濟日報','銀行保險'
'經濟日報','陸港行情'
'經濟日報','集中市場'
'經濟日報','願景工程'
'經濟日報','風格人物'
'經濟日報','食品餐飲'
'經濟日報','食尚饗宴'
'自由時報','財經新聞'
'風傳媒','財經'
""".split('\n')

In [65]:
source_category_lst = []
for lst in source_list:
    if lst:
        source_category_lst.append([element.strip("'") for element in lst.split(',')])

In [77]:
res = ''
for source, category in source_category_lst:
    res += "OR (nrf.news_source = '{}' AND nrf.news_category = '{}')".format(source, category)

In [78]:
res

"OR (nrf.news_source = 'ETtoday' AND nrf.news_category = '財經新聞')OR (nrf.news_source = 'PCHOME' AND nrf.news_category = '財經')OR (nrf.news_source = 'Yahoo奇摩新聞' AND nrf.news_category = '財經新聞')OR (nrf.news_source = 'Yahoo奇摩新聞' AND nrf.news_category = '運動新聞')OR (nrf.news_source = 'Yahoo奇摩股市' AND nrf.news_category = '台股動態')OR (nrf.news_source = 'Yahoo奇摩股市' AND nrf.news_category = '國際財經')OR (nrf.news_source = 'Yahoo奇摩股市' AND nrf.news_category = '基金動態')OR (nrf.news_source = 'Yahoo奇摩股市' AND nrf.news_category = '專家專欄')OR (nrf.news_source = 'Yahoo奇摩股市' AND nrf.news_category = '小資理財')OR (nrf.news_source = 'Yahoo奇摩股市' AND nrf.news_category = '最新股市')OR (nrf.news_source = 'Yahoo奇摩股市' AND nrf.news_category = '研究報導')OR (nrf.news_source = '中央社即時新聞' AND nrf.news_category = '財經新聞')OR (nrf.news_source = '台視新聞' AND nrf.news_category = '財經')OR (nrf.news_source = '新浪台灣新聞中心' AND nrf.news_category = '財經')OR (nrf.news_source = '新頭殼要聞' AND nrf.news_category = '財經')OR (nrf.news_source = '民報 Taiwan People News' AND

In [76]:
"""記者施怡妏／綜合報導 台積電（2330）先前衝破600元大關後不斷創新高，令不少投資人心動跟著上車，甚至不惜高價買進，怎料近期卻接連下跌，有男網友當時看到股價狂飆心癢癢，在台積電歷史新高679元時花136萬買了兩張，沒想到之後股價竟然一路下跌，他因此感到很苦惱，「大概什麼時候可以解套呢？」 男網友在Dcard上發文，在台積電歷史新高679元時買進兩張，大概花了136萬元，但股價卻沒有繼續漲，「如果把台積電發的股利也算進去，每三個月能領5000元」，想知道大概要過多久才可以解套，「能把賣掉兩張台積電的錢，加上台積電兩張的股利收入，總金額大於成本136萬元」。 貼文一出後，不少人驚訝表示「怎麼那麼剛好買在最高點」，「你怎麼可能剛好買在歷史最高點，679元買兩張，你是神嗎」、「下次要買麻煩告知一下，謝謝，我想賣在最高點」、「知道股票解套時間的早就賺翻了，還在這邊回你」、「股神吧，買在最高點欸」。 有人建議他直接賣掉停損，「勸你現在下車，現在籌碼太亂了出來觀望比較好」、「上來問就是沒信心抱住啦，建議你認賠換現金好過年，重新省思策略」。也有人建議他可以繼續放著，「買在466元的那時候很多人說會套十年，結果才過幾個月就破600，466一解套就賣掉的現在還在擦眼淚」、「大家都說上看1000，你可以慢慢等」、「不缺錢哦的話就繼續放著」。"""

'記者施怡妏／綜合報導 台積電（2330）先前衝破600元大關後不斷創新高，令不少投資人心動跟著上車，甚至不惜高價買進，怎料近期卻接連下跌，有男網友當時看到股價狂飆心癢癢，在台積電歷史新高679元時花136萬買了兩張，沒想到之後股價竟然一路下跌，他因此感到很苦惱，「大概什麼時候可以解套呢？」 男網友在Dcard上發文，在台積電歷史新高679元時買進兩張，大概花了136萬元，但股價卻沒有繼續漲，「如果把台積電發的股利也算進去，每三個月能領5000元」，想知道大概要過多久才可以解套，「能把賣掉兩張台積電的錢，加上台積電兩張的股利收入，總金額大於成本136萬元」。 貼文一出後，不少人驚訝表示「怎麼那麼剛好買在最高點」，「你怎麼可能剛好買在歷史最高點，679元買兩張，你是神嗎」、「下次要買麻煩告知一下，謝謝，我想賣在最高點」、「知道股票解套時間的早就賺翻了，還在這邊回你」、「股神吧，買在最高點欸」。 有人建議他直接賣掉停損，「勸你現在下車，現在籌碼太亂了出來觀望比較好」、「上來問就是沒信心抱住啦，建議你認賠換現金好過年，重新省思策略」。也有人建議他可以繼續放著，「買在466元的那時候很多人說會套十年，結果才過幾個月就破600，466一解套就賣掉的現在還在擦眼淚」、「大家都說上看1000，你可以慢慢等」、「不缺錢哦的話就繼續放著」。'

In [134]:
import pytz
from datetime import datetime, timedelta
str(datetime.now(tz = pytz.timezone('Asia/Taipei')).date() - timedelta(days = 7))

'2021-02-19'

In [133]:
datetime.now()

datetime.timedelta(days=7)