In [2]:
##드라이브 연결
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [3]:
gpu_info = !nvidia-smi
gpu_info = '\n'.join(gpu_info)
if gpu_info.find('failed') >= 0:
  print('Not connected to a GPU')
else:
  print(gpu_info)

Mon Oct 21 06:36:08 2024       
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.104.05             Driver Version: 535.104.05   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|   0  Tesla T4                       Off | 00000000:00:04.0 Off |                    0 |
| N/A   49C    P8              10W /  70W |      0MiB / 15360MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+
                                                                    

In [4]:
from psutil import virtual_memory
ram_gb = virtual_memory().total / 1e9
print('Your runtime has {:.1f} gigabytes of available RAM\n'.format(ram_gb))

if ram_gb < 20:
  print('Not using a high-RAM runtime')
else:
  print('You are using a high-RAM runtime!')

Your runtime has 54.8 gigabytes of available RAM

You are using a high-RAM runtime!


In [5]:
!wget https://thunlp.oss-cn-qingdao.aliyuncs.com/BERT_CCPoem_v1.zip
!unzip BERT_CCPoem_v1.zip

--2024-10-21 06:36:08--  https://thunlp.oss-cn-qingdao.aliyuncs.com/BERT_CCPoem_v1.zip
Resolving thunlp.oss-cn-qingdao.aliyuncs.com (thunlp.oss-cn-qingdao.aliyuncs.com)... 47.104.38.189
Connecting to thunlp.oss-cn-qingdao.aliyuncs.com (thunlp.oss-cn-qingdao.aliyuncs.com)|47.104.38.189|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 150351681 (143M) [application/zip]
Saving to: ‘BERT_CCPoem_v1.zip’


2024-10-21 06:36:11 (62.4 MB/s) - ‘BERT_CCPoem_v1.zip’ saved [150351681/150351681]

Archive:  BERT_CCPoem_v1.zip
   creating: BERT_CCPoem_v1/
  inflating: __MACOSX/._BERT_CCPoem_v1  
  inflating: BERT_CCPoem_v1/tokenizer_config.json  
  inflating: BERT_CCPoem_v1/special_tokens_map.json  
  inflating: BERT_CCPoem_v1/config.json  
  inflating: BERT_CCPoem_v1/training_args.bin  
  inflating: BERT_CCPoem_v1/vocab.txt  
  inflating: BERT_CCPoem_v1/pytorch_model.bin  


In [6]:
!pip install torch
!pip install transformers



In [7]:
import os
import logging

import torch
import torch.nn as nn
import numpy as np
from transformers import BertModel, BertTokenizer

logging.basicConfig(
    format='%(asctime)s - %(filename)s[line:%(lineno)d] - %(levelname)s: %(message)s', level=logging.INFO)

gpu_list = None


class Bert(nn.Module):
    def __init__(self, BERT_PATH='./BERT_CCPoem_v1'):
        super(Bert, self).__init__()

        self.bert = BertModel.from_pretrained(BERT_PATH)

    def init_multi_gpu(self, device):
        self.bert = nn.DataParallel(self.bert, device_ids=device)

    def forward(self, data, cls=False):
        result = []
        # print(data)
        x = data['input_ids']
        y = self.bert(x, attention_mask=data['attention_mask'],
                         token_type_ids=data['token_type_ids'])[0]

        if(cls):
            result = y[:, 0, :].view(y.size(0), -1)
            result = result.cpu().tolist()
        else:
            result = []
            y = y.cpu()
            # y = torch.mean(y, 1)
            # result = y.cpu().tolist()
            for i in range(y.shape[0]):
                tmp = y[i][1:torch.sum(data['attention_mask'][i]) - 1, :]
                result.append(tmp.mean(0).tolist())

        return result


class BertFormatter():
    def __init__(self, BERT_PATH='./BERT_CCPoem_v1'):
        self.tokenizer = BertTokenizer.from_pretrained(BERT_PATH)

    def process(self, data):
        res_dict = self.tokenizer.batch_encode_plus(
            data, pad_to_max_length=True)

        input_list = {'input_ids': torch.LongTensor(res_dict['input_ids']),
                      'attention_mask': torch.LongTensor(res_dict['attention_mask']),
                      "token_type_ids": torch.LongTensor(res_dict['token_type_ids'])}
        return input_list


def init(BERT_PATH="./BERT_CCPoem_v1"):
    global gpu_list
    gpu_list = []

    device_list = os.environ.get("CUDA_VISIBLE_DEVICES", "").split(",")
    if(device_list[0] == ""):
        device_list = []
    for a in range(0, len(device_list)):
        gpu_list.append(int(a))

    cuda = torch.cuda.is_available()
    logging.info("CUDA available: %s" % str(cuda))
    if not cuda and len(gpu_list) > 0:
        logging.error("CUDA is not available but specific gpu id")
        raise NotImplementedError

    model = Bert(BERT_PATH)
    formatter = BertFormatter(BERT_PATH)
    if len(gpu_list) > 0:
        model = model.cuda()
    if(len(gpu_list) > 1):
        try:
            model.init_multi_gpu(gpu_list)
        except Exception as e:
            logging.warning(
                "No init_multi_gpu implemented in the model, use single gpu instead. {}".format(str(e)))
    return model, formatter


def predict_vec_rep(data, model, formatter):
    data = formatter.process(data)
    model.eval()

    for i in data:
        if(isinstance(data[i], torch.Tensor)):
            if len(gpu_list) > 0:
                data[i] = data[i].cuda()

    result = model(data)

    return result


def cos_sim(vector_a, vector_b, sim=True):

    vector_a = np.mat(vector_a)
    vector_b = np.mat(vector_b)
    # num = float(vector_a * vector_b.T)

    num=float((vector_a * vector_b.T)[0, 0])
    denom = np.linalg.norm(vector_a) * np.linalg.norm(vector_b)
    cos = num / denom
    if(not sim):
        return cos
    sim = 0.5 + 0.5 * cos
    return sim

두보와 황정견 시구 비교를 위한 데이터 불러오기

In [8]:
!gdown 1ixLVPONoMFVdHJBtmKmjxNUGqk1w3keu -O 두보DB.xlsx

Downloading...
From: https://drive.google.com/uc?id=1ixLVPONoMFVdHJBtmKmjxNUGqk1w3keu
To: /content/두보DB.xlsx
  0% 0.00/755k [00:00<?, ?B/s]100% 755k/755k [00:00<00:00, 76.0MB/s]


In [9]:
!gdown 1GAlPNmYEK-CFZxUSsBzjuIpbraaI7XeL -O 황정견DB.xlsx

Downloading...
From: https://drive.google.com/uc?id=1GAlPNmYEK-CFZxUSsBzjuIpbraaI7XeL
To: /content/황정견DB.xlsx
  0% 0.00/786k [00:00<?, ?B/s]100% 786k/786k [00:00<00:00, 161MB/s]


In [10]:
import pandas as pd
import tqdm

DU_data=pd.read_excel("두보DB.xlsx",header=None).iloc[:,:2]
HUANG_data=pd.read_excel("황정견DB.xlsx",header=None).iloc[:,:2]

In [11]:
DU_data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 19478 entries, 0 to 19477
Data columns (total 2 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   0       19478 non-null  object
 1   1       19478 non-null  object
dtypes: object(2)
memory usage: 304.5+ KB


두보와 황정견 데이터 비교

In [12]:
###주의 문구 제거

logging.getLogger("transformers.tokenization_utils_base").setLevel(logging.ERROR)

In [13]:
#왜 같다고 뜨지??
model, formatter = init()
result_0 = predict_vec_rep(["润础闹苍藓"], model, formatter)[0] ##원래 문장
model, formatter = init()
result_1 = predict_vec_rep(['盐车虽绊骥'], model, formatter)[0] #비교대상 1
model, formatter = init()
result_2 = predict_vec_rep(["词华倾后辈"], model, formatter)[0] #비교대상 2

print(cos_sim(result_0, result_1))
print(cos_sim(result_0, result_2))



0.6546517035781813
0.6219595932448706


In [14]:
##구글드라이브에 파일이 잘써지는지 확인

with open('/content/drive/My Drive/버트결과/test1.txt', 'w') as f: f.write('Hello, Google Drive!')

In [15]:
def process_batch(start_idx, end_idx):
    # 두보 시구 갯수 지정
    batch_size = end_idx - start_idx
    batch_df = pd.DataFrame(columns=["황정견", "두보", "코사인 유사도"])

    # 비교는 간체로 하되, 결과표시는 번체로.
    model, formatter = init()  # 루프 외부에서 한 번만 실행

    for i in tqdm.tqdm(range(batch_size)):
        #황정견 번체 시구
        huang_traditional = HUANG_data.iloc[start_idx + i, 0]
        #황정견 간체 시구
        huang_simplified = HUANG_data.iloc[start_idx + i, 1]

        huang_predict = predict_vec_rep([huang_simplified], model, formatter)[0]

        print(f"{huang_traditional}({huang_simplified})와 나머지 시구를 비교중..")

        for j in range(len(DU_data)):

            #두보 번체 시구
            du_traditional = DU_data.iloc[j, 0]
            #두보 간체 시구
            du_simplified = DU_data.iloc[j, 1]

            du_predict = predict_vec_rep([du_simplified], model, formatter)[0]
            res = cos_sim(huang_predict, du_predict)
            if res > 0.8:
                batch_df.loc[len(batch_df)] = [huang_traditional, du_traditional, res]

    #파일 저장...
    file_path = f'/content/drive/My Drive/버트결과/황정견의 {int(start_idx)+1}-{int(end_idx)}번 시구와 두보의 모든 시구 비교.csv'
    batch_df.to_csv(file_path, index=False)
    print("파일 저장 완료!")
    return batch_df

In [16]:
import warnings

# FutureWarning을 무시
warnings.filterwarnings("ignore", category=FutureWarning)


\

In [17]:
print("hello world!")

hello world!


In [None]:
process_batch(18100,18200)

  0%|          | 0/100 [00:00<?, ?it/s]

休泥他家晚菊叢(休泥他家晚菊丛)와 나머지 시구를 비교중..


  1%|          | 1/100 [04:52<8:03:04, 292.77s/it]

顧笑千金延客醉(顾笑千金延客醉)와 나머지 시구를 비교중..


  2%|▏         | 2/100 [09:38<7:51:35, 288.73s/it]

解酲五斗爲君空(解酲五斗为君空)와 나머지 시구를 비교중..


  3%|▎         | 3/100 [14:25<7:45:14, 287.77s/it]

歡娱盡屬少年事(欢娱尽属少年事)와 나머지 시구를 비교중..


  4%|▍         | 4/100 [19:11<7:39:33, 287.22s/it]

白髮欺人作老翁(白发欺人作老翁)와 나머지 시구를 비교중..


  5%|▌         | 5/100 [23:57<7:34:10, 286.85s/it]

雪意涔涔滿面風(雪意涔涔满面风)와 나머지 시구를 비교중..


  6%|▌         | 6/100 [28:45<7:29:53, 287.17s/it]

杜郎馬上若征鴻(杜郎马上若征鸿)와 나머지 시구를 비교중..


  7%|▋         | 7/100 [33:36<7:26:48, 288.27s/it]

樽前談笑我方惜(樽前谈笑我方惜)와 나머지 시구를 비교중..


  8%|▊         | 8/100 [38:29<7:24:23, 289.82s/it]

天外淮山誰與同(天外淮山谁与同)와 나머지 시구를 비교중..


  9%|▉         | 9/100 [43:20<7:20:08, 290.20s/it]

行望酒簾沽白蟻(行望酒帘沽白蚁)와 나머지 시구를 비교중..


 10%|█         | 10/100 [48:10<7:15:06, 290.07s/it]

醉吟詩句入丹楓(醉吟诗句入丹枫)와 나머지 시구를 비교중..


 11%|█         | 11/100 [52:57<7:08:56, 289.18s/it]

一時真賞無人共(一时真赏无人共)와 나머지 시구를 비교중..


 12%|█▏        | 12/100 [57:56<7:08:34, 292.21s/it]

尚憶江南把釣翁(尚忆江南把钓翁)와 나머지 시구를 비교중..


 13%|█▎        | 13/100 [1:02:52<7:05:19, 293.33s/it]

簡書催出似驅雞(简书催出似驱鸡)와 나머지 시구를 비교중..


 14%|█▍        | 14/100 [1:07:48<7:01:40, 294.19s/it]

聞道飢寒滿屋啼(闻道饥寒满屋啼)와 나머지 시구를 비교중..


 15%|█▌        | 15/100 [1:12:38<6:55:09, 293.05s/it]

炙背宵眠榾柮火(炙背宵眠榾柮火)와 나머지 시구를 비교중..


 16%|█▌        | 16/100 [1:17:34<6:51:22, 293.84s/it]

嚼冰晨飯薩波虀(嚼冰晨饭萨波虀)와 나머지 시구를 비교중..


 17%|█▋        | 17/100 [1:22:23<6:44:24, 292.35s/it]

風如利劍穿狐腋(风如利剑穿狐腋)와 나머지 시구를 비교중..


 18%|█▊        | 18/100 [1:27:12<6:38:00, 291.23s/it]

雪似流沙飲馬蹄(雪似流沙饮马蹄)와 나머지 시구를 비교중..


 19%|█▉        | 19/100 [1:32:02<6:32:56, 291.06s/it]

官小責輕聊自慰(官小责轻聊自慰)와 나머지 시구를 비교중..


 20%|██        | 20/100 [1:36:53<6:27:50, 290.88s/it]

猶勝擐甲去征西(犹胜擐甲去征西)와 나머지 시구를 비교중..


 21%|██        | 21/100 [1:41:39<6:21:11, 289.52s/it]

草枯木落晚淒淒(草枯木落晚凄凄)와 나머지 시구를 비교중..


 22%|██▏       | 22/100 [1:46:25<6:15:00, 288.47s/it]

目斷黄塵聽馬嘶(目断黄尘听马嘶)와 나머지 시구를 비교중..


 23%|██▎       | 23/100 [1:51:12<6:09:43, 288.10s/it]

想子重行分首處(想子重行分首处)와 나머지 시구를 비교중..


 24%|██▍       | 24/100 [1:55:59<6:04:19, 287.63s/it]

荒凉巢父井亭西(荒凉巢父井亭西)와 나머지 시구를 비교중..


 25%|██▌       | 25/100 [2:00:44<5:58:44, 286.99s/it]

漸老春心不可言(渐老春心不可言)와 나머지 시구를 비교중..


 26%|██▌       | 26/100 [2:05:31<5:53:51, 286.91s/it]

亦如琴意在無絃(亦如琴意在无弦)와 나머지 시구를 비교중..


 27%|██▋       | 27/100 [2:10:17<5:48:45, 286.65s/it]

新花準擬千場醉(新花准拟千场醉)와 나머지 시구를 비교중..


 28%|██▊       | 28/100 [2:15:03<5:43:36, 286.34s/it]

美酒經營一百船(美酒经营一百船)와 나머지 시구를 비교중..


 29%|██▉       | 29/100 [2:19:49<5:38:42, 286.24s/it]

春心分付酒盃銷(春心分付酒杯销)와 나머지 시구를 비교중..


 30%|███       | 30/100 [2:24:35<5:33:49, 286.14s/it]

勿爲浮雲妄動摇(勿为浮云妄动摇)와 나머지 시구를 비교중..


 31%|███       | 31/100 [2:29:20<5:28:47, 285.91s/it]

試覓金張池館問(试觅金张池馆问)와 나머지 시구를 비교중..


 32%|███▏      | 32/100 [2:34:07<5:24:32, 286.36s/it]

幾人能插侍中貂(几人能插侍中貂)와 나머지 시구를 비교중..


 33%|███▎      | 33/100 [2:39:00<5:21:50, 288.22s/it]

故園春色常年早(故园春色常年早)와 나머지 시구를 비교중..


 34%|███▍      | 34/100 [2:43:50<5:17:46, 288.89s/it]

紅紫知他破幾苞(红紫知他破几苞)와 나머지 시구를 비교중..


 35%|███▌      | 35/100 [2:48:45<5:14:45, 290.55s/it]

壓帽花枝如可折(压帽花枝如可折)와 나머지 시구를 비교중..


 36%|███▌      | 36/100 [2:53:40<5:11:20, 291.88s/it]

折花手版直須抛(折花手版直须抛)와 나머지 시구를 비교중..


 37%|███▋      | 37/100 [2:58:32<5:06:37, 292.02s/it]

久無長者回車轍(久无长者回车辙)와 나머지 시구를 비교중..


 38%|███▊      | 38/100 [3:03:26<5:02:24, 292.65s/it]

仲蔚門墻映野蒿(仲蔚门墙映野蒿)와 나머지 시구를 비교중..


 39%|███▉      | 39/100 [3:08:16<4:56:42, 291.84s/it]

稍覺春衣生蟣蝨(稍觉春衣生虮虱)와 나머지 시구를 비교중..


 40%|████      | 40/100 [3:13:13<4:53:22, 293.38s/it]

南窗晴日照爬搔(南窗晴日照爬搔)와 나머지 시구를 비교중..


 41%|████      | 41/100 [3:18:07<4:48:41, 293.58s/it]

春來問字有誰過(春来问字有谁过)와 나머지 시구를 비교중..


 42%|████▏     | 42/100 [3:23:00<4:43:28, 293.25s/it]

頗覺閑銷日月多(颇觉闲销日月多)와 나머지 시구를 비교중..


 43%|████▎     | 43/100 [3:27:45<4:36:23, 290.95s/it]

醉裏乾坤知酒聖(醉里乾坤知酒圣)와 나머지 시구를 비교중..


 44%|████▍     | 44/100 [3:32:34<4:30:49, 290.16s/it]

貧中風物似詩魔(贫中风物似诗魔)와 나머지 시구를 비교중..


 45%|████▌     | 45/100 [3:37:23<4:25:37, 289.77s/it]

春風也似江南早(春风也似江南早)와 나머지 시구를 비교중..


 46%|████▌     | 46/100 [3:42:15<4:21:32, 290.61s/it]

梅與辛夷鬬著花(梅与辛夷鬬著花)와 나머지 시구를 비교중..


 47%|████▋     | 47/100 [3:47:02<4:15:47, 289.57s/it]

自是無言桃李晚(自是无言桃李晚)와 나머지 시구를 비교중..


 48%|████▊     | 48/100 [3:51:47<4:09:41, 288.11s/it]

莫嗔榆柳更萌芽(莫嗔榆柳更萌芽)와 나머지 시구를 비교중..


 49%|████▉     | 49/100 [3:56:33<4:04:24, 287.54s/it]

穿花蹴踏千秋索(穿花蹴踏千秋索)와 나머지 시구를 비교중..


 50%|█████     | 50/100 [4:01:18<3:59:00, 286.80s/it]

挑菜嬉遊二月晴(挑菜嬉游二月晴)와 나머지 시구를 비교중..


 51%|█████     | 51/100 [4:06:03<3:53:46, 286.26s/it]

已被風光催我老(已被风光催我老)와 나머지 시구를 비교중..


 52%|█████▏    | 52/100 [4:10:48<3:48:34, 285.73s/it]

懶隨兒輩遶春城(懒随儿辈绕春城)와 나머지 시구를 비교중..


 53%|█████▎    | 53/100 [4:15:32<3:43:29, 285.30s/it]

老杜當年鬢髮華(老杜当年鬓发华)와 나머지 시구를 비교중..


 54%|█████▍    | 54/100 [4:20:18<3:38:57, 285.60s/it]

尚言春到酒須賒(尚言春到酒须赊)와 나머지 시구를 비교중..


 55%|█████▌    | 55/100 [4:25:05<3:34:31, 286.03s/it]

不堪詩思相料理(不堪诗思相料理)와 나머지 시구를 비교중..


 56%|█████▌    | 56/100 [4:29:50<3:29:29, 285.67s/it]

惱亂街頭賣酒家(恼乱街头卖酒家)와 나머지 시구를 비교중..


 57%|█████▋    | 57/100 [4:34:34<3:24:20, 285.14s/it]

冉冉光陰花柳場(冉冉光阴花柳场)와 나머지 시구를 비교중..


 58%|█████▊    | 58/100 [4:39:18<3:19:21, 284.81s/it]

紅飄紫落便蔫黄(红飘紫落便蔫黄)와 나머지 시구를 비교중..


 59%|█████▉    | 59/100 [4:44:09<3:15:51, 286.61s/it]

都無畔岸隨風去(都无畔岸随风去)와 나머지 시구를 비교중..


 60%|██████    | 60/100 [4:49:04<3:12:48, 289.21s/it]

却是游絲意思長(却是游丝意思长)와 나머지 시구를 비교중..


 61%|██████    | 61/100 [4:53:59<3:09:08, 291.00s/it]

問道鄰家有酒缾(问道邻家有酒缾)와 나머지 시구를 비교중..


 62%|██████▏   | 62/100 [4:58:52<3:04:37, 291.51s/it]

三更不卧叩柴扃(三更不卧叩柴扃)와 나머지 시구를 비교중..


 63%|██████▎   | 63/100 [5:03:44<2:59:54, 291.74s/it]

我身便是鴟夷榼(我身便是鸱夷榼)와 나머지 시구를 비교중..


 64%|██████▍   | 64/100 [5:08:36<2:55:02, 291.73s/it]

肯學離騷要獨醒(肯学离骚要独醒)와 나머지 시구를 비교중..


 65%|██████▌   | 65/100 [5:13:25<2:49:37, 290.77s/it]

回腸無奈别愁煎(回肠无奈别愁煎)와 나머지 시구를 비교중..


 66%|██████▌   | 66/100 [5:18:09<2:43:36, 288.71s/it]

待得鸞膠續斷絃(待得鸾胶续断弦)와 나머지 시구를 비교중..


 67%|██████▋   | 67/100 [5:22:51<2:37:47, 286.89s/it]

最憶錢塘風物苦(最忆钱塘风物苦)와 나머지 시구를 비교중..


 68%|██████▊   | 68/100 [5:27:36<2:32:37, 286.16s/it]

西湖月落採菱船(西湖月落采菱船)와 나머지 시구를 비교중..


 69%|██████▉   | 69/100 [5:32:18<2:27:11, 284.89s/it]

吴中風物最嬌饒(吴中风物最娇饶)와 나머지 시구를 비교중..


 70%|███████   | 70/100 [5:37:06<2:22:57, 285.92s/it]

百里春風酒斾摇(百里春风酒斾摇)와 나머지 시구를 비교중..


 71%|███████   | 71/100 [5:41:51<2:18:00, 285.54s/it]

往往貴人留騎從(往往贵人留骑从)와 나머지 시구를 비교중..


 72%|███████▏  | 72/100 [5:46:32<2:12:41, 284.36s/it]

少年叢裏貰金貂(少年丛里贳金貂)와 나머지 시구를 비교중..


 73%|███████▎  | 73/100 [5:51:12<2:07:22, 283.05s/it]

行雲行雨迷三峽(行云行雨迷三峡)와 나머지 시구를 비교중..


 74%|███████▍  | 74/100 [5:55:51<2:02:08, 281.86s/it]

歸鳳求凰振九苞(归凤求凰振九苞)와 나머지 시구를 비교중..


 75%|███████▌  | 75/100 [6:00:31<1:57:07, 281.12s/it]

月白花紅傾酒滿(月白花红倾酒满)와 나머지 시구를 비교중..


 76%|███████▌  | 76/100 [6:05:08<1:52:01, 280.08s/it]

不將春色等閑抛(不将春色等闲抛)와 나머지 시구를 비교중..


 77%|███████▋  | 77/100 [6:09:55<1:48:06, 282.03s/it]

紅紫欲疏啼百勞(红紫欲疏啼百劳)와 나머지 시구를 비교중..


 78%|███████▊  | 78/100 [6:14:40<1:43:45, 282.99s/it]

洞宫春色醉蟠桃(洞宫春色醉蟠桃)와 나머지 시구를 비교중..


 79%|███████▉  | 79/100 [6:19:25<1:39:15, 283.62s/it]

虚窗酒病扶頭起(虚窗酒病扶头起)와 나머지 시구를 비교중..


 80%|████████  | 80/100 [6:24:14<1:35:05, 285.28s/it]

强取金釵癢處搔(强取金钗痒处搔)와 나머지 시구를 비교중..


 81%|████████  | 81/100 [6:29:00<1:30:21, 285.33s/it]

抹裙彩鳳盤宫錦(抹裙彩凤盘宫锦)와 나머지 시구를 비교중..


 82%|████████▏ | 82/100 [6:33:47<1:25:45, 285.84s/it]

插鬢真珠絡貝多(插鬓真珠络贝多)와 나머지 시구를 비교중..


 83%|████████▎ | 83/100 [6:38:37<1:21:21, 287.17s/it]

酒惡花愁夢多魘(酒恶花愁梦多魇)와 나머지 시구를 비교중..


 84%|████████▍ | 84/100 [6:43:23<1:16:28, 286.79s/it]

靈砂犀角費頻魔(灵砂犀角费频魔)와 나머지 시구를 비교중..


 85%|████████▌ | 85/100 [6:48:09<1:11:38, 286.55s/it]

玉壺躭躭浸晴霞(玉壶耽耽浸晴霞)와 나머지 시구를 비교중..


 86%|████████▌ | 86/100 [6:52:55<1:06:48, 286.33s/it]

庭有三春接續花(庭有三春接续花)와 나머지 시구를 비교중..


 87%|████████▋ | 87/100 [6:57:47<1:02:26, 288.20s/it]

準擬只無難白髮(准拟只无难白发)와 나머지 시구를 비교중..


 88%|████████▊ | 88/100 [7:02:38<57:49, 289.09s/it]  

金爐誰爲煮黄芽(金炉谁为煮黄芽)와 나머지 시구를 비교중..


 89%|████████▉ | 89/100 [7:07:29<53:04, 289.52s/it]

雨餘花色倍鮮明(雨余花色倍鲜明)와 나머지 시구를 비교중..


 90%|█████████ | 90/100 [7:12:20<48:18, 289.84s/it]

最是春深多晚晴(最是春深多晚晴)와 나머지 시구를 비교중..


 91%|█████████ | 91/100 [7:17:10<43:29, 289.98s/it]

美酒壯人如敵國(美酒壮人如敌国)와 나머지 시구를 비교중..


 92%|█████████▏| 92/100 [7:22:00<38:39, 289.98s/it]

千金一笑買傾城(千金一笑买倾城)와 나머지 시구를 비교중..


 93%|█████████▎| 93/100 [7:26:45<33:38, 288.38s/it]

風光琰琰動春華(风光琰琰动春华)와 나머지 시구를 비교중..


 94%|█████████▍| 94/100 [7:31:28<28:42, 287.04s/it]

回首煙波萬里賒(回首烟波万里赊)와 나머지 시구를 비교중..


 95%|█████████▌| 95/100 [7:36:10<23:47, 285.48s/it]

山似翠屏西子國(山似翠屏西子国)와 나머지 시구를 비교중..


 96%|█████████▌| 96/100 [7:40:54<19:00, 285.00s/it]

溪如罨畫越王家(溪如罨画越王家)와 나머지 시구를 비교중..


 97%|█████████▋| 97/100 [7:45:39<14:15, 285.05s/it]

雙盤錦帶丁香結(双盘锦带丁香结)와 나머지 시구를 비교중..


 98%|█████████▊| 98/100 [7:50:25<09:30, 285.32s/it]

窄袖春衫甘草黄(窄袖春衫甘草黄)와 나머지 시구를 비교중..


 99%|█████████▉| 99/100 [7:55:13<04:45, 285.94s/it]

舊贈恐能開寶匣(旧赠恐能开宝匣)와 나머지 시구를 비교중..


100%|██████████| 100/100 [7:59:58<00:00, 287.99s/it]

파일 저장 완료!





Unnamed: 0,황정견,두보,코사인 유사도
0,休泥他家晚菊叢,時菊碎榛叢,0.817887
1,顧笑千金延客醉,百罰深杯辭不辭,0.801879
2,顧笑千金延客醉,客醉揮金碗,0.828817
3,顧笑千金延客醉,未覺千金滿高價,0.801434
4,顧笑千金延客醉,縱酒欲謀良夜醉,0.808977
...,...,...,...
889,窄袖春衫甘草黄,黄帽青鞋歸去來,0.804095
890,窄袖春衫甘草黄,春草隨青袍,0.854383
891,舊贈恐能開寶匣,脱劍主人贈,0.809110
892,舊贈恐能開寶匣,塵匣元開鏡,0.808669
