In [1]:
import os
import sys
import numpy as np
from tqdm import tqdm
import time
import pickle
import easydict

In [2]:
import logging

In [3]:
logger = logging.getLogger(__name__)
logging.basicConfig(format="%(asctime)s [%(levelname)s] %(message)s", 
                    level=logging.INFO,
                    handlers=[
                        logging.FileHandler(os.path.join("./subtext_test_result.log")),
                        logging.StreamHandler()
                    ])

In [8]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
import torch.utils.data as data_utils

In [9]:
if torch.cuda.is_available():
    device = torch.device('cuda:0')
else:
    device = torch.device('cpu')

## Call model (BertSum/SubtextDivider)

### (1) BertSum

In [4]:
# path 추가
sys.path.append('/home/sks/korea_univ/21_1/TA/team_project/youtube_summarizer/src/bertsum')
sys.path.append('/home/sks/korea_univ/21_1/TA/team_project/youtube_summarizer/src/subtext')

In [5]:
from models.data_loader import TextLoader, load_dataset
from src.backbone import ExtTransformerEncoder, ExtSummarizer, WindowEmbedder

2021-05-07 01:07:47,033 [INFO] PyTorch version 1.1.0 available.


In [6]:
args = easydict.EasyDict({
    "visible_gpus" : -1,
    "temp_dir" : './tmp/',
    "test_from": None,
    "max_pos" : 512,
    "large" : False,
    "finetune_bert": True,
    "encoder": "bert",
    "share_emb": False,
    "dec_layers": 6,
    "dec_dropout": 0.2,
    "dec_hidden_size": 768,
    "dec_heads": 8,
    "dec_ff_size": 2048,
    "enc_hidden_size": 512,
    "enc_ff_size": 512,
    "enc_dropout": 0.2,
    "enc_layers": 6,
    
    "ext_dropout": 0.2,
    "ext_layers": 2,
    "ext_hidden_size": 768,
    "ext_heads": 8,
    "ext_ff_size": 2048,
    
    "accum_count": 1,
    "save_checkpoint_steps": 5,
    
    "generator_shard_size": 32,
    "alpha": 0.6,
    "beam_size": 5,
    "min_length": 15,
    "max_length": 150,
    "max_tgt_len": 140,  
    "block_trigram": True,
    
    "model_path": "./tmp_model/",
    "result_path": "./tmp_result/src",
    "recall_eval": False,
    "report_every": 1,
})

In [10]:
# Settings
device = "cpu" if args.visible_gpus == -1 else "cuda"
loader = TextLoader(args, device)

# model setting
ckpt_path = '/home/sks/korea_univ/21_1/TA/team_project/youtube_summarizer/src/bertsum/checkpoint/model_step_24000.pt'
checkpoint = torch.load(ckpt_path, map_location=lambda storage, loc: storage)
bert_model = ExtSummarizer(args, device, checkpoint)
bert_model.eval()

using cached model
using cached model
using cached model
using cached model


2021-05-07 01:07:58,074 [INFO] loading configuration file ./tmp/kobert_from_pretrained/config.json
2021-05-07 01:07:58,077 [INFO] Model config BertConfig {
  "architectures": [
    "BertModel"
  ],
  "attention_probs_dropout_prob": 0.1,
  "gradient_checkpointing": false,
  "hidden_act": "gelu",
  "hidden_dropout_prob": 0.1,
  "hidden_size": 768,
  "initializer_range": 0.02,
  "intermediate_size": 3072,
  "layer_norm_eps": 1e-12,
  "max_position_embeddings": 512,
  "model_type": "bert",
  "num_attention_heads": 12,
  "num_hidden_layers": 12,
  "pad_token_id": 1,
  "type_vocab_size": 2,
  "vocab_size": 8002
}

2021-05-07 01:07:58,079 [INFO] loading weights file ./tmp/kobert_from_pretrained/pytorch_model.bin


using cached model


2021-05-07 01:07:59,349 [INFO] All model checkpoint weights were used when initializing BertModel.

2021-05-07 01:07:59,350 [INFO] All the weights of BertModel were initialized from the model checkpoint at ./tmp/kobert_from_pretrained.
If your task is similar to the task the model of the ckeckpoint was trained on, you can already use BertModel for predictions without further training.


ExtSummarizer(
  (bert): Bert(
    (model): BertModel(
      (embeddings): BertEmbeddings(
        (word_embeddings): Embedding(8004, 768)
        (position_embeddings): Embedding(512, 768)
        (token_type_embeddings): Embedding(2, 768)
        (LayerNorm): LayerNorm(torch.Size([768]), eps=1e-12, elementwise_affine=True)
        (dropout): Dropout(p=0.1)
      )
      (encoder): BertEncoder(
        (layer): ModuleList(
          (0): BertLayer(
            (attention): BertAttention(
              (self): BertSelfAttention(
                (query): Linear(in_features=768, out_features=768, bias=True)
                (key): Linear(in_features=768, out_features=768, bias=True)
                (value): Linear(in_features=768, out_features=768, bias=True)
                (dropout): Dropout(p=0.1)
              )
              (output): BertSelfOutput(
                (dense): Linear(in_features=768, out_features=768, bias=True)
                (LayerNorm): LayerNorm(torch.Size([768]),

In [11]:
embedder = WindowEmbedder(model=bert_model, text_loader=loader)

### (2) SubtextDivider

In [85]:
from model.subtext_classifier import SubtextClassifier

subtext_model = SubtextClassifier(window_size=3).cuda()

model_path = '/home/sks/korea_univ/21_1/TA/team_project/youtube_summarizer/src/subtext/ckpt/subtext_model_w3_fixed.pt'
subtext_model.load_state_dict(torch.load(model_path))

subtext_model.eval()

SubtextClassifier(
  (block1): Sequential(
    (0): Conv1d(768, 128, kernel_size=(4,), stride=(1,))
    (1): BatchNorm1d(128, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (2): ReLU()
  )
  (block2): Sequential(
    (0): Linear(in_features=384, out_features=16, bias=True)
    (1): BatchNorm1d(16, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (2): ReLU()
    (3): Linear(in_features=16, out_features=1, bias=True)
  )
)

### (3) Score Calculator

In [86]:
def get_divscore(src_doc=[], embedder=None, divider=None):
    embedding = embedder.get_embeddings(src_doc).transpose(1, 0).unsqueeze(0)
    score = divider(embedding).item()
    return score

# Dataset for evaluation

In [14]:
import json
def load_jsonl(input_path) -> list:
    """
    Read list of objects from a JSON lines file.
    """
    data = []
    with open(input_path, 'r', encoding='utf-8') as f:
        for line in f:
            data.append(json.loads(line.rstrip('\n|\r')))
    print('Loaded {} records from {}'.format(len(data), input_path))
    return data

In [15]:
news_df = load_jsonl('/home/sks/korea_univ/21_1/TA/team_project/youtube_summarizer/dataset/article_dataset/train.jsonl')

Loaded 260697 records from /home/sks/korea_univ/21_1/TA/team_project/youtube_summarizer/dataset/article_dataset/train.jsonl


In [16]:
# 전처리
# (1) 글자 개수가 너무 작은 경우 없애기 (30글자 이상)
# (2) 문장이 적은 경우 해당 기사 없애기 (10문장 이상)
news_clean = []
for news in news_df:
    news_article = news['article_original']
    if len(news_article) >= 10:
        article_clean = [sent for sent in news_article if len(sent) >= 30]
        news_clean.append(article_clean)

In [17]:
import random

def make_mixed_doc(news_dataset=None, max_num=1000):
    mixed_doc_set = []
    for i in range(max_num):
        lh_count = min(random.randint(7, 10), len(news_dataset[i]))
        rh_count = min(random.randint(7, 10), len(news_dataset[i+1]))

        lh_news = news_dataset[i][:lh_count]
        rh_news = news_dataset[i+1][:rh_count]
        
        gt = lh_count - 1

        src_doc = '\n'.join((lh_news + rh_news))
        mixed_doc_set.append((src_doc, gt))
        
    return mixed_doc_set

In [18]:
random.seed(2020011135)
mixed_doc_list = make_mixed_doc(news_dataset=news_clean, max_num=1000)

## Evaluation

In [36]:
# Settings
loader = TextLoader(args, device)
window_size = 3

using cached model
using cached model


In [18]:
err_cnt = 0
acc_cnt = 0
ws = 3

div_result = []
for i, a_set in enumerate(mixed_doc_list):
    
    if (i+1) % 20 == 0:
        logger.info(f"working on {i+1}th doc: Accuracy so far is {acc_cnt/(acc_cnt+err_cnt)*100:.2f}%")
        
    src_doc = a_set[0].split('\n')
    gt = a_set[1]
    
    cands = [src_doc[i:i+ws*2] for i, _ in enumerate(src_doc) if i <= len(src_doc) - ws*2]
    
    # 가끔 한문장이 너무길어서 잘리는 경우가 있음..
    try:
        div_scores = [get_divscore(src_doc=cand, embedder=embedder, divider=subtext_model) for cand in cands]
        div_point = div_scores.index(max(div_scores)) + ws - 1

        if div_point == gt:
            acc_cnt += 1
        else:
            err_cnt += 1
            
    except RuntimeError as e:
        print(f"Error occurred at {i}th article")
    
#     sents = [sent for sent in src_doc.split('\n') if sent]
#     lh_sent, rh_sent = [], []
#     for i, sent in enumerate(sents):
#         if i <= div_point:
#             lh_sent.append(sent)
#         else:
#             rh_sent.append(sent)
            
#     result_sents = lh_sent + ["----------------[DIV]---------------"] + rh_sent
#     div_result.append((result_sents, div_scores, div_point, gt))

2021-05-02 19:57:07,751 [INFO] working on 20th doc: Accuracy so far is 73.68%


Error occurred at 30th article
Error occurred at 32th article
Error occurred at 33th article


2021-05-02 19:57:52,749 [INFO] working on 40th doc: Accuracy so far is 77.78%
2021-05-02 19:58:43,279 [INFO] working on 60th doc: Accuracy so far is 80.36%


Error occurred at 66th article
Error occurred at 67th article


2021-05-02 19:59:27,099 [INFO] working on 80th doc: Accuracy so far is 75.68%
2021-05-02 20:00:19,010 [INFO] working on 100th doc: Accuracy so far is 79.79%
2021-05-02 20:01:05,288 [INFO] working on 120th doc: Accuracy so far is 79.82%
2021-05-02 20:01:53,274 [INFO] working on 140th doc: Accuracy so far is 78.36%


Error occurred at 156th article


2021-05-02 20:02:39,330 [INFO] working on 160th doc: Accuracy so far is 79.74%
2021-05-02 20:03:28,138 [INFO] working on 180th doc: Accuracy so far is 79.77%


Error occurred at 191th article


2021-05-02 20:04:10,577 [INFO] working on 200th doc: Accuracy so far is 80.21%


Error occurred at 206th article
Error occurred at 207th article


2021-05-02 20:04:55,522 [INFO] working on 220th doc: Accuracy so far is 80.00%


Error occurred at 221th article
Error occurred at 222th article


2021-05-02 20:05:41,893 [INFO] working on 240th doc: Accuracy so far is 79.39%


Error occurred at 248th article


2021-05-02 20:06:30,241 [INFO] working on 260th doc: Accuracy so far is 79.35%


Error occurred at 265th article
Error occurred at 266th article


2021-05-02 20:07:16,536 [INFO] working on 280th doc: Accuracy so far is 78.87%


Error occurred at 291th article


2021-05-02 20:08:05,110 [INFO] working on 300th doc: Accuracy so far is 76.76%


Error occurred at 300th article
Error occurred at 312th article
Error occurred at 315th article
Error occurred at 316th article


2021-05-02 20:08:52,520 [INFO] working on 320th doc: Accuracy so far is 77.33%
2021-05-02 20:09:38,502 [INFO] working on 340th doc: Accuracy so far is 77.12%


Error occurred at 338th article


2021-05-02 20:10:25,756 [INFO] working on 360th doc: Accuracy so far is 77.29%
2021-05-02 20:11:14,110 [INFO] working on 380th doc: Accuracy so far is 77.16%


Error occurred at 387th article


2021-05-02 20:12:00,515 [INFO] working on 400th doc: Accuracy so far is 77.25%
2021-05-02 20:12:48,850 [INFO] working on 420th doc: Accuracy so far is 77.89%
2021-05-02 20:13:37,001 [INFO] working on 440th doc: Accuracy so far is 78.95%


Error occurred at 446th article
Error occurred at 447th article


2021-05-02 20:14:19,661 [INFO] working on 460th doc: Accuracy so far is 79.82%
2021-05-02 20:15:05,472 [INFO] working on 480th doc: Accuracy so far is 79.39%
2021-05-02 20:15:58,735 [INFO] working on 500th doc: Accuracy so far is 79.41%
2021-05-02 20:16:53,206 [INFO] working on 520th doc: Accuracy so far is 79.84%
2021-05-02 20:17:42,199 [INFO] working on 540th doc: Accuracy so far is 79.65%


Error occurred at 546th article


2021-05-02 20:18:28,825 [INFO] working on 560th doc: Accuracy so far is 79.63%
2021-05-02 20:19:19,594 [INFO] working on 580th doc: Accuracy so far is 79.82%
2021-05-02 20:20:10,408 [INFO] working on 600th doc: Accuracy so far is 80.00%


Error occurred at 599th article
Error occurred at 600th article


2021-05-02 20:20:55,960 [INFO] working on 620th doc: Accuracy so far is 79.93%


Error occurred at 631th article


2021-05-02 20:21:42,848 [INFO] working on 640th doc: Accuracy so far is 80.39%


Error occurred at 641th article
Error occurred at 648th article
Error occurred at 649th article


2021-05-02 20:22:23,885 [INFO] working on 660th doc: Accuracy so far is 80.60%


Error occurred at 663th article
Error occurred at 664th article
Error occurred at 667th article


2021-05-02 20:23:05,795 [INFO] working on 680th doc: Accuracy so far is 80.50%
2021-05-02 20:23:52,135 [INFO] working on 700th doc: Accuracy so far is 80.33%
2021-05-02 20:24:43,570 [INFO] working on 720th doc: Accuracy so far is 80.47%


Error occurred at 726th article


2021-05-02 20:25:32,328 [INFO] working on 740th doc: Accuracy so far is 80.57%
2021-05-02 20:26:20,843 [INFO] working on 760th doc: Accuracy so far is 80.28%
2021-05-02 20:27:06,800 [INFO] working on 780th doc: Accuracy so far is 80.54%
2021-05-02 20:27:59,666 [INFO] working on 800th doc: Accuracy so far is 80.50%


Error occurred at 798th article
Error occurred at 801th article


2021-05-02 20:28:44,063 [INFO] working on 820th doc: Accuracy so far is 80.46%
2021-05-02 20:29:38,363 [INFO] working on 840th doc: Accuracy so far is 80.45%


Error occurred at 854th article
Error occurred at 855th article


2021-05-02 20:30:22,763 [INFO] working on 860th doc: Accuracy so far is 80.27%


Error occurred at 869th article
Error occurred at 870th article


2021-05-02 20:31:04,383 [INFO] working on 880th doc: Accuracy so far is 80.33%
2021-05-02 20:31:47,949 [INFO] working on 900th doc: Accuracy so far is 79.98%
2021-05-02 20:32:33,937 [INFO] working on 920th doc: Accuracy so far is 79.64%
2021-05-02 20:33:25,227 [INFO] working on 940th doc: Accuracy so far is 79.76%
2021-05-02 20:34:13,123 [INFO] working on 960th doc: Accuracy so far is 79.33%


Error occurred at 967th article
Error occurred at 968th article


2021-05-02 20:34:59,979 [INFO] working on 980th doc: Accuracy so far is 79.51%


Error occurred at 983th article
Error occurred at 984th article


2021-05-02 20:35:49,014 [INFO] working on 1000th doc: Accuracy so far is 79.27%


In [7]:
print(f"{acc_cnt / (acc_cnt + err_cnt)*100:.2f}%")

NameError: name 'acc_cnt' is not defined

### (1) 기사

In [93]:
script_list = mixed_doc_list[35][0].split('\n')

In [94]:
script_list

['[충청일보 이정규기자] 폐원을 신청한 청주 은성유치원이 충북도교육감을 상대로 낸 행정소송을 취하하려했지만 도교육청이 이를 거부한 것으로 전해졌다.',
 "6일 충북도교육청에 따르면 은성유치원은 지난 2017년 7월 도교육감을 상대로 '징계의결 요구 처분 취소' 청구소송을 낸 후 지난해 12월 27일 소취하 신청서를 재판부에 제출했다.",
 '그러나 지난해 12월 4일 도교육청이 소취하에 동의하지 않는다는 의견을 내면서 재판이 재개됐다.',
 '도교육청은 2017년 사립유치원 종합감사를 통해 은성유치원 회계 비리를 적발하고, 원장 정직을 유치원측에 요구했다.',
 '은성유치원은 이에 반발해 도교육청에 대해 행정소송을 제기했다.',
 '도교육청이 소 취하를 거부한 이유는 소송을 진행해 사립유치원 감사 업무 기준이 되는 판례를 만들겠다는 것이다.',
 '교육청 관계자는 "판례가 있게 되면 행정 추진 기준으로 삼을 수 있다"며 "법원의 최종 판단을 받기 위해 소취하에 부동의했다"고 전했다.',
 "은성유치원은 오는 28일까지 폐원하겠다며 청주시교육지원청에 '학교 폐쇄 인가신청서'를 제출했다.",
 '이날은 재개된 소송의 다음 재판이 열리는 변론기일이다.',
 '재판 중 폐원이 완료되면 소송을 유지할 이익이 사라지기 때문에 법원이 선고 때 본안 판단없이 각하 결정할 공산이 크다.',
 "배우 인교진과 최대철이 드라마 '동백꽃 필 무렵'에서 특급 카메오로 활약 했다.",
 "인교진과 최대철은 지난 30일 방송된 KBS2 수목극 '동백꽃 필 무렵'(극본 임상춘, 연출 차영훈)에서 강하늘의 두 형으로 등장했다.",
 '아버지 제삿날을 맞아 덕순(고두심 분)의 식당에 찾아온 그림이었다.',
 '그 시간 용식(강하늘 분)은 동백(공효진 분)을 만나려다 정숙(이정은 분)의 "동백이를 만나면 어머니는? 어중간하게 착하려면 그만 둬"라는 말에 뭔가 결심한 듯 돌아왔고, 동백과 만남을 허락해달라고 엄마 덕순의 식당 문을 연 순간 형들과 마주쳤다.',
 '꽃을 든 용식을 본 둘째 형

In [95]:
score_list = []
for i, sent in enumerate(tqdm(script_list)):
    if i + (ws*2) <= len(script_list):
        w_input = script_list[i:i+(ws*2)]
        
        # embedding
        emb = embedder.get_embeddings(w_input).transpose(1, 0).cuda()
        score = subtext_model(emb.unsqueeze(0))
        score_list.append(score.item())

100%|██████████| 18/18 [00:02<00:00,  7.36it/s]


In [96]:
score_list

[-4.86625862121582,
 -5.065357685089111,
 -5.856250762939453,
 -4.983221530914307,
 -4.679341793060303,
 -4.1713433265686035,
 -4.891319751739502,
 8.072851181030273,
 -3.0970635414123535,
 -3.884166955947876,
 -7.703949928283691,
 -5.633543491363525,
 -6.8576555252075195]

In [97]:
for i, sent in enumerate(script_list):
    if (i >= ws) & (i <= len(script_list) - ws):
        j = (i-ws)
        print(f"{score_list[j]:.2f}", '\n', sent)
    else:
        print(sent)

[충청일보 이정규기자] 폐원을 신청한 청주 은성유치원이 충북도교육감을 상대로 낸 행정소송을 취하하려했지만 도교육청이 이를 거부한 것으로 전해졌다.
6일 충북도교육청에 따르면 은성유치원은 지난 2017년 7월 도교육감을 상대로 '징계의결 요구 처분 취소' 청구소송을 낸 후 지난해 12월 27일 소취하 신청서를 재판부에 제출했다.
그러나 지난해 12월 4일 도교육청이 소취하에 동의하지 않는다는 의견을 내면서 재판이 재개됐다.
-4.87 
 도교육청은 2017년 사립유치원 종합감사를 통해 은성유치원 회계 비리를 적발하고, 원장 정직을 유치원측에 요구했다.
-5.07 
 은성유치원은 이에 반발해 도교육청에 대해 행정소송을 제기했다.
-5.86 
 도교육청이 소 취하를 거부한 이유는 소송을 진행해 사립유치원 감사 업무 기준이 되는 판례를 만들겠다는 것이다.
-4.98 
 교육청 관계자는 "판례가 있게 되면 행정 추진 기준으로 삼을 수 있다"며 "법원의 최종 판단을 받기 위해 소취하에 부동의했다"고 전했다.
-4.68 
 은성유치원은 오는 28일까지 폐원하겠다며 청주시교육지원청에 '학교 폐쇄 인가신청서'를 제출했다.
-4.17 
 이날은 재개된 소송의 다음 재판이 열리는 변론기일이다.
-4.89 
 재판 중 폐원이 완료되면 소송을 유지할 이익이 사라지기 때문에 법원이 선고 때 본안 판단없이 각하 결정할 공산이 크다.
8.07 
 배우 인교진과 최대철이 드라마 '동백꽃 필 무렵'에서 특급 카메오로 활약 했다.
-3.10 
 인교진과 최대철은 지난 30일 방송된 KBS2 수목극 '동백꽃 필 무렵'(극본 임상춘, 연출 차영훈)에서 강하늘의 두 형으로 등장했다.
-3.88 
 아버지 제삿날을 맞아 덕순(고두심 분)의 식당에 찾아온 그림이었다.
-7.70 
 그 시간 용식(강하늘 분)은 동백(공효진 분)을 만나려다 정숙(이정은 분)의 "동백이를 만나면 어머니는? 어중간하게 착하려면 그만 둬"라는 말에 뭔가 결심한 듯 돌아왔고, 동백과 만남을 허락해달라고 엄마 덕순의 식당 문을 연

In [60]:
ws=3
tmp_src = mixed_doc_list[100][0].split('\n')
tmp_cands = [tmp_src[i:i+ws*2] for i, _ in enumerate(tmp_src) if i <= len(tmp_src) - ws*2]

In [40]:
idx = [get_divscore(src_doc=cand, embedder=embedder, divider=subtext_model) for cand in tmp_cands]

### (2) 유튜브

In [87]:
from utils.preprocess import doc_preprocess
import json

In [95]:
youtube_script_pth = '/home/sks/korea_univ/21_1/TA/team_project/youtube_summarizer/dataset/youtube_dataset/label/KBS뉴스_7_XpWIWY6pQ_27m_51s.txt'
with open(youtube_script_pth, 'rb') as rr:
    youtube_df = json.load(rr)

In [96]:
script = youtube_df['text']

In [97]:
script_fin = doc_preprocess(script)

In [98]:
script_list = [sent for sent in script_fin.split('\n') if len(sent.strip()) >= 20]#[:50]
#script_list = [sent for sent in script_fin.split('\n')][:50]

In [99]:
ws = 3

In [100]:
subtext_model.eval()

score_list = []
for i, sent in enumerate(tqdm(script_list)):
    if i + (ws*2) <= len(script_list):
        w_input = script_list[i:i+(ws*2)]
        
        # embedding
        emb = embedder.get_embeddings(w_input).transpose(1, 0).cuda()
        score = subtext_model(emb.unsqueeze(0))
        score_list.append(score.item())

100%|██████████| 179/179 [00:44<00:00,  4.03it/s]


In [101]:
for i, sent in enumerate(script_list):
    if (i >= ws) & (i <= len(script_list) - ws):
        j = (i-ws)
        if score_list[j] > 0:
            print(f"========({score_list[j]:.2f})========", '\n', sent)
        else:
            print(f"{score_list[j]:.2f}", '\n', sent)
    else:
        print(sent)

여러분 안녕하십니까 코로나19 통합 뉴스룸 시작합니다
기후변화 위기 대처 방안을 마련하기 위해 세계 각국 정상들이 화상으로 만났습니다
나라별로 온실가스 감축 목표를 추가로 내놓고 공동 대응을 다짐하는 자리였는데요
-9.32 
 탄소를 가장 많이 배출하고 있는 미국과 중국 간에는 주도권을 둘러싼 신경전도 벌어졌습니다
-8.42 
 기후변화 대처를 위한 화상회의에 세계 각국 정상급 인사 40명이 참석했습니다
-6.38 
 회의를 개최한 조 바이든 미국 대통령은 기후변화를 실존적 위기로 규정하고 2030년까지 온실가스 배출량을 2005년을 기준으로 절반 넘게 줄이겠다는 새 목표를 제시했습니다
-7.70 
 이는 기존 계획보다 2배 가까이 강화된 목표로 바이든 대통령은 미국의 선제적 감축에 호응하는 세계 각국의 공동 노력을 호소했습니다
-5.85 
 실제 유럽연합의 경우 감축 목표를 기존보다 15%포인트 가량 상향 조정했고 캐나다와 일본도 강화된 목표치를 내놨습니다
-6.67 
 반면 중국과 인도 러시아 등 온실가스 배출량이 많은 나라들은 추가 감축 목표를 제시하지 않았습니다
-4.62 
 시진핑 중국 국가주석은 대신 개발도상국과 선진국 간 서로 다른 이해관계의 조정 등을 위해선 미국이 아닌 유엔을 비롯한 국제기구가 논의 중심이 돼야 한다고 강조했습니다
 중상 치다의 동 방사능이 몇 곳이에요
 그럼 너무 이쁘지 현재 환인점이라는 놈이 세계 각국은 이번 정상회의 논의 결과를 바탕으로 오는 11월 영국에서 개최될 유엔 기후변화협약 총회에서 보다 구체화된 형태의 공동 목표를 내놓을 것으로 예상됩니다
-3.97 
 문재인 대통령은 어젯밤 기후정상회의에 참석했습니다
-7.55 
 문 대통령은 온실가스 감축 목표 상향과 함께 신규 해외 석탄화력발전소에 대한 공적금융지원을 중단하겠다는 두 가지 핵심 약속을 발표했습니다
-7.11 
 지난해 10월 2050 탄수 중립 목표를 선언했던 문 대통령은 이를 실현하기 위한 계획을 밝혔습니다
-6.73 
 먼저 파리 협정 이행 첫 해이자 2

In [187]:
A = np.array([
    [0, 1, 1, 5, 0, 0.5, 8],
    [-1, -1, 0, 0.4, 1, 2, 3],
    [-1, -1, 0, -2, 1, -5, -5]
])

In [191]:
np.where(np.mean(np.where(A >= 0.5, 1, 0), axis=0) >= 0.5, 1, 0)

array([0, 0, 0, 0, 1, 1, 1])